Abstract:
研究目的:运用数据挖掘方法,对福建省青少年女子篮球运动员专项体能状态与非接触性损伤情况进行研究。以数据分析的损伤风险评估作为运动损伤预防的基础,根据损伤情况与非损伤情况分布不平衡的特点,构建基于不平衡数据挖掘策略的非接触性损伤预测模型,以达到早期识别并及时干预的目的,为运动员的运动损伤预防提供科学方法。研究方法:1.1数据资料来源与预处理:本研究中所使用的数据资料来源于2014年至2017年第十三届全国运动会备战周期,福建省体育局科研攻关项目中的福建省青少年女子篮球运动员专项体能监控与损伤登记数据库。从数据库中提取青少年女子篮球运动员的身体机能、身体形态、专项体能测试结果和损伤情况等34个变量。其中专项体能测试内容选自国家体育总局青少年体育司编制的《中国青少年篮球训练教学大纲》。使用SPSS statistics 22对缺失值进行多重插补,将变量进行等频离散化处理,以未来30天是否发生非接触性损伤为分类标准。将符合以下标准的损伤纳入数据集构建:(1)损伤机制为除了直接接触以外的其他损伤机制;(2)需要医疗干预;(3)导致至少一天不能参与运动有关的活动。使用卡方检验进行特征选择,将P<0.05的变量纳入模型构建。1.2模型构建:本研究中损伤情况占总样本的17.92%,不平衡指数达4.58。针对不平衡数据,本研究采用数据层处理策略和算法层处理策略相结合的不平衡数据挖掘策略,对青少年女子篮球运动员非接触性损伤进行预测建模。其中,数据层处理策略使用Borderline-SMOTE技术对训练集进行处理,算法层处理策略选用极端梯度提升算法(XGBoost)作为分类算法,采用包含五倍交叉验证的网格搜索法对XGBoost进行参数调优。为了方便比较不平衡数据挖掘策略构建的模型性能,本研究选用经典建模策略逻辑回归(LR)作为对照。1.3模型评估与解释:本研究采用留出法进行模型性能评估。将数据集划分为70%的训练集和30%的验证集,将训练集用于模型训练与参数调优,使用验证集进行模型性能评估。选用曲线下面积(AUC)、误诊率(FPR)和漏诊率(FNR)为模型评价指标。为了方便了解影响模型决策结果的重要特征参数,使用特征归因分析法进行分析。以上工作均在python 3.6编程环境下完成。研究结果:2.1数据集描述:所构建的数据集中包含17名福建省青年女子篮球运动员(年龄:15.00±0.61岁;身高:176.58±6.46 cm;体重:6...
Keyword:
Reprint 's Address:
Email:
Source :
Year: 2022
Language: Chinese
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 3
Affiliated Colleges: