同济大学2018年数学建模竞赛C题.pdf
《同济大学2018年数学建模竞赛C题.pdf》由会员分享,可在线阅读,更多相关《同济大学2018年数学建模竞赛C题.pdf(27页珍藏版)》请在麦多课文档分享上搜索。
1、1 同济大学 2018 年数学建模竞赛 C 题 摘 要 足球赛事的 战术评价 与排名机制 的选定对于提高球队竞技水平、激发球员拼搏的积极性有着重要的作用 。首先,我们通过主成分分析法、 BP 神经网络构建了球队实力的多维度评价模型并以此预测战绩。其次,我们通过定义不完全信息偏差度 d来衡量比赛推进过程中各排名算法的优越性。最后,我们评价了外援对球队实力与打法的多维度影响。 针对问题一,我们构建了球队实力的多维度评价模型,并结合主客场因素 来预测第九轮的战绩。首先,针对每场比赛的技术数据,我们运用主成分分析法提取了 3个主成分指标 球队威胁性进攻的技术及能力战术,积极防御的技术及战术能力,传控与
2、协同配合的技术及战术能力。其次,我们运用 BP 神经网络来预测第九轮的战绩 我们设置了主客场两队的 3个维度的实力为自变量,设置了战绩为因变量,通过训练神经网络,使检测组达到了 76.9%的正确率。最后,我们预测的战绩如下表。 主场 大连 斯威 富力 华夏 上港 人和 泰达 苏宁 客场 恒大 权健 申花 建业 国安 鲁能 恒丰 亚泰 主场的战绩预测 负 胜 平 胜 平 负 胜 胜 针对问题二,我们定义了不完全信息偏差度 d,以此来量化评价不同算法在比赛推进过程中、也就是不同信息完全度下衡量球队实力 算法 的准确度。首先,我们考量了三种排名算法 进攻强弱系数排名法、综合强弱系数排名法以及题给的积
3、分法。其中在进攻强弱系数排名法中,我们统计了球队两两比赛时的进球数矩阵 A,设置了进攻强弱系数向量 X,由关系式 AX X ,计算得到球队 强弱系数 向量 X。我们类似地设计了综合强弱系数排名法 以球队两两比赛时的积分矩阵 B代替 A。 最后 ,我们通过计算不同算法的 d来评判比赛推进过程中各算法的优越性,所得结果如下表。 轮次 较优的算法 第 5 到 10 轮 综合强弱系数排名法、进攻强弱系数排名法 第 10 到 20 轮 综合强弱系数排名法 第 20 到 30 轮 综合强弱系数排名法、积分法 结果表明,综合强弱系数排名法克服了积分法在比赛初期,由不完全竞争导致的偏差,具有优越性。最后,我们
4、运用综合强弱系数排名法,基于前 8轮比赛成绩,对 16支队伍进行了排名 。 针对问题三,我们从两个方面评估中超赛事中外援的重要程度 外援对球队多维度实力 的贡献度以及外援对球队打法的影响。首先,我们运用主成分分析法衡量了外援对球队实力三个维度 进攻与突破、防御及反击、传控及助攻实力的贡献程度,并以广州富力、天津权健为例详细分析每个外援的贡献度。最后,我们运用变异系数作为确定权重的方法,构建了外援对球队打法的评价模型。 关键词: BP 神经网络 主成分分析法 变异系数法 不完全信息偏差度 2 目 录 一、问题重述 . 3 二、问题分析 . 3 三、问题假设 . 5 四、符号说明 . 5 五、问题
5、一的模型建立与求解 . 6 5.1 构建球队实力的多维度评价模 型 . 6 5.2 技术指标的筛选和确定:运用主成分分析法 . 6 5.4 模型评价 . 12 六、问题二的模型建立与求解 . 12 6.1 问题假设 12 6.2 定义不完全信息偏差度 . 12 6.3 设计三个排名算法 . 13 6.3.1 进攻强弱系数排名法 13 6.3.2 综合强弱系数排名法 15 6.3.3 积分法 16 6.4 偏差度 . 16 6.5 实力排名 . 17 6.6 模型评价 . 17 七、问题三的模型建立与求解 . 18 7.1 问题假设 . 18 7.2 评估外援的重要程度 . 18 7.2.1 外
6、援对球队多维度实力的贡献度 18 7.3 外援对球队打法的影响 . 21 7.3.1 背景介绍 22 7.3.2 建立模型 基于变异系数法的评价球员对球队打法影响的模型. 22 7.3.3 变异系数法 22 7.3.4 模型求解 23 7.3.5 模型优劣点评价 24 八、模型评价 . 24 九、参考文献 . 25 十、附录 . 25 3 一、问题重述 中国足球超级联赛是 中国最优秀的职业足球俱乐部参加的全国最高水平的足球职业联赛 ,共有 16 支球队,赛制为主客场双循环赛。这个 五一小长假期 ,中超第 8轮联赛继续燃起烽火 。大家对比赛结果的预测和议论铺天盖地, 本文 将运用所学的知识和网上
7、提供的数据来进行一些预测和评估: 1.考虑对抗双方的主客场情况,建立模型预测第 9轮比赛中对抗双方的战绩。 2.综合前 8 轮的比赛成绩,对所有的 16 支球队的实力进行排名,并评估赛事进行中,利用积分排名的合理程度。 3.评估中超赛事中外援 (外国球员 )的重要程度,即他们是如何影响一支球队的实力,乃至一支球队的打法的。如果网上的数据不够充分,阐述需要的数据类型,并评估所建立模型的科学性。 二、问题分析 问题一的分析 : 一场足球比赛的结果会受到很多因素影响, 所以在预测战绩时不仅要考虑球队的各方面水平,还要考虑 主客场 这些因素 。 我们构建了球队实力的多维度评价模型, 以此来预测战绩会较
8、为准确 。首先,针对每场比赛的技术数据,我们运用主成分分析法提取了 3 个主成分 技术 指标。其次,我们运用 BP神经网络来预测第九轮的战绩 我们设置了主客场两队的 3 个维度的实力为自变量,设置了战绩为因变量,通过训练神经网络,使检测组达到了 76.9%的正确率。 4 问题二的分析 : 当比赛处在进行中,哪种方法更能真实显示队伍之间的实力呢? 如果某支水平一般的球队碰巧跟弱队比赛的场次较多,则显然他的得分较高,按得分高低排序,该球队的排名可能会虚高,这显然有失公平。所以我 们觉得计分规则应考虑各队的强弱程度, 通过以上三种方法得出的排名与标准之间的距离作为评判在比赛进程中哪种方法最优。标准是
9、根据上赛季三十轮比赛的数据,用积分法得出的,也就是上赛季最终的排名。 问题三的分析 : 外援对于球队起着关键作用,现在球队中普遍有多名外援。外援,作为接受与国内不同足球文化思维和打法训练的球员,将给球队打法带来新的思路和创意,甚至能决定一个球队的打法 ,带来比赛的胜利 。 我们运用主成分分析法和变异系数法来研究外援对球队多维度实力的贡献度和对球队打法的影响。 5 三、问题假设 1.已知的球队技术参数准确,这些参数能够体现球队在某一方面的实力。 2.在一个赛季内,球队的状态和实力基本稳定在一个区间内,不发生大的变动,诸如教练员的更替,球队明星球员的意外伤病。 四、符号说明 参数符号 符号意义 不
10、完全信息偏差度 球队能力指标 球队技术指标 主场球队能力指标 客场球队能力指标 球员实力指标 球员技术指标 球队和球员总技术指标 im 第 i 支球队 球队的第 i 个球员 iV 第 i 项指标 的变异 系数 i 第 i 项指标的标准差 ix 第 i 项指标的平均数 iW 第 i 项指标的权重 6 五 、问题一的模型 建立与求解 5.1 构建球队实力的多维度评价模型 首先,我们采集了比赛各种技术参数的信息,随后,我们通过 SPSS 软件,运用主成分分析确定和形成评价指标体系和权重,由此提取出了三个影响比赛战绩的重要指标。 由于技术参数众多,并且变量之间是 有一定的 相关关系 的, 所以反映战绩
11、的信息会有一定的重叠。 主成分分析 就 是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映 战绩 的信息方面尽可能保持原有的信息。 目前,前八轮比赛都已经结束,但由于有一场比赛的数据异常,我们的样本容量为 126。 5.2 技术指标的筛选和确定 :运用主成分分析法 我们选取的球队技术指标分别为:射 门、直塞球、传中、传球、角球、长传球、抢断、争头球、犯规、越位 1。为了检验我们所选取的技术指标是否适合做主成分分析,我们运用 SPSS 对影响指标进行 KMO 检验 和巴特利特球形检验 ,测试结果见表 5-1。
12、 KMO 统计量 0.631 Bartlett 的球形检验 相关矩阵 的卡方检验 178.781 自由度 45 显著性水平 0.000 表 5-1 KMO统计量和巴特利特球形检验 对技术指标 KMO 统计量为 0.631,相关矩阵的卡方检验结果为 178.781,显著性水平 p0.05,说明技术指标变量适合做主成分分析。 7 表 5-2总方差解释 表 成分 A1 A2 A3 射门 E1 .706 -.174 .185 直塞球 E2 -.013 -.188 .736 传中 E3 .844 .205 -.024 传球 E4 .265 -.187 .606 角球 E5 .802 -.066 -.06
13、7 长传球 E6 -.409 .382 -.254 抢断 E7 -.048 .102 .647 争头球 E8 .113 .777 .248 犯规 E9 -.060 .708 -.146 越位 E10 .103 -.570 .256 表 5-3 最大方差旋转后因子载荷矩阵分析表 为更好地解释各个因子在各个变量上的载荷,运用 Kaiser标准化的方差最大 正交旋转法,通过旋转,加大各个因子载荷的两极分化,拉大绝对值的距离,提高 区分度,便于讨论与评价各个共性因子的具体含义。 以特征值大于 1 为标准选择主成分,由表 5-2得出,有 3项主成分累计贡献率 54.318%, 说明这 3 项主成分基本包
14、含了全部指标具有的信息。由此,我们提取这 3 项指标进行主成分分析。 组件 初始特征值 提取载荷平方和 旋转载荷平方和 总计 方差百分比 累积 % 总计 方差百分比 累积 % 总计 方差百分比 累积 % 1 2.478 24.784 24.784 2.478 24.784 24.784 2.119 21.195 21.195 2 1.700 17.000 41.784 1.700 17.000 41.784 1.732 17.321 38.516 3 1.253 12.534 54.318 1.253 12.534 54.318 1.580 15.801 54.318 4 .936 9.358
15、 63.676 5 .857 8.569 72.245 6 .776 7.759 80.004 7 .678 6.779 86.783 8 .535 5.352 92.135 9 .440 4.404 96.539 10 .346 3.461 100.000 8 A1=0.706*E1-0.013*E2+0.844*E3+0.265*E4+0.802*E5-0.409*E6-0.048*E7+0.113*E8-0.060* E9+0.103*E10 从中可以看出, E1射门、 E3传中和 E5 角球对 A1的影响较大。 A2=-0.174*E1-0.188*E2+0.205*E3-0.187*
16、E4-0.066*E5+0.382*E6+0.102*y7+0.777*E8+0.708 *E9-0.570*E10 从中可以看出, E8争头球和 E9犯规对 A2的影响较大。 A3=0.185*E1+0.736*y2-0.024*E3+0.606*E4-0.067*E5-0.254*E6 +0.647*E7 +0.248*E8 -0.146 *E9+0.256*E10 从中可以看出, E2直塞球和 E7抢断对 A3的影响较大。 我们将 A1、 A2、 A3 这三个指标分别取名为:球队威胁性进攻的技术、战术能力;球队积极防御的技术、战术能力;球队传控与协同配合的技术、战术能力。 这三个指标可以
17、很好的从全方面去衡量一个队伍的实力水平,对比赛的战绩有较大影响。 5.3 战绩预测:运用 BP 神经网络 我们把每个队伍在前八轮的三个指标分别求平均值,得到表 5-4。 A1 A2 A3 恒大 111.7704 -20.9843 249.8543 大连 93.77488 -26.0723 246.2781 富力 129.337 -46.097 319.4823 国安 142.1428 -56.2385 348.6813 恒丰 103.2976 -17.1931 262.9961 华夏 119.8963 -38.1691 304.687 建业 67.70413 3.419 191.4585 鲁能
18、 106.9165 -15.8668 266.1381 权健 112.6954 -27.1296 269.493 人和 91.72257 -14.3337 222.6129 上港 109.3954 -24.659 260.4485 申花 88.63263 -17.9268 231.7171 斯威 98.84688 -12.838 246.4261 苏宁 113.6623 -30.9745 264.8404 泰达 91.09075 -18.2239 238.5106 亚泰 80.75857 -2.581 210.785 表 5-4 9 考虑到主客场因素,我们以主场的队为研究对象,同时也将客场的也
19、纳入自变量。六个自变量 主客场双方的三个技术指标 2,因变量为战绩 1 为胜, 0为平, -1为负。 我们有 63个样本(剔除了一个异常样本),按 8比 2的比例分为培训组( 50个)与检验组( 13个),并针对第九轮的 8 个样本进行预测。 人工神经元的输入输出对应关系为: y = f( wixi T)ni=1多个具有特定的加权系数 Wi的输入信号 Xi同时输入神经元,神经元首先根据权重分配调整输入的信号,确定总体效果。然后,神经元处理输入的信号,比较总输入和偏置值并进行函数转换,得到输出 y。 10 图 5-1 BP神经网络图 根据柯尔莫哥洛夫定理:任意一个连续函数 f:Un Rn , f
20、( x) = Y( U 0,1) 均可通过一个由输入层、隐层和输出层组成的前向神经网络实现。以该定理为基础,建立一个 BP 神经网络模型。 我们运用了 SPSS 的多层感知器功能,多层感知器是一种在输入和输出顶点之间含有一层或多层隐含顶点的前馈网络。只要在输入与输出之间加一个隐含层,形成一个两层的感知器就可以完成异或逻辑门。 我们可以看到图 5.1中有一个输入层,两个隐藏层,一个输出层。输入层神经元个数为 6 个,第一个隐藏层是 4 个,第二个隐藏层是 3 个,输出层是 3 个。11 激活函数为双曲正切函数。双曲正切函数 的输出和输入能够保持非线性单调上升和 下降关系,符合 BP 网络的梯度求
21、解,容错性好,有界,渐进于 0、 1,符合人脑神经饱和的规律。 培训 平方和误差 15.572 不正确百分比预测值 28.0% 所使用的停止规则 1 个连续步骤中错误没有减少 a 培训时间 0:00:00.02 测试中 平方和误差 4.202 不正确百分比预测值 23.1% 表 5-5模型摘要 表 因变量:胜负 a. 错误计算基于测试样本 样本 观察值 (O) 预测值 -1 0 1 正确百分比 培训 -1 15 3 1 78.9% 0 0 5 4 55.6% 1 1 5 16 72.7% 总体百分比 32.0% 26.0% 42.0% 72.0% 测试 -1 3 0 1 75.0% 0 0 2
22、 1 66.7% 1 0 1 5 83.3% 总体百分比 23.1% 23.1% 53.8% 76.9% 表 5-6分类 表 因变量:胜负 根据表 5-5,模型误差在 1个连续步骤中未出现优化减少现象,模型按预定中止。从表 5-6 可以得出, 50 个培训组的预测正确率为 72.0%, 13 个测试组的预测正确率为 76.9%。 神经网络 是 对非线性系统建立预测模型和优化控制的关键技术之一 。 神经网络模型起源于对人类大脑思维模式的研究,它是一个非线性的数据建模工具, 由输入层和输出层、 一个或者多个隐藏层构成神经元,神经元之间的连接赋予相关的权重,训练学习算法在迭代过程中不断调整这些权重,
23、从而使得预测误差最小化并给出预测精度。 12 主场 -客场 X1 X2 X3 Y1 Y2 Y3 输出 预测主场胜负 大连 -恒大 93.775 -26.072 246.278 111.77 -20.98 249.854 -1 负 斯威 -权健 98.847 -12.838 246.426 112.695 -27.13 269.493 1 胜 富力 -申花 129.337 -46.097 319.482 88.633 -17.93 231.717 0 平 华夏 -建业 119.896 -38.169 304.687 67.704 3.42 191.459 1 胜 上港 -国安 109.395 -
24、24.659 260.448 142.143 -56.24 348.681 0 平 人和 -鲁能 91.723 -14.334 222.613 106.917 -15.87 266.138 -1 负 泰达 -恒丰 91.091 -18.224 238.511 103.298 -17.19 262.996 1 胜 苏宁 -亚泰 113.662 -30.975 264.84 80.759 -2.58 210.785 1 胜 表 5-7 第九轮预测图 5.4 模型评价 优点: 1.一支球队在一场比赛中的比赛发挥是波动的,是众多因素共同作用的结果。我们综合考虑了球队在已结束的所有比赛中三个指标的均值,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 同济大学 2018 数学 建模 竞赛 PDF
