- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ProblemChosen2023TeamControlNumber
CMCM/ICM2311035
SummarySheet
世界赢家
摘要:《世界大战》是一款现象级网络游戏。它的出现强烈地引起了人们的关注。虽然看起来很
小,但它背后隐藏的信息却是巨大而有意义的。获取和理解这些信息将有助于《纽约时报》更好地设
计和运营世界。
我们构建了三个模型来完成任务。模型一使用LSTM来预测未来报告分数的数量。模型II使用七
个XGBoost回归量来预测给定单词的百分比分布。模IIIRBFSVM
型使用核的对词进行难易分类。
基于我们的三个模型,我们可以提供一些建议来帮助改进世界。
具体细节如下:
模型一:LSTM是一种改进的递归神经网络,可以解决其他神经网络无法解决的长距离依赖问题。
我们为模型训练了报告分数数量的处理数据,并使用迭代方法预测到3月1日(2023年)的数量。经过
150次独立模型训练后,预测区间为[20745.72,22914.74]。另外,从硬模式与词属性的比例的线性回归
中,我们也可以发现硬模式比与目标词之间没有相关性。
模型II:为了获得某一天与特定单词相关的百分比分布,我们训练了7个独立的XGBoost模型。
我们的模型的R2of为0.68,经过测试可以准确预测,不确定性很低。我们将“EERIE”应用到模型
中,得到一个预测百分比分布,表明ERRIE应该被认为是一个有问题的词。
模型III:我们通过百分比分布的不均匀加权平均值来量化单词的难度,并将其分为三个级别:容
易、中等和困难。然后用标记法对SVM模型与RBF核进行拟合,得到准确率分数为0.6556,F1分数为
0.6634。EERIE的分类结果也比较硬,与模型2的结果一致。
除了这三个模型,我们还从数据集中发现了一些有趣的观察结果,其中一个讨论了人类思维和机
器学习之间的差异。
最后,我们给《纽约时报》世界版编辑写一封信,包括我们的模型、结果和建议。我们希望这封
信将成为世界进一步发展的宝贵参考。
关键词:世界;LSTM;递归回归;XGBoost;工程特性
目录
世界赢家1
1介绍3
1.1背景3
1.2问题重述(RestatementofProblem3
1.3文献综述4
1...
4我们的工作4
设
2假5
3符号5
4模型的制定6
4.
1数据归一化8
4.2LSTM的实现8
4.3来自结果的预测区间9
4.4Hard-modePercentage与Words的相关性9
5任务2:预测百分比分布的模型10
5.1用于衡量报告结果的性能的特征10
5.2特征...
工程10
5.3XGBoost
模型训练11
5.4模型中涉及的不确定性11
5.5EERIE预测分布12
63:13
任务单词分类
6.1特征工程14
6.2模型构建与预测14
6.3模型评价14
74:发现15
任务其他有趣的
7.1人类在世界大战策略上的根本差异15
7.2其他有趣的特性
文档评论(0)