2023美赛O奖：C题论文翻译（7）.pdf

下载文档

0
0
约1.27万字
约 18页
2024-03-20 发布于广东
举报
版权申诉
保障服务

2023美赛O奖：C题论文翻译（7）.pdf

1、本文档共18页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

ProblemChosen2023TeamControlNumber

CMCM/ICM2311035

SummarySheet

世界赢家

摘要：《世界大战》是一款现象级网络游戏。它的出现强烈地引起了人们的关注。虽然看起来很

小，但它背后隐藏的信息却是巨大而有意义的。获取和理解这些信息将有助于《纽约时报》更好地设

计和运营世界。

我们构建了三个模型来完成任务。模型一使用LSTM来预测未来报告分数的数量。模型II使用七

个XGBoost回归量来预测给定单词的百分比分布。模IIIRBFSVM

型使用核的对词进行难易分类。

基于我们的三个模型，我们可以提供一些建议来帮助改进世界。

具体细节如下:

模型一:LSTM是一种改进的递归神经网络，可以解决其他神经网络无法解决的长距离依赖问题。

我们为模型训练了报告分数数量的处理数据，并使用迭代方法预测到3月1日(2023年)的数量。经过

150次独立模型训练后，预测区间为[20745.72,22914.74]。另外，从硬模式与词属性的比例的线性回归

中，我们也可以发现硬模式比与目标词之间没有相关性。

模型II:为了获得某一天与特定单词相关的百分比分布，我们训练了7个独立的XGBoost模型。

我们的模型的R2of为0.68，经过测试可以准确预测，不确定性很低。我们将“EERIE”应用到模型

中，得到一个预测百分比分布，表明ERRIE应该被认为是一个有问题的词。

模型III:我们通过百分比分布的不均匀加权平均值来量化单词的难度，并将其分为三个级别:容

易、中等和困难。然后用标记法对SVM模型与RBF核进行拟合，得到准确率分数为0.6556,F1分数为

0.6634。EERIE的分类结果也比较硬，与模型2的结果一致。

除了这三个模型，我们还从数据集中发现了一些有趣的观察结果，其中一个讨论了人类思维和机

器学习之间的差异。

最后，我们给《纽约时报》世界版编辑写一封信，包括我们的模型、结果和建议。我们希望这封

信将成为世界进一步发展的宝贵参考。

关键词:世界;LSTM;递归回归;XGBoost;工程特性

世界赢家1

1介绍3

1.1背景3

1.2问题重述(RestatementofProblem3

1.3文献综述4

1...

4我们的工作4

设

2假5

3符号5

4模型的制定6

1数据归一化8

4.2LSTM的实现8

4.3来自结果的预测区间9

4.4Hard-modePercentage与Words的相关性9

5任务2:预测百分比分布的模型10

5.1用于衡量报告结果的性能的特征10

5.2特征...

工程10

5.3XGBoost

模型训练11

5.4模型中涉及的不确定性11

5.5EERIE预测分布12

63:13

任务单词分类

6.1特征工程14

6.2模型构建与预测14

6.3模型评价14

74:发现15

任务其他有趣的

7.1人类在世界大战策略上的根本差异15

7.2其他有趣的特性

您可能关注的文档

文档评论（0）

137****9859 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2023美赛O奖：C题论文翻译（7）.pdf