2023美赛O奖:C题论文翻译(7).pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ProblemChosen2023TeamControlNumber

CMCM/ICM2311035

SummarySheet

世界赢家

摘要:《世界大战》是一款现象级网络游戏。它的出现强烈地引起了人们的关注。虽然看起来很

小,但它背后隐藏的信息却是巨大而有意义的。获取和理解这些信息将有助于《纽约时报》更好地设

计和运营世界。

我们构建了三个模型来完成任务。模型一使用LSTM来预测未来报告分数的数量。模型II使用七

个XGBoost回归量来预测给定单词的百分比分布。模IIIRBFSVM

型使用核的对词进行难易分类。

基于我们的三个模型,我们可以提供一些建议来帮助改进世界。

具体细节如下:

模型一:LSTM是一种改进的递归神经网络,可以解决其他神经网络无法解决的长距离依赖问题。

我们为模型训练了报告分数数量的处理数据,并使用迭代方法预测到3月1日(2023年)的数量。经过

150次独立模型训练后,预测区间为[20745.72,22914.74]。另外,从硬模式与词属性的比例的线性回归

中,我们也可以发现硬模式比与目标词之间没有相关性。

模型II:为了获得某一天与特定单词相关的百分比分布,我们训练了7个独立的XGBoost模型。

我们的模型的R2of为0.68,经过测试可以准确预测,不确定性很低。我们将“EERIE”应用到模型

中,得到一个预测百分比分布,表明ERRIE应该被认为是一个有问题的词。

模型III:我们通过百分比分布的不均匀加权平均值来量化单词的难度,并将其分为三个级别:容

易、中等和困难。然后用标记法对SVM模型与RBF核进行拟合,得到准确率分数为0.6556,F1分数为

0.6634。EERIE的分类结果也比较硬,与模型2的结果一致。

除了这三个模型,我们还从数据集中发现了一些有趣的观察结果,其中一个讨论了人类思维和机

器学习之间的差异。

最后,我们给《纽约时报》世界版编辑写一封信,包括我们的模型、结果和建议。我们希望这封

信将成为世界进一步发展的宝贵参考。

关键词:世界;LSTM;递归回归;XGBoost;工程特性

目录

世界赢家1

1介绍3

1.1背景3

1.2问题重述(RestatementofProblem3

1.3文献综述4

1...

4我们的工作4

2假5

3符号5

4模型的制定6

4.

1数据归一化8

4.2LSTM的实现8

4.3来自结果的预测区间9

4.4Hard-modePercentage与Words的相关性9

5任务2:预测百分比分布的模型10

5.1用于衡量报告结果的性能的特征10

5.2特征...

工程10

5.3XGBoost

模型训练11

5.4模型中涉及的不确定性11

5.5EERIE预测分布12

63:13

任务单词分类

6.1特征工程14

6.2模型构建与预测14

6.3模型评价14

74:发现15

任务其他有趣的

7.1人类在世界大战策略上的根本差异15

7.2其他有趣的特性

文档评论(0)

137****9859 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档