2023美赛O奖:C题论文翻译(8).pdf

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ProblemChosen2023TeamControlNumber

CMCM/ICM2311717

SummarySheet

世界之谜:挖掘数字分数的秘密解词

摘要:《世界之谜》是目前《纽约时报》每天提供的一个很受欢迎的谜题。简单的规则和聪

明的传播特性为它的流行做出了贡献。在本文中,我们分别构建了两个预测模型来预测Twitter报

告数间隔和结果分布,并开发了一个模型来对解词的难度进行分类。

在TASK1中,经过数据预处理,我们从统计学的角度建立了基于三阶高斯回归和非齐次泊松

过程的世界之谜数量预测模型。其中,高斯回归用于预测报告数的趋势符号,非齐次泊松过程在

此基础上预测报告数的随机波动。此外,我们使用流行度松弛函数对随机过程进行校正,从而更

好地逼近流行度变化。在75%的置信水平下,我们预测2023年3月1日报告数量的间隔为

[7654,2015]8

。此外,我们根据字母数量、字母位置等提取单词的个属性,发现这些属性对玩家

困难模式选择的百分比没有影响。玩家对自己表现能力的信心和游戏心态可能是他们是否选择困

难模式的主要原因。

在TASK2中:我们首先提取影响报告结果分布的数据特征,包括单词属性,以及难度模式的

百分比。然后,我们构建一个BP神经网络,对未来某个解词的猜测结果分布进行初步预测。为了

提高预测结果的泛化性能,我们构建了一个基于Bagging的集成BP神经网络。然后,我们预测

2023年3月1日EERIE报告结果的分布为(0,1,6,25,31,25,13)(in%)。我们有超过80%的置信度,对

于每个可能结果的百分比,预测结果的绝对误差不超过5%。

TASK3:先,我们根据用户报告数据的分布,建立基于K-Means的单词难度归纳模

在中首

型,并将难度分为4类。然后,我们基于Pearson系数探索单词属性与难度之间的关联,并将相关

系数大于0.6的属性作为难度分类属性,构建单词难度分类模型。而且,我们发现解词的首字母和

第二个字母出现的频率、发音中包含的元音数量以及单词属性的数量与难度分类有很高的相关

性。最后,EERIR的难度分类结果是最难的。

在TASK4中:在探索报告数量的统计属性的同时,我们发现报告数量的分布呈现出与其随时

3593

间变化的趋势相似的模式。此外,我们还注意到,在天的报告结果分布数据中,次尝试完成

游戏的百分比波动是最大的。

最后,我们对模型进行了敏感性分析,并研究了模型可变参数的变化对结果的影响。

关键词:高斯回归泊松过程;;BP神经网络;K-Means

目录

世界之谜:挖掘数字分数的秘密解词1

1介绍4

1.1问题背景4

1.2问题重述4

1.3文献综述4

1...

4我们的工作5

2假设和理由5

3记号6

4数据预处理6

5任务1:报告数量预测模型游戏模式选择6

5.1数据探索7

5.2世界报表数量预测模型8

5.2.1报表数量预测模型的建立8

5.2.2建立未来报告数量结果的预测区间10

5.3博弈模式选

择分析11

5.3.1词属性

分析11

5.3.2词属性对模式选择的影响分析11

6任务2:Re-分布的预测模型13

文档评论(0)

137****9859 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档