大模型金融应用实践及发展建议 2023正式版.ppt

下载文档

1
0
约3.93千字
约 69页
2024-03-07 发布于广东
举报
版权申诉
保障服务

大模型金融应用实践及发展建议 2023正式版.ppt

此“经济”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共69页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

;;;主编单位：

北京金融信息化研究所;国泰君安证券股份有限公司

华泰证券股份有限公司;;;;;手段。比如自然语言处理训练数据的预处理手段一般包括：质量

过滤，过滤重复数据、低质量数据、虚假内容、不合规内容等；

数据去重，重复数据可能会降低大模型的多样性，导致训练过程

不稳定，从而影响模型性能，一般可在句子级、文档级和数据集

级等不同颗粒度上进行数据去重处理；隐私脱敏，对于包含个人

敏感信息的数据进行脱敏处理，如身份证号码、电话号码等，包

括但不限于匿名化、泛化等手段；数据去毒，消除带有种族/性

别偏见、社会文化偏见、宗教文化偏见的数据，以及低俗、粗鄙

和带有攻击性的数据等；数据降维，其目标是在保留基本信息的

同时减少数据集的复杂性，从而提高训练效率，一般可通过减少

特征维度或样本大小来实现；数据增强，通过人工创建对现有数

据的变更来增加数据量和多样性，特别是在数据量有限的情况下，

通过数据增强可以提高模型的准确性、泛化能力和鲁棒性，也可

以应对数据类别不平衡等问题。完成数据预处理后，可以将数据

通过分词等手段，转换为适用于大模型训练的表达形式，形成高

质量语料。此外，在模型推理过程中，也可以通过整合外部的领

域知识库或专业数据库，为模型提供额外的背景知识和参考数据，

尤其是快速且不断地更新信息，从而提高模型的准确性和鲁棒性。

2.模型算法;;上，以便同时完成计算，更有效地利用计算资源，减少训练所需

时间。微调的主要目的是在预训练模型的基础上，通过有监督微

调、强化学习等方式，进一步提升模型在下游任务中的表现，使

得模型输出更符合人类期望。有监督微调，又称为指令微调，通

过使用有标注的特定任务数据对预训练模型进行微调，从而使得

模型具备遵循指令的能力。早期的微调算法会涉及到预训练模型

的全量参数更新，计算成本较高，目前已提出了多种参数高效微

调任务的方法以节约计算成本，如LoRA、Adapter、P-tuning等。

强化学习技术是基于人类反馈，进一步调整模型的行为。其数据

集一般由经过人工评估的反馈数据构建，这些数据反??了模型的

输出与期望输出之间的差异，基于Q-learning、深度Q网络或

近端策略优化等强化学习算法进行训练。;蒸馏是一种训练小型模型以模仿大型模型行为的方法，保留了大

型模型主要功能的同时降低了计算和存储需求，但通常需要一个

预先训练好的大型模型，且性能上会有一定损失。剪枝是一种去

除模型中不重要或冗余参数的方法，一般可以在不显著影响模型

性能的情况下减小模型的大小和计算需求，但需要确定哪些参数

是不重要或冗余的，以选择合适的剪枝策略。量化是一种减少模

型参数和运算中数字精度以降低模型的存储需求和计算复杂度

的技术，可适用于多种模型和任务，并显著减少存储和计算需求，

但可能会造成一定程度的精度损失，且有时需要特定的硬件支持。

模型加速主要研究加速模型的训练和推理过程，伴随模型参

数增长，正逐渐成为研究热点。训练环节，针对计算量、通信、

内存可以进行一系列优化，例如使用梯度累积或梯度压缩可以优

化通信策略、使用半精度浮点数可以节省内存等。推理环节，优

化手段包括使用GPU、TPU和ASIC等芯片的专用硬件加速器加速

计算过程、使用并行化和分布式推理提高推理吞吐量并减少推理

时间、使用缓存和预取策略降低内存访问延迟、在边缘设备上进

行推理减少与服务器端的通信延迟、结合模型压缩技术加速推理

过程等。现阶段AI应用中，大量的算法、模型、开发框架、软

件等开发都基于通用加速卡架构，在考虑硬件算力的基础上，要

结合加速芯片软件栈及开发工具链等配套的软件生态能力。

5.模型评测;的角色。大模型具有更强大的泛化能力，可以处理多种任务，但

大模型的输出可能存在不真实、不准确、不专业等问题，因此在

大模型上线或升级时，有必要对其进行较为全面、充分的评测，

帮助模型迭代优化。;性。管理方面，使用身份和访问管理工具可以控制资源的访问权

限，运用数据管理工具跟踪数据集的变化。调试方面，使用可视

化工具和日志记录有助于监测模型运行时的详细信息，这对于诊

断问题和优化性能至关重要。维护方面，要制定明确的更新策略

以适应新数据和业务需求，同时要建立回退机制，确保出现问题

时能够快速回退到稳定版本。监控方面，通常包括性能监控和异

常检测，基于实时跟踪和警报设置，确保模型的可靠运行。

7.安全可信;脱敏等；模型开发阶段，引入对齐技术等让大模型的输出更符合

人类价值观；模型上线前，需对大模型的安全可靠水平进行充分

评测，如红队对抗测试等；大模型对客提供服务时，可以引入安

全围栏技术，既能帮助大模型拦截外界的恶意提问，又能对生成

内容进行风险过滤和拦截；此外，模型运营过程中，还需要建立

持续的监控和定期审核机制，以

您可能关注的文档

文档评论（0）

中国邮电传媒 + 关注: 实名认证

内容提供者

不能下载请联系！本账号发布文档部分原创，部分来源于互联网和个人收集，仅用于技术分享交流，版权为原作者所有，侵删。

咨询Ta 进入空间

用户编号：8071012126000004

1亿VIP精品文档

更多 >

大模型金融应用实践及发展建议 2023正式版.ppt