大语言模型的前世、今生与未来.pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
行业深度分析报告/ 内容目录 1 大语言模型:NLP 技术的奇点时刻 4 1.1 技术探索:深度学习加速推进数据的无损压缩 4 1.2 技术应用:预训练语言模型成为NLP 主流 5 1.3 技术跃迁:大语言模型可能打开通往AGI 之路 5 2 OpenAI 与GPT :算法、工程、商业的融合 6 2.1 GPT 系列模型的发展历程:千锤百炼,终见“涌现” 6 2.2 如何训练一个ChatGPT :预训练获得“智商”,指令微调提升“情商” 7 2.3 模型智能的“涌现”是生成式AI 浪潮的充要条件 8 3 大模型应用:数据感知与代理(Agent)能力 10 3.1 外部数据:三条融合垂域数据打造大模型的技术路径 10 3.1.1 Fine-Tuning 与In-Context Learning 的实现方式案例 11 3.2 代理(Agent):为大模型加上四肢,强化复杂任务处理能力 13 3.2.1 与计算机内部交互:插件(Plugins)与代码解释器(Code Interpreter) 13 3.2.2 与物理世界交互:Robotics Transformer 2 (RT-2) 14 3.3 上下文长度:应用创新的关键靶点 15 3.4 “大”模型“小”型化:应用落地的降本之道 16 4 应用分析框架:通用能力与外部能力的组合 17 5 投资建议 18 6 风险提示 19 图表目录 图1. 人工智能底层算法的探索历程(1958-2017 年) 4 图2. 自然语言处理(NLP)发生的三次技术范式转移 5 图3. 本次以GPT 为代表的生成式AI 技术进步路线图 6 图4. OpenAI 的GPT 系列模型发展历程 7 图5. GPT 模型训练流程 8 图6. 当模型规模达到一定程度时将会出现“涌现”现象 9 图7. 思维链提示可以显著提升大语言模型的性能 9 图8. 打造垂域模型的三种基本方法 10 2 行业深度分析报告/ 图9. Delta-Tuning 是对LLM 参数高效的微调范式 12 图10. Langchain+向量数据库打造企业专属知识库问答系统 12 图11. 大模型驱动的自主代理系统 13 图12. OpenAI 发布首批70 余款GPT-4 插件 14 图13. 执行逻辑计算的代码解释器插件示例 14 图14. 机器人控制与思维链推理结合示例 15 图15. 大模型驱动的自主代理系统 16 图16. 模型小型化的主要实现路径 16 图17. 参数量化能够显著降低大模型的推理成本 17 3

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档