- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
正文目录
ChatGPT开启本轮AI世代,大模型发展进入新纪元 3
大模型,AI领域的重要基建 3
模型向“大”而生,催生“大”算力发展刚需 5
模型扩容+下游CapEx增长+垂类模型落地,推动算力需求高增 7
算力高需求的趋势下,AI芯片增量空间可观 11
GPU并行计算特征满足算力需求 11
GPU占据AI芯片主导地位,ASIC等芯片前景广阔 11
全球GPU市场规模约653亿美元,英伟达优势明显 12
国内AI芯片稳步前行,华为昇腾保持领先 16
投资建议 17
风险提示 17
图目录
图1:大模型对齐人类偏好过程 3
图2:国内外主要大模型基座发展历程 4
图3:SuperClue全球大模型Top10(2024年8月) 5
图4:SuperClue大模型文本能力榜(2024年11月) 5
图5:达到相同效果,大模型所需样本量更少 5
图6:达到相同效果,大模型所需训练步数更少 5
图7:大模型效果显著优于小模型 6
图8:2018-2023年模型参数规模变化 6
图9:单token所需训练成本 7
图10:训练端算力需求测算公式 7
图11:单token所需推理成本 8
图12:推理端算力需求测算公式 8
图13:通用大模型与行业大模型的关系 9
图14:领域数据注入通用大模型后可能引起“灾难性遗忘” 10
图15:CPU与GPU的特性对比 11
图16:2022年中国AI芯片市场结构占比 12
图17:全球GPU市场规模 13
图18:全球GPU市场份额(%) 13
图19:Nvidia的Blackwell架构相比Hopper架构性能再提升 13
图20:英伟达CUDA生态 14
图21:英伟达Blackwell架构 15
图22:英伟达Blackwell架构的平台化意义 15
图23:英伟达产品路线图 15
图24:美国针对先进计算集成电路、超算、半导体制造设备新规 16
表目录
表1:训练端算力测算过程 7
表2:推理端算力测算过程 8
表3:北美主要CPS单季度CAPEX及增速(亿美元,%) 9
表4:国内主流AI芯片参数梳理 17
ChatGPT开启本轮AI世代,大模型发展进入新纪元
大模型,AI领域的重要基建
大模型,通向人工智能的基座模型。据《中国人工智能系列白皮书》
(中国人工智能学会,2023.9),本次大模型热潮主要由语言大模型(亦称为大语言模型)引领,大模型通过在海量无标注数据上进行大规模预训练,能够学习到大量的语言知识与世界知识,并且通过指令微调、人类对齐等关键技术,拥有面向多任务的通用求解能力。据《大模型关键技术与未来发展方向》(刘学博等,2023),大模型具有规模性、涌现性、以及通用性等特性。以ChatGPT为代表的生成式大模型因其具有巨量的参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现出较强的自然语言理解、意图识别、推理、上下文建模、语言生成以及通用问题求解能力,已成为AI领域的重要基础设施。
图1:大模型对齐人类偏好过程
资料来源:《大模型关键技术与未来发展方向》(刘学博等,2023),甬兴证券研究所
ChatGPT开启本轮语言大模型新时代
据superclue,自ChatGPT在2022年11月发布以来,AI大模型在全球范围内掀起了有史以来规模最大人工智能浪潮,国内外大模型更新迭代层出不穷,我们梳理在此过程中大模型发展经历三个阶段:
1:起步期(2022年底~),ChatGPT发布后国内产学研迅速形成大模型共识。
2:成长期(2023年),海外厂商大模型引领,OpenAI发布GPT-4,Meta开源Llama2等;国内大模型数量和质量开始逐渐增长,如百度发布文心一言1.0、阿里云发布通义千问、清华开源ChatGLM、百川智能开源Baichuan等。
3:爆发期(2024年~至今),各类大模型加速问世,开源模型崛起丰富大模型生态,OpenAI发布文生视频Sora,Meta开源Llama3,Google发布多模态大模型Gemini等。
图2:国内外主要大模型基座发展历程
资料来源:《大模型关键技术与未来发展方向》(刘学博等,2023),甬兴证券研究所
GPT-4系列综合能力领跑全球,国内大模型差距明显缩小
据Superclue,GPT-4o-latest以高得分领跑全球大模型,国内大模型竞争激烈,
您可能关注的文档
- 2024年美国大选点评:美国大选,终以“红潮”收官.docx
- 2024年美国大选点评:特朗普归来:政策及影响.docx
- 2024年三季报财务分析:总量二次探底,蓝筹保持韧性.docx
- 2024年三季报个股组合与行业组合:基本面定价何时回归?.docx
- 2024年三季报行业个股超预期扫描.docx
- 2024年三季报业绩点评:业绩回暖仍需观测.docx
- 2024年三季报业绩综述:实体盈利仍有承压,科技/金融景气占优.docx
- 2024年转债三季报专题:金融消费转债业绩占优,周期成长承压.docx
- 2024三季报分析(一):全A与非金融盈利延续分化.docx
- 2025年债券市场年度展望:周期修正、中枢下移与多空博弈.docx
文档评论(0)