视频大模型奇点时刻加速到来.pptxVIP

下载本文档

3
0
约1.51万字
约 22页
2024-09-05 发布于北京
举报
版权申诉

视频大模型奇点时刻加速到来.pptx

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1请务必阅读正文之后的信息披露及法律声明。视频大模型迎来Sora时刻，生产力工具蓄势待发。自Sora发布以来，国内外已有十多家公司发布或更新视频生成模型。客观对比：与Sora差距缩小，抢占用户或为未来主线。国内外之间的差距正在逐步缩小，视频时长、分辨率等基础功能具有复制性，未来竞争或向抢占用户、提升粘性等方向迁移，从而需要保障生成质量更高的可用视频，使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。主观对比：视频质量提升显著，离物理世界模拟器仍有距离。文生视频领域，视频画面普遍清晰，而在动作幅度与物理还原度方面差异较大，我国Vidu、清影或已处于视频生成大模型第一梯队，生成时间相对其他模型倍数减少，且在动作幅度、物理还原度等复杂任务完成性较好；图生视频领域，整体效果优于文生视频，国内与国外差距进一步缩小。视频大模型具备商用潜力，下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善，视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。算法、算力、数据三要素，视频大模型通往AGI的必经之路。算法：视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成，是效率与效益的比拼。前者模型更容易训练，而视频内容一致性要差一些，长视频训练存在困难；后者训练成本更高，但是生成视频的长度与一致性更容易得到保障。算力：以Sora为例，一定条件下测算，Sora训练算力需求是GPT-4的4.5倍，而推理算力需求接近GPT-4的400倍。数据：高质量数据是模型能力的保障，而用户数量或为开启模型迭代“数据飞轮”的关键。投资建议：建议关注（1）视频大模型厂商：科大讯飞、商汤、云从科技、格灵深瞳、拓尔思、昆仑万维等。（2）算力：海光信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。（3）接入大模型的应用标的：金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。 ?风险提示：商业化落地不及预期；国内大模型在缺乏算力支持的情况下迭代速度放缓;国内大模型技术路线产生分歧。核心逻辑

2请务必阅读正文之后的信息披露及法律声明频的大模型迎来Sora时刻，生产力工具蓄势待发算法、算力、数据三要素，视频大模型通往AGI的必经之路投资建议风险提示目录CONTENTS

3请务必阅读正文之后的信息披露及法律声明。01视频大模型迎来Sora时刻，生产力工具蓄势待发国内外视频生成模型纷至沓来客观对比：与Sora差距缩小，抢占用户或为未来主线主观对比：视频质量提升显著，离物理世界模拟器仍有距离视频大模型具备商用潜力，下游应用正在储能

4请务必阅读正文之后的信息披露及法律声明。资料来源：智象未来官网，爱诗科技Alsphere微信公众号，智谱清言官网等，德邦研究所1.1国内外视频生成模型纷至沓来根据APPSO微信公众号，自Sora发布以来，国内外已有不少于十家公司发布或更新视频生成模型。以7月为例：7月31日，Runway宣布Gen-3可支持图生视频。用户可以使用任何图片作为视频生成的首帧，上传的图片既可以单独使用，也可以使用文本提示进行额外指导。7月26日，智谱AI版Sora清影发布，人人可用、半分钟快速创作视频的时代已来。清影理论上仅需30秒即可完成6秒1440×960清晰度高精度视频的生成，展现出亮眼的推理速度，不仅具备高效的指令遵循能力，还具有内容的连贯性和调度灵活性。7月24日，爱诗科技将视频生成模型更新至PixVerseV2，支持一键生成至多5段连续的视频内容，且片段之间会自动保持主体形象、画面风格和场景元素的一致性，视频效果再次提升。7月17日，英国AI创企HaiperAI宣布Haiper升级至v1.5，时长延长到8秒，且提供视频延长、画质增强等功能。7月6日，智象未来在WAIC上发布了智象大模型2.0，提供5、10、15秒三种视频生成时长，并增加文字嵌入生成、剧本多镜头视频生成、IP连贯一致性等能力。此外，智象支持视频增强至4K画质。图表：清影AI视频效果展示图表：PixVerseV2一次性生成多个一致性视频图表：智象大模型2.0可增强生成4K画质视频

5请务必阅读正文之后的信息披露及法律声明。资料来源：各公司官网，上海科技微信公众号，智东西微信公众号，APPSO微信公众号等，德邦研究所1.2客观对比：与Sora差距缩小，抢占用户或为未来主线目前，国内外大模型在视频时长、分辨率、画面比例切换等功能或性能指标均与Sora缩小差距，在部分功能已有赶超。生成类型：主流大模型大多具有文生视频、图生视频功能。国外Sora、Haiperv1.5同时具备视频生视频功能，而我国清