视频大模型奇点时刻加速到来.pptxVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1请务必阅读正文之后的信息披露及法律声明。视频大模型迎来Sora时刻,生产力工具蓄势待发。自Sora发布以来,国内外已有十多家公司发布或更新视频生成模型。客观对比:与Sora差距缩小,抢占用户或为未来主线。国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复制性,未来竞争或向抢占用户、提升粘性等方向迁移,从而需要保障生成质量更高的可用视频,使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。主观对比:视频质量提升显著,离物理世界模拟器仍有距离。文生视频领域,视频画面普遍清晰,而在动作幅度与物理还原度方面差异较大,我国Vidu、清影或已处于视频生成大模型第一梯队,生成时间相对其他模型倍数减少,且在动作幅度、物理还原度等复杂任务完成性较好;图生视频领域,整体效果优于文生视频,国内与国外差距进一步缩小。视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。算法、算力、数据三要素,视频大模型通往AGI的必经之路。算法:视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成,是效率与效益的比拼。前者模型更容易训练,而视频内容一致性要差一些,长视频训练存在困难;后者训练成本更高,但是生成视频的长度与一致性更容易得到保障。算力:以Sora为例,一定条件下测算,Sora训练算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。数据:高质量数据是模型能力的保障,而用户数量或为开启模型迭代“数据飞轮”的关键。投资建议:建议关注(1)视频大模型厂商:科大讯飞、商汤、云从科技、格灵深瞳、拓尔思、昆仑万维等。(2)算力:海光信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。(3)接入大模型的应用标的:金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。 ?风险提示:商业化落地不及预期;国内大模型在缺乏算力支持的情况下迭代速度放缓;国内大模型技术路线产生分歧。 核心逻辑

2请务必阅读正文之后的信息披露及法律声明频的大模型迎来Sora时刻,生产力工具蓄势待发算法、算力、数据三要素,视频大模型通往AGI的必经之路投资建议风险提示目录CONTENTS

3请务必阅读正文之后的信息披露及法律声明。01视频大模型迎来Sora时刻,生产力工具蓄势待发国内外视频生成模型纷至沓来客观对比:与Sora差距缩小,抢占用户或为未来主线主观对比:视频质量提升显著,离物理世界模拟器仍有距离视频大模型具备商用潜力,下游应用正在储能

4请务必阅读正文之后的信息披露及法律声明。资料来源:智象未来官网,爱诗科技Alsphere微信公众号,智谱清言官网等,德邦研究所1.1国内外视频生成模型纷至沓来根据APPSO微信公众号,自Sora发布以来,国内外已有不少于十家公司发布或更新视频生成模型。以7月为例:7月31日,Runway宣布Gen-3可支持图生视频。用户可以使用任何图片作为视频生成的首帧,上传的图片既可以单独使用,也可以使用文本提示进行额外指导。7月26日,智谱AI版Sora清影发布,人人可用、半分钟快速创作视频的时代已来。清影理论上仅需30秒即可完成6秒1440×960清晰度高精度视频的生成,展现出亮眼的推理速度,不仅具备高效的指令遵循能力,还具有内容的连贯性和调度灵活性。7月24日,爱诗科技将视频生成模型更新至PixVerseV2,支持一键生成至多5段连续的视频内容,且片段之间会自动保持主体形象、画面风格和场景元素的一致性,视频效果再次提升。7月17日,英国AI创企HaiperAI宣布Haiper升级至v1.5,时长延长到8秒,且提供视频延长、画质增强等功能。7月6日,智象未来在WAIC上发布了智象大模型2.0,提供5、10、15秒三种视频生成时长,并增加文字嵌入生成、剧本多镜头视频生成、IP连贯一致性等能力。此外,智象支持视频增强至4K画质。图表:清影AI视频效果展示 图表:PixVerseV2一次性生成多个一致性视频 图表:智象大模型2.0可增强生成4K画质视频

5请务必阅读正文之后的信息披露及法律声明。资料来源:各公司官网,上海科技微信公众号,智东西微信公众号,APPSO微信公众号等,德邦研究所1.2客观对比:与Sora差距缩小,抢占用户或为未来主线目前,国内外大模型在视频时长、分辨率、画面比例切换等功能或性能指标均与Sora缩小差距,在部分功能已有赶超。生成类型:主流大模型大多具有文生视频、图生视频功能。国外Sora、Haiperv1.5同时具备视频生视频功能,而我国清

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档