- 1、本文档共16页,其中可免费阅读6页,需付费169金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sora+openai技术文档总结+中英对照原稿
OPENAISORA技术报告原文+译文+报告总结
要点总结
模型路径:
1.架构为扩散模型(diffusionmodel)+transformer
2.训练时先用预训练模型把大量的大小不一的视频源文件编码转化为统一的patch表示,把时空要素提取作为transformer的token进行训练。
3.模型效果好和超大量的数据集和更多的运算时间息息相关
优势:
1.人物和背景的连贯性,即时人物运动出了相机范围再回来时还保持同样特征2.自然语言的理解程度很高
3.可以在同一个种子下生成不同尺寸(横向竖向)的视频适配不同设备
4.可以生成长达
您可能关注的文档
- 《智慧城市 城市数字孪生 第1部分:技术参考架构》征求意见稿.docx
- 2023年中国AI健康管理行业概览:以AI科技助力智能健康管理 -头豹.docx
- 2023年中国云原生安全用户调查报告.docx
- 2024年1月服饰行业市场月报.docx
- 2024年1月美妆行业市场报告.docx
- 2024年1月食饮行业市场报告.docx
- AppAgent 能够操作任何手机App的Agent模型.docx
- DLT5717-2015农村住宅电气工程技术规范.docx
- IAB:2023年零售媒体买家指南 Retail Media Buyer’s Guide.docx
- KPMG -2024年银行业风险雷达图 -2024年中国银行业重点风险雷达图及中国银行业重点风险清单.docx
文档评论(0)