- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
文章从AI识别技术出发,对其应用进行了分析探究。AI识别技术的商业应用以视频推荐
和广告投放为主,作者对其未来发展进行了展望,与大家分享。
话说,最近这高质量网综也太多了吧,都看不过来!
我这时间,全耗在各种职场、侦探、语言、演技类节目里了。
那今天,咱就来说说,这些流媒体平台吧。
我一直觉得啊,咱互联网企业的“落地”能力,那是杠杠的。
同样类型的App,对比国外App,国内大厂总有各种新奇的功能,真引领世界。
周末,我看《奇葩说》的时候,就发现爱奇艺在推广一个新玩意儿——“扫一扫”。
视频旁边,会有个扫面按钮。开始我还不知道,这是干嘛的。
点击了之后才发现,原来是对内容扫描啊,进行人脸识别。然后,会告诉你视频里的人都
是谁,还有相关百科。
哇,完美解决观众常见需求——“这人谁啊?”。
仔细想想,技术上,还真挺难的。
要知道,这可不是机场里面那种1:1人脸识别,你可以正对着摄像头,让系统认出来。
你看,诞总和虫仔,视频里根本没看镜头,机器只能根据一部分侧脸做出判断。
在我看看来,类似“扫一扫”的创新功能,改变的可不仅仅是优化用户体验。
通过这小小的功能,我看到的是全球流媒体平台们暗潮涌动的技术整体实力的竞争,以及
在“识别”这个动作下,人、场、物,正在技术赋予的想象力中串联在一起。
来,我们先“认识”一下
“扫一扫”是众多AI在视频里应用的一个小例子,实际上,AI已经充斥在视频各个环节
。
要让AI得到更充分的应用,第一步,当然就是要认识视频里的内容。
这个能力没有,后面都没法玩儿。
来,咱直接先看一个AI最复杂的应用场景——艺术创作。
今年7月,Netflix财报披露:公司正在研究利用AI生成预告片。
很快,Netflix就可以快速、大量地,对海量内容自动生成预告,质量还非常高哦。
在降低剪辑师人工成本的同时,这千人千面的预告片,又会增加影片点击率和观看时长。
其实,在2016年时,21世纪福克斯和IBM就推出了Watson系统给自家的惊悚片
Morgan自动生成预告片了,只不过不能像Netflix这大批量搞。
这背后的原理其实都类似,一共分两步。
第一步,就是识别并理解内容
把剪辑好的全片直接倒入,系统首先就会开始对内容进行识别。
比如,进行复杂环境下的人脸识别,认出演员是谁,还能知道谁是主角,谁是群演。
除了人,还会对景色、物体识别,贴上各种标签,比如“公园里”,“家里近景”等等。
另外,还会对台词和配乐分析,识别各个片段的情感,是惊悚还是温情,一目了然。
这一过程想要做到详细,是很耗费时间的,因为要跟其他来源的数据对比。比如IBM的
Watson,就需要24小时来完成。
第二步,就是根据既定工业化套路生成预告
比如,同样是30秒的预告,可以有各种风格,和各种模版音乐,按照相关标准生产即可
,再根据用户喜好投放。
假设,让你用AI剪辑沈腾的喜剧电影合集,那可以想象出来,这最起码可以有“感人风
格”和“爆笑风格”两种模版。
上面这两步里,第一步的“识别”是基础,第二步的“生成”则是应用。
当然,第一步最为重要也是必须,而且同一部影片,系统理解一次之后,结果可以重复利
用,赋能更多应用。
第一步的“识别”还真是“基础武功”。正因如此重要,各大流媒体巨头都在重点投入研
发。
国内方面,老大哥爱奇艺在研究识别这件事上下了大功夫。比如爱奇艺计算机视觉的研究
成果多次被包含ICCV在内的学术会议收录,多次在挑战赛获奖。
爱奇艺还曾直接联合了国内外顶级视觉和多媒体会议,如PRCV2018和ACMMM,首次
发起“多模态视频人物识别挑战赛”,还公布了全球最大的明星视频数据集(iQIYI-VID
),联手产学研,取得突破。
你问啥是多模态识别?
简单说,就是基于人脸、声纹、姿态、场景等综合识别,这样一来,即使在暗光下、化浓
妆、侧脸等等,都能准确识别,它对提升人物识别的精准度非常重要,属于AI领域中前
沿的技术。
开头提到“扫一扫”能识别半张脸的虫仔,核心能力就来自于这儿。所以这些应用看着好
像没什么,但没点硬核技术还真不行。
比如爱奇艺办的这两场大赛,就让它的人物识别精确度大幅提升。不然你以为一家娱乐公
司为什么要天天搞技术研发。
当AI系统“识别”了视频内容,那就算是“正式
您可能关注的文档
- [AI工具宝典]AI产品经理 VS 数据产品经理,看这5点区别与联系.pdf
- [AI工具宝典]AI产品经理,如何规划AI产品的MVP?.pdf
- [AI工具宝典]AI产品经理必懂的硬知识(一):应用领域篇.pdf
- [AI工具宝典]AI产品经理必修:揭开算法的面纱(隐含马尔可夫).pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(EM算法).pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(贪心算法).pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(余弦定理).pdf
- [AI工具宝典]AI产品经理必知的两类ChatBot详解.pdf
- [AI工具宝典]AI产品经理的必修课:系统化思维.pdf
- [AI工具宝典]AI产品经理的关键性产品思维.pdf
- 2024精简护肤洁面趋势报告-TMIC-30正式版.doc
- 2024捕捉华夏民族珍味-咸味主食与咸味零食创新机遇报告-25正式版.doc
- 2024年秋季部编版小学道德与法治二年级上册全册课件PPT最新.pptx
- 部编版第十一册第四单元拓展提高教学课件.ppt
- 2024年秋季新西师大版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册课件(新版教材).pptx
文档评论(0)