[AI工具宝典]AI识别技术,在改变全球流媒体.pdfVIP

[AI工具宝典]AI识别技术,在改变全球流媒体.pdf

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

文章从AI识别技术出发,对其应用进行了分析探究。AI识别技术的商业应用以视频推荐

和广告投放为主,作者对其未来发展进行了展望,与大家分享。

话说,最近这高质量网综也太多了吧,都看不过来!

我这时间,全耗在各种职场、侦探、语言、演技类节目里了。

那今天,咱就来说说,这些流媒体平台吧。

我一直觉得啊,咱互联网企业的“落地”能力,那是杠杠的。

同样类型的App,对比国外App,国内大厂总有各种新奇的功能,真引领世界。

周末,我看《奇葩说》的时候,就发现爱奇艺在推广一个新玩意儿——“扫一扫”。

视频旁边,会有个扫面按钮。开始我还不知道,这是干嘛的。

点击了之后才发现,原来是对内容扫描啊,进行人脸识别。然后,会告诉你视频里的人都

是谁,还有相关百科。

哇,完美解决观众常见需求——“这人谁啊?”。

仔细想想,技术上,还真挺难的。

要知道,这可不是机场里面那种1:1人脸识别,你可以正对着摄像头,让系统认出来。

你看,诞总和虫仔,视频里根本没看镜头,机器只能根据一部分侧脸做出判断。

在我看看来,类似“扫一扫”的创新功能,改变的可不仅仅是优化用户体验。

通过这小小的功能,我看到的是全球流媒体平台们暗潮涌动的技术整体实力的竞争,以及

在“识别”这个动作下,人、场、物,正在技术赋予的想象力中串联在一起。

来,我们先“认识”一下

“扫一扫”是众多AI在视频里应用的一个小例子,实际上,AI已经充斥在视频各个环节

要让AI得到更充分的应用,第一步,当然就是要认识视频里的内容。

这个能力没有,后面都没法玩儿。

来,咱直接先看一个AI最复杂的应用场景——艺术创作。

今年7月,Netflix财报披露:公司正在研究利用AI生成预告片。

很快,Netflix就可以快速、大量地,对海量内容自动生成预告,质量还非常高哦。

在降低剪辑师人工成本的同时,这千人千面的预告片,又会增加影片点击率和观看时长。

其实,在2016年时,21世纪福克斯和IBM就推出了Watson系统给自家的惊悚片

Morgan自动生成预告片了,只不过不能像Netflix这大批量搞。

这背后的原理其实都类似,一共分两步。

第一步,就是识别并理解内容

把剪辑好的全片直接倒入,系统首先就会开始对内容进行识别。

比如,进行复杂环境下的人脸识别,认出演员是谁,还能知道谁是主角,谁是群演。

除了人,还会对景色、物体识别,贴上各种标签,比如“公园里”,“家里近景”等等。

另外,还会对台词和配乐分析,识别各个片段的情感,是惊悚还是温情,一目了然。

这一过程想要做到详细,是很耗费时间的,因为要跟其他来源的数据对比。比如IBM的

Watson,就需要24小时来完成。

第二步,就是根据既定工业化套路生成预告

比如,同样是30秒的预告,可以有各种风格,和各种模版音乐,按照相关标准生产即可

,再根据用户喜好投放。

假设,让你用AI剪辑沈腾的喜剧电影合集,那可以想象出来,这最起码可以有“感人风

格”和“爆笑风格”两种模版。

上面这两步里,第一步的“识别”是基础,第二步的“生成”则是应用。

当然,第一步最为重要也是必须,而且同一部影片,系统理解一次之后,结果可以重复利

用,赋能更多应用。

第一步的“识别”还真是“基础武功”。正因如此重要,各大流媒体巨头都在重点投入研

发。

国内方面,老大哥爱奇艺在研究识别这件事上下了大功夫。比如爱奇艺计算机视觉的研究

成果多次被包含ICCV在内的学术会议收录,多次在挑战赛获奖。

爱奇艺还曾直接联合了国内外顶级视觉和多媒体会议,如PRCV2018和ACMMM,首次

发起“多模态视频人物识别挑战赛”,还公布了全球最大的明星视频数据集(iQIYI-VID

),联手产学研,取得突破。

你问啥是多模态识别?

简单说,就是基于人脸、声纹、姿态、场景等综合识别,这样一来,即使在暗光下、化浓

妆、侧脸等等,都能准确识别,它对提升人物识别的精准度非常重要,属于AI领域中前

沿的技术。

开头提到“扫一扫”能识别半张脸的虫仔,核心能力就来自于这儿。所以这些应用看着好

像没什么,但没点硬核技术还真不行。

比如爱奇艺办的这两场大赛,就让它的人物识别精确度大幅提升。不然你以为一家娱乐公

司为什么要天天搞技术研发。

当AI系统“识别”了视频内容,那就算是“正式

您可能关注的文档

文档评论(0)

LOONG + 关注
实名认证
文档贡献者

三步一卡,卡的潇洒;五步一停,摆个造型。

1亿VIP精品文档

相关文档