[AI工具宝典]AI识别技术，在改变全球流媒体.pdfVIP

下载本文档

0
0
约5.36千字
约 16页
2024-07-18 发布于上海
举报
版权申诉

[AI工具宝典]AI识别技术，在改变全球流媒体.pdf

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

文章从AI识别技术出发，对其应用进行了分析探究。AI识别技术的商业应用以视频推荐

和广告投放为主，作者对其未来发展进行了展望，与大家分享。

话说，最近这高质量网综也太多了吧，都看不过来！

我这时间，全耗在各种职场、侦探、语言、演技类节目里了。

那今天，咱就来说说，这些流媒体平台吧。

我一直觉得啊，咱互联网企业的“落地”能力，那是杠杠的。

同样类型的App，对比国外App，国内大厂总有各种新奇的功能，真引领世界。

周末，我看《奇葩说》的时候，就发现爱奇艺在推广一个新玩意儿——“扫一扫”。

视频旁边，会有个扫面按钮。开始我还不知道，这是干嘛的。

点击了之后才发现，原来是对内容扫描啊，进行人脸识别。然后，会告诉你视频里的人都

是谁，还有相关百科。

哇，完美解决观众常见需求——“这人谁啊？”。

仔细想想，技术上，还真挺难的。

要知道，这可不是机场里面那种1:1人脸识别，你可以正对着摄像头，让系统认出来。

你看，诞总和虫仔，视频里根本没看镜头，机器只能根据一部分侧脸做出判断。

在我看看来，类似“扫一扫”的创新功能，改变的可不仅仅是优化用户体验。

通过这小小的功能，我看到的是全球流媒体平台们暗潮涌动的技术整体实力的竞争，以及

在“识别”这个动作下，人、场、物，正在技术赋予的想象力中串联在一起。

来，我们先“认识”一下

“扫一扫”是众多AI在视频里应用的一个小例子，实际上，AI已经充斥在视频各个环节

。

要让AI得到更充分的应用，第一步，当然就是要认识视频里的内容。

这个能力没有，后面都没法玩儿。

来，咱直接先看一个AI最复杂的应用场景——艺术创作。

今年7月，Netflix财报披露：公司正在研究利用AI生成预告片。

很快，Netflix就可以快速、大量地，对海量内容自动生成预告，质量还非常高哦。

在降低剪辑师人工成本的同时，这千人千面的预告片，又会增加影片点击率和观看时长。

其实，在2016年时，21世纪福克斯和IBM就推出了Watson系统给自家的惊悚片

Morgan自动生成预告片了，只不过不能像Netflix这大批量搞。

这背后的原理其实都类似，一共分两步。

第一步，就是识别并理解内容

把剪辑好的全片直接倒入，系统首先就会开始对内容进行识别。

比如，进行复杂环境下的人脸识别，认出演员是谁，还能知道谁是主角，谁是群演。

除了人，还会对景色、物体识别，贴上各种标签，比如“公园里”，“家里近景”等等。

另外，还会对台词和配乐分析，识别各个片段的情感，是惊悚还是温情，一目了然。

这一过程想要做到详细，是很耗费时间的，因为要跟其他来源的数据对比。比如IBM的

Watson，就需要24小时来完成。

第二步，就是根据既定工业化套路生成预告

比如，同样是30秒的预告，可以有各种风格，和各种模版音乐，按照相关标准生产即可

，再根据用户喜好投放。

假设，让你用AI剪辑沈腾的喜剧电影合集，那可以想象出来，这最起码可以有“感人风

格”和“爆笑风格”两种模版。

上面这两步里，第一步的“识别”是基础，第二步的“生成”则是应用。

当然，第一步最为重要也是必须，而且同一部影片，系统理解一次之后，结果可以重复利

用，赋能更多应用。

第一步的“识别”还真是“基础武功”。正因如此重要，各大流媒体巨头都在重点投入研

发。

国内方面，老大哥爱奇艺在研究识别这件事上下了大功夫。比如爱奇艺计算机视觉的研究

成果多次被包含ICCV在内的学术会议收录，多次在挑战赛获奖。

爱奇艺还曾直接联合了国内外顶级视觉和多媒体会议，如PRCV2018和ACMMM，首次

发起“多模态视频人物识别挑战赛”，还公布了全球最大的明星视频数据集（iQIYI-VID

），联手产学研，取得突破。

你问啥是多模态识别？

简单说，就是基于人脸、声纹、姿态、场景等综合识别，这样一来，即使在暗光下、化浓

妆、侧脸等等，都能准确识别，它对提升人物识别的精准度非常重要，属于AI领域中前

沿的技术。

开头提到“扫一扫”能识别半张脸的虫仔，核心能力就来自于这儿。所以这些应用看着好

像没什么，但没点硬核技术还真不行。

比如爱奇艺办的这两场大赛，就让它的人物识别精确度大幅提升。不然你以为一家娱乐公

司为什么要天天搞技术研发。

当AI系统“识别”了视频内容，那就算是“正式

您可能关注的文档

文档评论（0）

LOONG + 关注: 实名认证

文档贡献者

三步一卡，卡的潇洒；五步一停，摆个造型。

咨询Ta 进入空间

1亿VIP精品文档

更多 >

[AI工具宝典]AI识别技术，在改变全球流媒体.pdfVIP