人脸识别的基本原理.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
⼈脸识别的基本原理 编辑导语:⼈脸识别产品早已被应⽤到⽣活的各个场景之中。 是你了解它的应⽤原理吗?本篇⽂章⾥,作者便将⼈ 脸识别原理进⾏了拆解。感兴趣的话就⼀起看下去吧。 现在A I发展的如⽕如荼,我们已逐步进⼊智能时代。虽然⼈⼯智能偏技术类,学习和理解需要⼀定的技术背景和数学做 ⽀撑。 拆开看,其原理、⽅法、思路并不复杂, 「不懂技术」的产品经理也能理解。 ⼈⼯智能牵扯很多学科,知识点盘根错节,需要具备多学科的知识储备。从学习路径上看,⽐较适合做成系列,从浅⼊ 深,从基础到应⽤,逐渐深⼊。 ⽆形中提⾼了学习门槛,降低了学习的兴趣,导致很难坚持。 有感于此,我想以⼀种轻松、探索的视⾓,跟⼤家⼀起摸索,⽤简单、直⽩的⽅式来学习A I。这样,虽然会有错误、遗 漏等, 学习难度会降低,那就在过程中完善吧,毕竟 「模糊的正确⼤于精确的错误」。 ⼀、⼈脸识别产品 我们从⼈脸识别开始,逐步了解其技术路径的演变和原理等,今天先从最简单的原理讲起。 ⼈脸识别其实很早就有了,多年前就以⼈脸考勤的⽅式出现, 由于使⽤效果不好,⽤户体验不佳,逐步被市场淘汰。 ⽽这⼀波⼈⼯智能的⽕热,计算能⼒、模型等都是其重要推动⼒, 更重要的是产品能够落地,能够在实际业务场景中 使⽤。 尤其是⼈脸识别,产品在识别精度、速度、⽤户友好度等多个⽅⾯都有明显提升,⽤户和市场的接受度明显上升。 ⼆、图像表⽰ 了解⼈脸识别,先要从图像表⽰讲起。 ⼤家都知道,计算机能够识别和处理的是⼆进制,不管我们输⼊的是⽂本、图像、声⾳,计算机都是⽤⼀定长度的⼆进 制串进⾏存储和处理。 我们先以⿊⽩图⽚为例,看看计算机是怎么表⽰的。 计算机程序可以将⿊⽩图⽚可以表⽰为灰度图像。在灰度图像中,⼀个像素使⽤8个⽐特位,从⽽可以表⽰256个灰度 阶,表⽰范围是0-255。其中0代表纯⿊⾊,255代表纯⽩⾊。 ⼀个字节可以表⽰⼀个像素,那怎么表⽰⼀张图⽚呢,⽤矩阵进⾏表⽰。 简单来说,就是表格,⽐如可以使⽤8⾏8列来表⽰⼀张8*8的灰度图⽚。 这样我们就解决了图像的表⽰问题,建⽴了图像和矩阵的等价关系。图⽚可以转化为矩阵,通过矩阵也可以恢复原始图 ⽚。 ⼤家能算出来下⾯的矩阵表⽰什么吗? 对的,⼀眼就看出来了数字1,看来⼤家都有搞A I的天赋,加油。 三、图像识别 通过矩阵表⽰图像后,图像的各种处理就转化为数学问题,可以使⽤数学的理论和⽅法进⾏解决,⽽这正是计算机所擅 长的。 我们输⼊图⽚,希望计算机能够将内容识别出来,将结果输出。 仍以数字为例,当输⼊图⽚并⽤矩阵表⽰后,通过将灰度值转化为灰度,可以轻松辨识其所表⽰的内容。 在计算机的世界⾥,只有0和1。想要通过辨识矩阵内容并将结果输出,就必须建⽴矩阵到结果的映射。这样,输⼊⼀ 张图⽚,经过处理和计算后,才能输出⼀个数字。 很朴素的想法就是将各个数字所代表的矩阵提前存放在计算机内,当输⼊⼀张图⽚后,计算机通过计算,从⽽找到最适 合的数字进⾏输出。 举个例⼦,更容易理解⼀些。⽐如,计算机内部已经存放了包含数字1和7以及它们所对应的灰度矩阵。 数字1 数字7 当新输⼊⼀张图像后,程序会⾃动计算它的矩阵与这些矩阵的相似度。相似度计算可使⽤的公式很多,⽐如可以使⽤百 当新输⼊⼀张图像后,程序会⾃动计算它的矩阵与这些矩阵的相似度。相似度计算可使⽤的公式很多,⽐如可以使⽤百 分⽐,距离等。 简单起见,就使⽤两个矩阵对应元素之差的绝对值之和或者平⽅和等,计算机进⾏快速运算,找到最相似的矩阵,然后 将其所代表的数字进⾏输出。 当输⼊以下内容时,经过简单计算,可以知道输出结果为 7。 四、⼈脸表⽰ 既然可以⽤矩阵来表⽰图⽚,⼈脸也是照⽚,那么也可以⽤同样的⽅法来进⾏表⽰,下⾯的这张⼈脸可以表⽰为: ⼈脸照⽚ 矩阵表⽰ 五、⼈脸识别 虽然被叫做⼈脸识别, 更准确的名字应该是 「⼈脸⽐对」。⼈脸识别的背后,是⼀张待⽐对图⽚和⼈脸底库中的所有 照⽚进⾏⽐对,从⽽判别图⽚中⼈员的⾝份。 ⼀般来说,待⽐对照⽚就是我们在⽇常⽣活中被各种设备所采集的照⽚,⽐如通过⼈脸识别考勤机抓拍的照⽚。 ⼀般来说,待⽐对照⽚就是我们在⽇常⽣活中被各种设备所采集的照⽚,⽐如通过⼈脸识别考勤机抓拍的照⽚。 由于环境、姿势等原因,采集的照⽚具有很⼤的差异,导致⽐对成功率不⾼。为了提升⽐对的成功率和速度,很多时候 会同时抓拍多张⼈脸进⾏识别, 每次⽐对的时候输⼊照⽚只有⼀张。 所谓的⼈脸底库就是我们在系统中提前录⼊的⼈脸照⽚,照⽚和我们的名字⼀⼀对应。根据⼈脸底库中照⽚数量的不 同,可以将⼈脸⽐对分为1:1和1:

文档评论(0)

文档爱好者 + 关注
实名认证
文档贡献者

文档爱好者~

1亿VIP精品文档

相关文档