- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
⼈脸识别的基本原理
编辑导语:⼈脸识别产品早已被应⽤到⽣活的各个场景之中。 是你了解它的应⽤原理吗?本篇⽂章⾥,作者便将⼈
脸识别原理进⾏了拆解。感兴趣的话就⼀起看下去吧。
现在A I发展的如⽕如荼,我们已逐步进⼊智能时代。虽然⼈⼯智能偏技术类,学习和理解需要⼀定的技术背景和数学做
⽀撑。 拆开看,其原理、⽅法、思路并不复杂, 「不懂技术」的产品经理也能理解。
⼈⼯智能牵扯很多学科,知识点盘根错节,需要具备多学科的知识储备。从学习路径上看,⽐较适合做成系列,从浅⼊
深,从基础到应⽤,逐渐深⼊。 ⽆形中提⾼了学习门槛,降低了学习的兴趣,导致很难坚持。
有感于此,我想以⼀种轻松、探索的视⾓,跟⼤家⼀起摸索,⽤简单、直⽩的⽅式来学习A I。这样,虽然会有错误、遗
漏等, 学习难度会降低,那就在过程中完善吧,毕竟 「模糊的正确⼤于精确的错误」。
⼀、⼈脸识别产品
我们从⼈脸识别开始,逐步了解其技术路径的演变和原理等,今天先从最简单的原理讲起。
⼈脸识别其实很早就有了,多年前就以⼈脸考勤的⽅式出现, 由于使⽤效果不好,⽤户体验不佳,逐步被市场淘汰。
⽽这⼀波⼈⼯智能的⽕热,计算能⼒、模型等都是其重要推动⼒, 更重要的是产品能够落地,能够在实际业务场景中
使⽤。
尤其是⼈脸识别,产品在识别精度、速度、⽤户友好度等多个⽅⾯都有明显提升,⽤户和市场的接受度明显上升。
⼆、图像表⽰
了解⼈脸识别,先要从图像表⽰讲起。
⼤家都知道,计算机能够识别和处理的是⼆进制,不管我们输⼊的是⽂本、图像、声⾳,计算机都是⽤⼀定长度的⼆进
制串进⾏存储和处理。
我们先以⿊⽩图⽚为例,看看计算机是怎么表⽰的。
计算机程序可以将⿊⽩图⽚可以表⽰为灰度图像。在灰度图像中,⼀个像素使⽤8个⽐特位,从⽽可以表⽰256个灰度
阶,表⽰范围是0-255。其中0代表纯⿊⾊,255代表纯⽩⾊。
⼀个字节可以表⽰⼀个像素,那怎么表⽰⼀张图⽚呢,⽤矩阵进⾏表⽰。
简单来说,就是表格,⽐如可以使⽤8⾏8列来表⽰⼀张8*8的灰度图⽚。
这样我们就解决了图像的表⽰问题,建⽴了图像和矩阵的等价关系。图⽚可以转化为矩阵,通过矩阵也可以恢复原始图
⽚。
⼤家能算出来下⾯的矩阵表⽰什么吗?
对的,⼀眼就看出来了数字1,看来⼤家都有搞A I的天赋,加油。
三、图像识别
通过矩阵表⽰图像后,图像的各种处理就转化为数学问题,可以使⽤数学的理论和⽅法进⾏解决,⽽这正是计算机所擅
长的。
我们输⼊图⽚,希望计算机能够将内容识别出来,将结果输出。
仍以数字为例,当输⼊图⽚并⽤矩阵表⽰后,通过将灰度值转化为灰度,可以轻松辨识其所表⽰的内容。
在计算机的世界⾥,只有0和1。想要通过辨识矩阵内容并将结果输出,就必须建⽴矩阵到结果的映射。这样,输⼊⼀
张图⽚,经过处理和计算后,才能输出⼀个数字。
很朴素的想法就是将各个数字所代表的矩阵提前存放在计算机内,当输⼊⼀张图⽚后,计算机通过计算,从⽽找到最适
合的数字进⾏输出。
举个例⼦,更容易理解⼀些。⽐如,计算机内部已经存放了包含数字1和7以及它们所对应的灰度矩阵。
数字1
数字7
当新输⼊⼀张图像后,程序会⾃动计算它的矩阵与这些矩阵的相似度。相似度计算可使⽤的公式很多,⽐如可以使⽤百
当新输⼊⼀张图像后,程序会⾃动计算它的矩阵与这些矩阵的相似度。相似度计算可使⽤的公式很多,⽐如可以使⽤百
分⽐,距离等。
简单起见,就使⽤两个矩阵对应元素之差的绝对值之和或者平⽅和等,计算机进⾏快速运算,找到最相似的矩阵,然后
将其所代表的数字进⾏输出。
当输⼊以下内容时,经过简单计算,可以知道输出结果为 7。
四、⼈脸表⽰
既然可以⽤矩阵来表⽰图⽚,⼈脸也是照⽚,那么也可以⽤同样的⽅法来进⾏表⽰,下⾯的这张⼈脸可以表⽰为:
⼈脸照⽚
矩阵表⽰
五、⼈脸识别
虽然被叫做⼈脸识别, 更准确的名字应该是 「⼈脸⽐对」。⼈脸识别的背后,是⼀张待⽐对图⽚和⼈脸底库中的所有
照⽚进⾏⽐对,从⽽判别图⽚中⼈员的⾝份。
⼀般来说,待⽐对照⽚就是我们在⽇常⽣活中被各种设备所采集的照⽚,⽐如通过⼈脸识别考勤机抓拍的照⽚。
⼀般来说,待⽐对照⽚就是我们在⽇常⽣活中被各种设备所采集的照⽚,⽐如通过⼈脸识别考勤机抓拍的照⽚。
由于环境、姿势等原因,采集的照⽚具有很⼤的差异,导致⽐对成功率不⾼。为了提升⽐对的成功率和速度,很多时候
会同时抓拍多张⼈脸进⾏识别, 每次⽐对的时候输⼊照⽚只有⼀张。
所谓的⼈脸底库就是我们在系统中提前录⼊的⼈脸照⽚,照⽚和我们的名字⼀⼀对应。根据⼈脸底库中照⽚数量的不
同,可以将⼈脸⽐对分为1:1和1:
您可能关注的文档
- 《人因工程》课程教学大纲.doc
- 普通地质学课件.doc
- 彩虹色的花PPT课件.ppt
- 1-2 关于构建家庭学校社会协同育人体系情况的说明报告.doc
- 上门注射告知书.doc
- 新冠疫苗接种不良反应的应急处置(完整版).ppt
- 六级核心形容词副词.doc
- 幼儿园经费保障制度(通用16篇).pdf
- 一年级劳动教育活动五《小小衣物整理师》教学课件.ppt
- 《火烧云》课文原文.pdf
- 专项素养综合全练(五)常见气体的实验室制取教学设计-2024-2025学年九年级化学人教版(2024)上册.docx
- 沪教版化学九年级下册 第7章第2节 常见的酸和碱教案.docx
- 48高考英语听力冲刺模拟训练(48)(教学设计)2025版高考英语听力冲刺模拟训练(提升篇).docx
- Unit 6 Meet my family! Part A (教学设计)-2024-2025学年人教PEP版英语四年级上册.docx
- 华东师大版初中体育与健康七年级 3.2 前掷实心球 说课教学设计.docx
- 人教版小学数学六年级上册3.2.1《分数除法》教学设计.docx
- 2.3程序结构-顺序和选择结构教学设计-2023-2024学年人教中图版(2019)高中信息技术必修1.docx
- Unit 2 Section B (1a—1e)2024-2025学年八年级英语上册同步教学教学设计(人教版)河北专版.docx
- 斜面 教学设计-2023-2024学年科学五年级下册湘科版.docx
- 8推翻帝制 民族觉醒 (第三课时)教学设计-五年级下册道德与法治.docx
文档评论(0)