- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
隐马尔可夫模型目前陆续成功地应用于机器翻译、拼写纠错、手写体识别、图像处理、基
因序列分析等领域。近20年来,它广泛应用于股票预测和投资。本文抛弃那些眼花缭乱
的数学公式,去看看隐含马尔可夫模型到底是什么?怎么用?
相信只要是涉足人工智能领域,你都会听到这样一个神秘的名字-隐含马尔可夫模型。是
的,看了一圈文章和资料后,除了知道马尔可夫是个聪明绝顶的人,其他的就啥也不知道
了。
正式开讲之前,先大概了解一下,这个算法有哪些主要的应用场景。
一个词概括,进行预测。
20世界80年代末李开复坚持采用隐马尔可夫模型的框架,成功的开发了世界上第一个大
词汇量连续语音识别系统sphinx。接下来,隐马尔可夫模型陆续成功地应用于机器翻译
、拼写纠错、手写体识别、图像处理、基因序列分析等领域。近20年来,它广泛应用于
股票预测和投资。
今天,我想抛弃那些眼花缭乱的数学公式,去看看隐含马尔可夫模型到底是什么?怎么用
?
一、隐含马尔可夫模型是什么?
我们还是分成三个阶段来了解。
概念一:马尔可夫假设
随机过程中各个状态st的概率分布,只与它前一个状态st-1有关。
举一个例子,我们可以把S1,S2,S3…St…看做北京每天的最高气温,这里面的每个状态
St都是随机的。理论上,任何一天的最高气温St取值都可能和这段时间以前的最高气温
是相关的。
马尔可夫这个大神为了简化问题,做出了如上图的简化的假设。回到上面的例子,第二天
的最高气温只跟昨天有关而与其他日期没有任何关联。
概念二:马尔可夫链
符合马尔可夫假设的随机过程称为马尔可夫过程,也称为马尔可夫链。
在这个马尔可夫链中,四个圈表示四个状态,每条边表示一个可能的状态转换,边上的权
值是转移概率。
例如:某个时刻t的状态St是m2,则下一个时刻St+1=m3的概率是0.6,用数学符号表
示是P(St+1=m3|St=m2)=0.6。
把这个马尔可夫链想象成一台机器,它随机选择一个状态作为初始状态,然后按照上述规
则随机选择后续状态。
结果可能如下:
S1=m1S2=m2S3=m3S4=m4S1=m2S2=m4S1=m3S2=m3S3=m4……
这样经过一段时间的运转,就会产生一个状态序列S1,S2,S3…St。我们可以数出mi
出现的次数,以及mi转换到mj的转移概率。基于马尔可夫假设,每一个状态只与前一
个状态相关,例如从m3转移到m4,不论在此之前是怎么进入m3,这个概率都是0.3
。
概念三:隐含马尔可夫模型
隐马尔可夫模型是上述马尔可夫链的一个扩展:任一时刻t的状态st是不可见的。所以观
察者没法通过观察到一个状态序列s1,s2,s3,…sT-1来推测转移概率等参数。但是,隐马尔
可夫在每个时刻t会输出一个符号ot,而且ot和st相关而且仅和st相关。这个被称为
独立输出假设。
隐马尔可夫模型结构如下:
其中包含的状态s1,s2,s3,s4是一个典型的马尔可夫链。鲍姆把这种模型称为“隐含
”马尔可夫模型。
那么,问题来了,什么是隐患状态?
从马尔可夫链中,我们看到的都是可见状态啊。这个问题真的困扰了我很久,我找了大量
的资料,发现还是这样一个经典例子能够解释得清楚,请看:
假设我手里有三个不同的骰子。第一个骰子是我们平常见的骰子(称这个骰子为D6),
6个面,每个面(1,2,3,4,5,6)出现的概率是1/6。第二个骰子是个四面体(称这
个骰子为D4),每个面(1,2,3,4)出现的概率是1/4。第三个骰子有八个面(称这
个骰子为D8),每个面(1,2,3,4,5,6,7,8)出现的概率是1/8。
现在,我们开始掷骰子,得到如下结果:
看出来了吧?什么是隐含状态?掷出来的数字是可见的,但是每次取哪个骰子,我们是不
是不知道?
回到隐含马尔可夫模型,符号ot就是我们掷出来得数字(1,2,3,4,5,6,7,8),
隐患状态st就是我们掷得骰子(D6,D4,D8)。
现在,我们以掷骰子为例,来总结一下隐患马尔可夫模型得几个构成要素:
可见状态集:D6的可见状态集(1,2,3,4,5,6),D4的可见状态集(1,2,3,4
),D8的可见状态集(1,2,3,4,5,6,7,8)隐患状态集:上图中的隐含状态集
为D6,D8,D8,D6,D4……初始(隐含)状态转移概率:比如,第一次拿到D6,
您可能关注的文档
- [AI工具宝典]AI产品经理 VS 数据产品经理,看这5点区别与联系.pdf
- [AI工具宝典]AI产品经理,如何规划AI产品的MVP?.pdf
- [AI工具宝典]AI产品经理必懂的硬知识(一):应用领域篇.pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(EM算法).pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(贪心算法).pdf
- [AI工具宝典]AI产品经理必修——揭开算法的面纱(余弦定理).pdf
- [AI工具宝典]AI产品经理必知的两类ChatBot详解.pdf
- [AI工具宝典]AI产品经理的必修课:系统化思维.pdf
- [AI工具宝典]AI产品经理的关键性产品思维.pdf
- [AI工具宝典]AI产品经理的价值和未来|学习俞军老师分享有感.pdf
- 2024精简护肤洁面趋势报告-TMIC-30正式版.doc
- 2024捕捉华夏民族珍味-咸味主食与咸味零食创新机遇报告-25正式版.doc
- 2024年秋季部编版小学道德与法治二年级上册全册课件PPT最新.pptx
- 部编版第十一册第四单元拓展提高教学课件.ppt
- 2024年秋季新西师大版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册课件(新版教材).pptx
最近下载
- 《2024年甘肃省职业院校技能大赛中职学生组医药卫生类护理技能赛项样卷3》.pdf
- 双减背景下新课标单元整体作业分层设计案例 人教版小学数学四年级下册第五单元 三角形.docx
- 标准泳池砖的国家标准规格.doc
- 湘科版科学(2017)六年级上册全册全单元教学设计.doc
- 芜湖市湾沚区殡仪馆招聘考试真题及答案2024.docx
- 租房租赁合同电子版(8篇).pdf VIP
- 陕西师范大学-《比较教育学》(专升本)考评作业-含答案.pdf VIP
- 医院进修结业证书(模板).docx
- 专题03 规律探索及新定义问题(4大考点)2022-2024年中考数学真题分类汇编.docx VIP
- GB_T50649-2011《水利水电工程节能设计规范》 局部修订2024版.pdf VIP
文档评论(0)