[文学研究]第13章人工智慧资料探勘与知识管理.ppt

[文学研究]第13章人工智慧资料探勘与知识管理.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[文学研究]第13章人工智慧资料探勘与知识管理

第13章 人工智慧、資料探勘 與知識管理 綱要 人工智慧的意義及應用範疇 人工智慧的兩大基本技術:搜尋和知識表達 資料探勘的意義和基本操作程序 七種常用資料探勘技術的特性和運作方法 知識的定義、分類和運作方式 知識管理的觀念、導入組織和評估 個案探討 智慧的定義 人接受外界刺激的「感官」能力,「影像的辨識」,「記憶」中「類似經驗的回想」,「推論」對方的動機,「規劃」自己應採取的反應,並付諸成「實際行動」等能力,都可以說是智慧的具體呈現。 簡言之,智慧包括了感官、學習、記憶、推理、規劃、行動等生物能力。 人工智慧的定義 人工智慧是資訊科學的一支,可簡單定義成所有關於探討如何將心智活動或行為自動化的科學,且強調的是進行相關方法論及演算法的研究 人工智慧的簡史 1943-1956 孕育期:人造神經元的模型 1952-1969 初始熱忱期 1969-1979 領域知識為主的系統發展期 1980-1988 工業實用期 1986~迄今 人工智慧的應用範疇 電腦遊戲 自動推論及定理證明 專家系統 自然語言處理和語意分析 人工效能模式的建立及模擬 機器人學(robotics)與規劃(planning) 機器學習 人工智慧處理技術 搜尋技術 :從狀態空間中,有系統、有效率地檢驗各種可能產生的狀態,設法找出最佳的一條瀏覽或處理路徑,以迅速達成事先設定的目標。 特定問題的狀態空間(state space)包含 1.在解問題過程中,所有可能發生的情況,這些情況也被稱為「狀態」。 2.在解問題過程中,所有可採行的合法步驟,這也同時定義了狀態間彼此轉變的關係。 3.起始狀態。 4.終止狀態,亦即目標。 知識的表達方式(一) 【邏輯形式】 ⅤX,rich(X) Λ handsome(X) → nubile(X) 有錢 且 帥 推得 適合結婚 【程序形式】 例如由一堆指令或常見的if…then法則,依序集合而成之檢驗條件、及執行的步驟,以表達出解決問題的運作過程,如一般的程式設計。 知識的表達方式(二) 【網路連接形式】 知識的表達方式(三) 【框架】 資料探勘的基本觀念 企業的焦點已從以往的資料整理與蒐集,轉變成如何有效的利用資料庫來進行資訊的獲取。 資料探勘就是放棄以往透過人類分析師主觀解讀的方式,而讓資料、數字自己說話,來呈現出最真實的一面 資料探勘的演進 1800年統計學的萌芽 1970年代專家系統及樣式識別(PR)理論的提出及系統實作 1980年歸納法則式的機器學習理論及關聯式資料庫的發展 1990年管理資訊系統(MIS)、及決策支援系統(DSS)陸續受到重視,專家學者開始探討如何有效地從資料庫中進行知識萃取(KDD) 1995年資料探勘名詞的出現 資料探勘的成功案例 IBM公司的Advanced Scout系統,自動分析NBA敵我球隊及球員的數據,以協助教練作出最佳化的戰術組合 加州理工學院噴氣推進實驗室與天文學家合作開發的SKICAT系統,成功幫助天文科學家發現遙遠的星體 芬蘭赫爾辛基大學計算機科學系研發的TASA,則可預測網路通信中的異常現象等等 資料探勘的程序 一.決定企業探勘資料的目的 二.相關領域知識的瞭解 三.資料收集與整合 四.使用適當的資料探勘技術 五.結果分析 六.知識應用 資料探勘的前置步驟 形成資料倉儲(Data Warehousing) 資料選取 資料清理(cleaning) 資料精簡和轉換 資料探勘的技術 1.資料方塊(Data Cube) 2.分類分析(Classification) 3.群集分析(Clustering Analysis) 4.聯結(關連)分析(Association Rule Analysis) 5.序列樣式相關分析(Sequential Pattern Analysis) 6.鏈結分析(Link Analysis) 7.時間序列相似性分析(Time Series Similarity Analysis) 資料方塊(一) 表 14-1 資料方塊(二) 資料方塊(三) Data Cube (資料方塊法) 資料方塊法的一般概念為具體化一些經常被要求的高成本計算 尤其是計數(count)、總計(sum)、求平均數(average)、取最大值(max)等函數 將具體化後的景觀儲存在一個資料方塊,可供決策支援、知識發現及其他應用做參考 3.群集分析 (K-MEANS ALGORITHM) 1.任意選擇k個樣本資料,作為一開始k群集的中心點,一般稱為種子。 2.對任一輸入資料,皆計算與此k個中心點的距離,並將此資料點指定到最近中心點的群集中,直到分派完畢。 3.計算每一群

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档