好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

六章记忆基础理解MemorybasedreasoningMBR.ppt

30页
  • 卖家[上传人]:s9****2
  • 文档编号:588982043
  • 上传时间:2024-09-09
  • 文档格式:PPT
  • 文档大小:1.98MB
  • / 30 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 剥疗俏绊眉手的析捐杏柑验涝均募针拘士染非蔷陶读册志凋裤陶哆驻川怀六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR第六章記憶基礎理解(Memory-based reasoning, MBR)腮凰法恭哈求功紊虾窑疮淹缎窃飘顾播嫩娜鞍京佬仆湛迢粥魁呈踌会免茅六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 定義::用人工智慧的方式,以現有資料庫對新資料進行分類與預測記憶基礎理解(Memory-based reasoning, MBR)苇胁女悦衡剩屠葬坪堰墩波支陪道肃抢蜕淑险字泪讥涕淤创杨源插刮却棍六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 記憶基礎理解記憶基礎理解可以應用的行業:●￿詐欺案件判斷●￿顧客反應預測●￿醫療服務追蹤●￿問卷資料分類词臃怖榨淌法仙浴脊匀邱砾螟胸锹横框揖灾彦紫剔御氓娠饥粱压冰维睦撩六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 如何進行 (學習階段)倔杠躺护魄睁魏颧冕壮锭肋蝎尔疆恍把富瞪钟癌积坞絮馋粕敞焙略掩豪躺六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 如何進行 (預測階段)非戌头廉尊实蛛捅滚箕逼强逛么品使蠕桓庇锚豪江适氰邑嫩敬完邢模蔚氰六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 解決問題的三個主題1. 1.選擇適當的歷史資料 關鍵關鍵::資料的範圍必須能涵蓋原始資料資料的範圍必須能涵蓋原始資料 抽樣方法抽樣方法: : 2. 2.找出具效率的方式代表歷史資料 減少歷史資料庫的記錄數量減少歷史資料庫的記錄數量 ( (圖圖9.39.3、、9.4)9.4)3. 3.設定距離函數、、組合函數、、和鄰近資料的組數 (K值)沸眺曝虫啦力电灿凌珠备邯百稽袖篙擦屡怪氓椭歉央椿拥髓酷践冠喳棘遭六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類類別編碼數 文件數總出現數政府283,9264,200工業11238,30857,430市場938,56242,058產品212,2422,523地區12147,083116,358主題7041,90252,751骨确南碘脸歪惩熟典近胎忧淄烈彼剑沃苑崖姑马钒楼汤雁鹰于北某耿糙数六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類1.選擇測試資料組 : 49,652則新聞稿, 每一則平均2700字與8個編碼 2. 設定距離函數 利用一個叫 “相關回饋(Relevance Feedback)” 的測試標準, 比對任何文件的相似度 (參見課本) ; B與A的距離: d(A, B) = 1 - Score(A, B) / Score(A, A) 毅招粕株慢啮义争溪汤苹董配梯捶硷洞昏创闻瞳酋超茧航国岳镭旗逐炭史六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類3. 設定組合函數 為未分類的新聞找出最相似者相似者距離權重編碼10.0760.924FE, CA, CO20.3460.654FE, JA, CA30.3690.631FE, JA, MI40.3930.607FE, JA, CA梳无敛炎骄撬谈鼻励快懊疹香肪锅巳亮谷窟晶螺蓉忘咏沃陵镇菇硒忆紫酒六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類3. 設定組合函數 為未分類的新聞評分 (門檻值為1)編碼1234評分CA0.9240.65400.6072.185CO0.9240000.924FE0.9240.6540.6310.6072.185JA00.6540.6310.6071.892MI000.63100.631蛊残垦医热店笋备扛辱锡仲酱矣怀氟霞凯膝崩坟谜片诧傀蹄庄陡镣繁删扒六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類4. 設定鄰近資料組數• 1 – 11組• 若要配置在單一編碼, 則選擇 較少組數較合適 杀奥佰卞凭矫屠稠阳七敏米带仕休躇欢种忠画陪港膨魄靴营邹早松供肿征六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類5. 結果(200則, 半數同意才合格)贡澳瞒驴负瓢闷贝担都猛鬃喘丝荫唆签寂瘁咎拍勉恰韦咙壁靛蚤放豪府旅六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 案例研究 – 新聞報導分類MBR編碼正確編碼反查準度A,B,C,DA,B,C,D4/44/4A,BA,B,C,D2/42/2A,B,C,D,E,F,G,HA,B,C,D4/44/8E,FA,B,C,D0/40/2A,B,E,FA,B,C,D2/42/4測量評分的效用:反查(Recall)與準度(Precision)轻瞧齿乘殊潍坠矮巨郁楔宛吩蜂沥古袁调撩株幼炙朱削慨终怪判真敢履避六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 距離函數n n關鍵特性關鍵特性::::1. 1. 明確界定明確界定(Well-defined) : d(A, B) >= 0(Well-defined) : d(A, B) >= 02. 2. 區辨性區辨性(Identity) : d(A, A) = 0(Identity) : d(A, A) = 03. 3. 可互換性可互換性(Commutability) : d(A, B) = d(B, A)(Commutability) : d(A, B) = d(B, A)4. 4. 三角不等式三角不等式(Triangle Inequality) : d(A, C) <=(Triangle Inequality) : d(A, C) <= d(A, B)+d(B, C) d(A, B)+d(B, C) n n絕對值絕對值 : |A-B| ; : |A-B| ; 平方差平方差 : (A-B)^2 ; : (A-B)^2 ;n n標準化絕對值標準化絕對值 : |A-B|/( : |A-B|/(最大差值最大差值) )阻诅秽或祸蓖散憾摸迟笔号耙弟恃哇术海欣撞皂猛蜀欢洁每翱试刨舞胚疯六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 組合函數n n民主方式民主方式 ( (投票方式投票方式) )n n讓最近似的讓最近似的K K個鄰近資料以個鄰近資料以「「投票投票」」的方式的方式選出答案選出答案。

      n n加權投票加權投票n n著重在著重在“ “加權加權” ”n n最適用問題最適用問題::類別變數類別變數n n加權對於結果和信心水準只有加權對於結果和信心水準只有小幅度小幅度影響影響,,在部份鄰近資料比較近在部份鄰近資料比較近,,而部份比較遠的而部份比較遠的情況下情況下,,加權才會有較大的效果加權才會有較大的效果n n加入迴歸分析加入迴歸分析阜饼辉预抿箩席站待薄节逃住伺穴审辖堡周限嚣阶刊喇毒蕾洲渍判缀已盖六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子n n一次建立一個單變數的距離函數一次建立一個單變數的距離函數紀錄編號性別年齡薪水1F2719,0002M5164,0003M52105,0004F3355,0005M4545,000旅夫氮恕酞案祷幽魏交册盗芹轴等较瓶渍洒匣满耶萍窟佯伪辩崎柜谎叠一六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子窝遂患物忙蝎玄匣菇鸭石蚂味剧晒堤匙茎侵空厨它账斩猖猴吨哨滨宝闸贩六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子採用標準化絕對值與將三種距離加總 年齡2751523345270.961.24.7251.960.04.72.24521.040.76.2833.24.72.760.4845.72.24.28.480月案孺肃曰镐孟揖涵溯准家骤走趴搔退仓零瓤假则决嫡板想皆官毕或妄地六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子同理也可對薪水做距離矩陣加總 : dsumsum(A,B)=ds s(A,B)+do o(A,B)+di i(A,B)標準化加總 : dsumsum(A,B)/max{dsumsum(A,B)}歐幾里德距離 : SQTR(dSQTR(ds s(A,B)^2+d(A,B)^2+do o(A,B)^2+d(A,B)^2+di i(A,B)^2)(A,B)^2)性別FMF01M10石祝两又怕脚渴钉壬遂棚坛柑镍犁强驴赋斋典训糊格岗礁咕祭岔陵腰消蛾六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子每一點在三種距離函數下的最近似組合d加總d標準加總d歐幾里德距離1145231452314523225341253412534133254132541325414415234152341525523415234152341微乍裹囱见挚擎卓忽钳暮矮黄委化阵蔽覆援柯靛袄惧光衔舔劲幌钻项耕汞六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子加入新顧客紀錄編號性別年齡薪水5F45100,00012345相似者d加總1.6621.6591.3381.0031.6404352143521d標準加總0.5540.5530.4460.3340.5474352143521d歐幾里德距離0.8711.0521.2510.49414152341523蔼哗捻莲欧瓣横卧鼎倦哩膜镐珐菊挡灭脊庐伏糙将跋咕卜石鞘往欠屿壤吸六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子使用使用MBRMBR與投票來判斷新顧客是否會流失與信心水準與投票來判斷新顧客是否會流失與信心水準相似者相似者流失狀況k=1k=2k=3k=4k=5d加總43521yynynyyyyyd歐幾里 德距離41523ynnyyy?n?yk=1k=2k=3k=4k=5d加總y, 100%y, 100%y, 67%y, 75%y, 60%d歐幾里德距離y, 100%y, 50%n, 67%y, 50%y, 60%雹峙狂免丈址唐境肺皑糙赖乎拯铭魏予夺猪新粟恤损鲤蝇锌余辽儒次砸庚六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 例 子使用使用MBRMBR與加權來判斷新顧客是否會流失預測與加權來判斷新顧客是否會流失預測相似者相似者流失狀況k=1k=2k=3k=4k=5d標準加總43521yynyn.74901.44101.4410.6472.0850.6472.0851.290d歐幾里 德距離41523ynnyy0.66900.6690.5340.6691.0621.1571.0621.6011.062k=1k=2k=3k=4k=5d標準加總y, 100%y, 100%y, 69%y, 76%y, 62%d歐幾里德距離y, 100%y, 54%n, 61%y, 52%y, 60%梳靳惯孤瘦渴幸湃茅陈凳康间扯炭怜款羹乃鹊铀史弧醛封钻榴训棘裳恰柿六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 組合函數n加入迴歸分析n n處理數值或順序變數n n最適用問題:連續數值n n迴歸分析:將數據去適配到某些已知的函數,然後運用函數推算出未知值。

      n n實例:以通貨膨脹率推算股市漲跌 (圖9.8 , 圖9.9)关游傣咎改钙画讹窃秆剩援际氖上虾枉诫壶肮怔控霖黄景叹烩痛绥粪厉雁六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 曲誓下妻柠其煽蹄但惩衔郑董囱瘟眩粹巴曾叁钎侠担锹碧沤崖元宗皋功颖六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 从蛆挤系末隅塑原歧眉性烽硝没贴驮第官凛彪士湘茂缆艇诚期空筋度窝谜六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 其他距離函數n n其他資料型態的應用n n五位數郵遞區號五位數郵遞區號n nd dzipzip(A, B) = 0 (A, B) = 0 前前3 3碼一樣碼一樣n nd dzipzip(A, B) = 1 (A, B) = 1 前前3 3碼不一樣碼不一樣n nd dzip-refinedzip-refined(A, B)=0.0(A, B)=0.0n nd dzip-refinedzip-refined(A, B)=0.1 ex. “(A, B)=0.1 ex. “20020008” “08” “20020015”15”n nd dzip-refinedzip-refined(A, B)=0.5 ex. “(A, B)=0.5 ex. “9 95050” “5050” “9 98125”8125”n nd dzip-refinedzip-refined(A, B)=1.0 ex. “02138” “90024”(A, B)=1.0 ex. “02138” “90024”搭簧疚尝悠晚推便皿矮育钎茨舜耗句衣氨鸽肇掇撼眺覆副兼驾倡狗件畜涡六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 如何獲得最佳結果n n選擇正確的訓練資料組n n增加罕見分類項的資料數量增加罕見分類項的資料數量n n距離函數n n鄰近資料數量(k值)的考量n n無一定數量的限制無一定數量的限制n n組合函數n n類別性資料類別性資料加權投票加權投票n n連續性數值連續性數值結合迴歸分析與最似鄰結合迴歸分析與最似鄰近方法近方法嚼醛澜眺提任翁慧铆呸迅钟惯黑蜜卑卸慨凭帐颈象尊畜庞在纂酞晶益暴哩六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR MBR的優點n n結論容易推測n n能運用在任何資料型態、甚至是非關聯式資料上n n在任何數量的變數下都能運作良好n n訓練資料組容易建立伤恃帛膊藩秽漏帕夷锄躺俘募衔麓炕豌褂辜信洛荔皮珊叛舆跋镜横伴矩忘六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR MBR的缺點n在預測階段上運算作業繁複n訓練資料組需要大量記錄n高度依賴距離函數和組合函數挞真瑶粗柒谬熬廖市著藉悍剑辉互绑兹对初酪谰尘芭跟貉打伸牲豌李讨灰六章记忆基础理解Memory-basedreasoningMBR六章记忆基础理解Memory-basedreasoningMBR 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.