
购物篮分析PPT课件.ppt
19页第五章第五章購物籃分析購物籃分析Market Basket Analysis雖然購物分析的主要資料來源是零售業,但是它仍然可以應用在其他的行業中:●如果消費者使用信用卡消費,我們將可以推知他 們下一項會購買的商品●電話使用者最常選用的附加功能,可以幫助我 們決定配套方案 ●消費者的常用銀行服務,可以幫助我們找出他 們會要的其他服務●異常的保險配套方式可能是詐欺的跡象,提醒 我們進行深入調查●依據患者的病歷,我們可以判定他們使用特定 治療方式發生併發症的可能機會 購物籃分析的三大特點購物籃分析的三大特點n n有用的 - 包含高品質的有效情報 ● ●在禮拜四,消費者通常同時購買尿布和啤在禮拜四,消費者通常同時購買尿布和啤 酒 n n明顯的 - 該行老手已經知道的事 ● ●消費者簽定維修協定後,通常會買大型家消費者簽定維修協定後,通常會買大型家 電用品 n n無法理解的 - 看起來沒有合理解釋的 ● ●當一個大型的五金行開幕後,最常賣出的當一個大型的五金行開幕後,最常賣出的 商品之一是馬桶蓋商品之一是馬桶蓋。
虛擬標籤虛擬標籤 (Virtual Items)n虛擬標籤可以幫助描述一筆交易,但它們並不是真的分類項n可以幫助比較差異nExample:健怡可樂低糖百事可樂<<低糖蘇打水>>可口可樂百事可樂<<蘇打水>>>>Confidence、、Support交易紀錄交易紀錄客戶客戶 商品商品 1 1 柳橙汁、蘇打飲料柳橙汁、蘇打飲料 2 2 牛奶、柳橙汁、玻璃清潔劑牛奶、柳橙汁、玻璃清潔劑 3 3 柳橙汁、清潔劑柳橙汁、清潔劑 4 4 柳橙汁、清潔劑、蘇打飲料柳橙汁、清潔劑、蘇打飲料 規律規律 條件條件 結果結果 •有蘇打飲料有蘇打飲料, , 必有柳橙汁必有柳橙汁 – – 100% 100%•有柳橙汁有柳橙汁 , , 必有蘇打飲料必有蘇打飲料 – 50%– 50%Confidence —在在A A事件發生的狀況下,同事件發生的狀況下,同時發生時發生A A、、B B事件的機率事件的機率= =條件機率條件機率 = = P(B∣ ∣A)Support—在所有事件發生的狀況下,在所有事件發生的狀況下,同時發生同時發生A、、B事件的機率事件的機率=P(B∩A)使用購物籃分析的基本流程使用購物籃分析的基本流程n選擇正確的組合 *組成的item是取決於各行業所需 *分類法 – 商品分類 *去除雜質 使用購物籃分析的基本流程使用購物籃分析的基本流程n計算超過門檻的商品 * Support - P(A∩B) * Confidence - P(BlA) 定義threshold 大小n分析機率取得規則 規則(如果 條件句,則 結論句)表表8.5 8.5 商品及其組合的機率:商品及其組合的機率:表表8.6 8.6 規則的信心水準規則的信心水準 信心水準最的就是最好的規則,所以我們似乎應該選「如果 B和C 則 A」。
但是這裡有點問題,這個規則事實上比隨便說A會出現在交易中還糟A在45%的交易中出現,但是該規則只有33%的信心水準,規則比隨便猜猜還糟 這種情況就要利用一技巧 -「增益」( Improvement ) 增益能告訴我們,一條規則在預測結果時能比隨機發生的機會好多少公式如下: 當增益效果大於1時,那麼最後的結果會在預期結困的基礎上比單純亂數好;但是當數值小於1時,效果就很差了表8.7顯示了三種規則的增益效果和最高增益的增益效果表表8.7 8.7 規則的規則的增益效果當增益效果小於1時,否定陳述句會引出一條比較好的規則例如:如果 B 和 C,則 A => 有0.33的信心水準;如果 B 和 C,則 ~A => 連續時間序列分析連續時間序列分析n n購物籃分析主要發生同一時間的事件,在特定時間點發生的事n n時間序列資料 (Time series data) 通常建立在顧客的基本資料上, 才能找出同一個人的不同交易紀錄跨時綜覽跨時綜覽 (Time Windows)n一般將一個月發生的交易全都簡化紀錄為單筆紀錄n可以幫助我們了解行為模式nExample: 滿 意:(存款、提款) 不滿意:(存款、提款、查詢餘額、 結算、取消帳戶)。
