基于SOM神經(jīng)網(wǎng)絡(luò)的移動(dòng)客戶細(xì)分研究-AET-電子技術(shù)應(yīng)用

基于SOM神經(jīng)網(wǎng)絡(luò)的移動(dòng)客戶細(xì)分研究

2015年微型機(jī)與應(yīng)用第23期

胡桂莉，喻昕，黃秋嬋

（廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院，廣西南寧 530004）

摘要： 利用基于RFM模型的自組織特征映射神經(jīng)網(wǎng)絡(luò)（Self-Organizing Feature Map，SOM）對(duì)移動(dòng)客戶進(jìn)行細(xì)分，可以有效地解決各類別特征不明顯、特征參數(shù)相互交錯(cuò)、非線性分布的類型識(shí)別問題。研究過程中將客戶的屬性劃分為近度、頻度、值度三個(gè)指標(biāo)，模擬專家分類的功能，根據(jù)各個(gè)客戶簇的特征進(jìn)一步分析客戶的終身價(jià)值，量化分析客戶的重要性。最后利用相關(guān)的市場(chǎng)營(yíng)銷知識(shí)對(duì)各個(gè)客戶類別提出相應(yīng)的營(yíng)銷策略方案。

關(guān)鍵詞： SOM神經(jīng)網(wǎng)絡(luò) RFM模型移動(dòng)通信客戶細(xì)分

Abstract：

Key words :

　　摘要：利用基于RFM模型的自組織特征映射神經(jīng)網(wǎng)絡(luò)（Self-Organizing Feature Map，SOM）對(duì)移動(dòng)客戶進(jìn)行細(xì)分，可以有效地解決各類別特征不明顯、特征參數(shù)相互交錯(cuò)、非線性分布的類型識(shí)別問題。研究過程中將客戶的屬性劃分為近度、頻度、值度三個(gè)指標(biāo)，模擬專家分類的功能，根據(jù)各個(gè)客戶簇的特征進(jìn)一步分析客戶的終身價(jià)值，量化分析客戶的重要性。最后利用相關(guān)的市場(chǎng)營(yíng)銷知識(shí)對(duì)各個(gè)客戶類別提出相應(yīng)的營(yíng)銷策略方案。

　　關(guān)鍵詞： SOM神經(jīng)網(wǎng)絡(luò)；RFM模型；移動(dòng)通信；客戶細(xì)分；營(yíng)銷策略

0 引言

　　客戶細(xì)分（Customer Segmentation）是指將一個(gè)大的客戶群體劃分成一個(gè)個(gè)細(xì)分群的動(dòng)作[1]。常用的客戶分類算法主要有K-means聚類算法、決策樹算法、BP神經(jīng)網(wǎng)絡(luò)算法、粒子群優(yōu)化（PSO）算法和自組織特征映射神經(jīng)網(wǎng)絡(luò)（SOM）算法。本文采用基于RFM模型的SOM神經(jīng)網(wǎng)絡(luò)對(duì)移動(dòng)客戶進(jìn)行細(xì)分。自組織特征映射神經(jīng)網(wǎng)絡(luò)（Self-Organizing Feature Maps，SOM）是由芬蘭赫爾辛基大學(xué)神經(jīng)網(wǎng)絡(luò)專家Kohonen教授在1981年提出的。Kohonen認(rèn)為[2]，當(dāng)神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時(shí)將會(huì)分為不同的區(qū)域，各區(qū)域?qū)斎肽Ｊ接凶詣?dòng)完成不同的響應(yīng)特征，即無導(dǎo)師的學(xué)習(xí)并自動(dòng)聚類。吳春旭等[3]曾利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)電信客戶進(jìn)行細(xì)分并證明分類的有效性。林盛等[4]曾利用RFM的模型對(duì)客戶進(jìn)行細(xì)分，并使用K-均值聚類法，但K值需要事先給定，而K值的選定非常難以估計(jì)。本文之所以選擇SOM神經(jīng)網(wǎng)絡(luò)對(duì)移動(dòng)客戶進(jìn)行細(xì)分，主要有三個(gè)方面的原因，一是它的性能比較好，可以處理大量的數(shù)據(jù)集；二是它對(duì)孤立點(diǎn)不敏感[5]；三是它可以自動(dòng)地進(jìn)行權(quán)值的調(diào)整，同時(shí)通過優(yōu)化學(xué)習(xí)率，使其快速收斂。

　　近年來，關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究很廣泛。楊于峰等[6]利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)品牌丑聞在微博上的傳播進(jìn)行分類預(yù)測(cè)。他們直接將RFM模型進(jìn)行細(xì)化，利用客戶的動(dòng)態(tài)變化屬性進(jìn)行聚類。張靜[7]在基于SOM的變壓器故障診斷研究中，與DGA方法進(jìn)行比較，結(jié)果表明前者的分類結(jié)果準(zhǔn)確且快速。孫進(jìn)進(jìn)和王苗苗[8]將SOM神經(jīng)網(wǎng)絡(luò)對(duì)民用機(jī)場(chǎng)進(jìn)行分類，更好地分析各個(gè)機(jī)場(chǎng)的特性。張吉?jiǎng)偟萚9]利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)高校教師職稱進(jìn)行評(píng)審，使得評(píng)價(jià)結(jié)果更加客觀和準(zhǔn)確。由此可知，根據(jù)研究對(duì)象的特殊性，可以建立RFM模型進(jìn)行聚類，也可以直接對(duì)RFM指標(biāo)進(jìn)行具體化后再聚類，其結(jié)果都證明了SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果的準(zhǔn)確性和客觀性。

1 移動(dòng)通信行業(yè)客戶RFM商業(yè)模型

　　客戶分類的常用方法有基于指標(biāo)組合和基于顧客利潤(rùn)率的客戶分類方法[10]。Arthur Hughes研究指出客戶數(shù)據(jù)庫(kù)中的RFM是數(shù)據(jù)分析的最好指標(biāo)，而RFM的細(xì)分依據(jù)又是客戶的消費(fèi)行為。因此，本文選用RFM指標(biāo)模型對(duì)移動(dòng)客戶進(jìn)行細(xì)分。RFM模型[11]中的三個(gè)常用指標(biāo)分別為：近度（Recency）、頻度（Frequency）、值度（Monentary）。傳統(tǒng)的RFM模式中，近度指最近一次購(gòu)買到現(xiàn)在的時(shí)間間隔。頻度指一定時(shí)間內(nèi)的購(gòu)買頻率。值度指購(gòu)買的金額。針對(duì)移動(dòng)通信行業(yè)的特殊性，本文改用客戶在六個(gè)月內(nèi)的繳費(fèi)情況來代替客戶的消費(fèi)行為。客戶的RFM指標(biāo)分別是最近一次繳費(fèi)距離調(diào)查日的時(shí)間間隔、繳費(fèi)的次數(shù)以及繳費(fèi)的總額。這樣選取代替指標(biāo)的理由是：首先，繳費(fèi)時(shí)間間隔一般比較大，用它代替消費(fèi)近度，可以避免消費(fèi)近度難以區(qū)別的問題；其次，消費(fèi)頻度高但是繳費(fèi)次數(shù)不是很多，用繳費(fèi)次數(shù)代替消費(fèi)的頻度可以減少對(duì)消費(fèi)頻度統(tǒng)計(jì)的工作量；最后，客戶的消費(fèi)總額等于繳費(fèi)總額。以下是本文采用的RFM指標(biāo)與傳統(tǒng)RFM指標(biāo)的對(duì)比，如表1所示。

2 SOM建模

　　2.1 網(wǎng)絡(luò)模型

　　芬蘭學(xué)者T．Kohonen于1981年提出了SOM神經(jīng)網(wǎng)絡(luò)[2]，并給出SOM神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)模型。如圖1。

　　由圖1可以看到，SOM神經(jīng)網(wǎng)絡(luò)是由輸入層和輸出層構(gòu)成。輸入層的神經(jīng)元個(gè)數(shù)為n，由輸入向量的維數(shù)決定。輸出層的神經(jīng)元個(gè)數(shù)為m，一般按照二維點(diǎn)陣進(jìn)行排列。其中，輸入層和輸出層的神經(jīng)元之間通過權(quán)值進(jìn)行全連接，且輸出層的神經(jīng)元之間也相互通過權(quán)值連接。

　　2.2 SOM神經(jīng)網(wǎng)絡(luò)的算法流程

　　SOM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)主要分為如下8個(gè)步驟：

　　（1）初始化[12]。首先，將[0，1]區(qū)間內(nèi)的隨機(jī)值賦給神經(jīng)網(wǎng)絡(luò)的連接權(quán) $`37OH_6X{_7{PL6WD6AGW5U.png$ ，令i=1，2，3，…，N，j=1，2，3，…，M；其次，確定學(xué)習(xí)率 []}THHVTEK82TXLLGQX%2BN.jpg （t）的初始值（0）（0<（0）<1）；最后以獲勝神經(jīng)元C為中心確定學(xué)習(xí)領(lǐng)域Nc（t），該區(qū)域一般是正方形或圓形區(qū)域[12]，如圖2所示。Nc（t）為第t次學(xué)習(xí)過程中該領(lǐng)域所包含的神經(jīng)元個(gè)數(shù)，設(shè)達(dá)到最優(yōu)結(jié)果時(shí)總的學(xué)習(xí)次數(shù)為T。

　　（2）歸一化。從訓(xùn)練數(shù)據(jù)集合中隨機(jī)抽取一個(gè)輸入向量 LOEF4PDTY`4$H2)[VF~_4%B.jpg （p=1，2，3，…，n），n代表輸入模式的維數(shù)，也即輸入向量的變量個(gè)數(shù)。

　　（3）預(yù)處理神經(jīng)元之間的連接權(quán)值 544JN8[ZEZ{$PY@~KEG~E]3.jpg ~F8S7}DFF4Y1NXK1R%9]~Z2.png ，分別計(jì)算它們與輸入對(duì)應(yīng)向量之間的歐式距離djk，把其中與 LOEF4PDTY`4$H2)[VF~_4%B.jpg 距離最小的神經(jīng)元C作為獲勝神經(jīng)元。

　　（4）自動(dòng)更新神經(jīng)元C的學(xué)習(xí)半徑，調(diào)整輸出節(jié)點(diǎn)的連接權(quán)值向量，權(quán)值調(diào)整如下：

　　（5）調(diào)整完成后輸入訓(xùn)練集合中下一個(gè)神經(jīng)網(wǎng)絡(luò)的矢量Xp+1。

　　（6）令t=t+1，更新學(xué)習(xí)率并選取另一組訓(xùn)練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，返回步驟（3）繼續(xù)循環(huán)操作。

　　（7）當(dāng)t=T時(shí)，結(jié)束訓(xùn)練算法。

　　（8）輸入測(cè)試樣本，如果預(yù)測(cè)結(jié)果輸出與期望結(jié)果基本一致，則網(wǎng)絡(luò)訓(xùn)練成功并結(jié)束訓(xùn)練，否則重新調(diào)整網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)并繼續(xù)訓(xùn)練。

　　最后，SOM神經(jīng)網(wǎng)絡(luò)的輸出如下：

3 案例分析

　　3.1 Kohonen網(wǎng)絡(luò)的構(gòu)建

　　本文采用Kohonen網(wǎng)絡(luò)模型：輸入層節(jié)點(diǎn)數(shù)Inum=3，即輸入向量為三維；競(jìng)爭(zhēng)層呈二維方陣排列，總節(jié)點(diǎn)數(shù)K=36；輸出層的節(jié)點(diǎn)數(shù)g=6，即客戶類別數(shù)。初始化輸入層的學(xué)習(xí)率為rate1min=0.01，rate1max=0.1；初始化輸出層學(xué)習(xí)率rate2min=0.5，rate2max=1；初始化學(xué)習(xí)半徑r1min=0.4，r1max=0.5。輸入層神經(jīng)元與競(jìng)爭(zhēng)層神經(jīng)元之間的連接權(quán)值 _V(X(`21PTFYGGR2]0L[~JX.jpg 1=rand（Inum，k），競(jìng)爭(zhēng)層各個(gè)神經(jīng)元與輸出節(jié)點(diǎn)神經(jīng)元之間的連接權(quán)值2=（K，g），迭代次數(shù)maxgen=10 000。計(jì)算最優(yōu)節(jié)點(diǎn)[mindist，index]=min（dist（x， _V(X(`21PTFYGGR2]0L[~JX.jpg 1））。

　　3.2 基于RFM模型客戶分類思想

　　基于RFM模型的客戶細(xì)分指導(dǎo)思想主要包括了以下六個(gè)步驟：

　　（1）根據(jù)專家分析結(jié)果確定RFM的權(quán)值[4]，[ _V(X(`21PTFYGGR2]0L[~JX.jpg R，F，M]=[0.221，0.341，0.439]；

　　（2）根據(jù)客戶的RFM權(quán)值進(jìn)行加權(quán)和劃分，并利用SOM的自動(dòng)聚類功能得到多個(gè)客戶簇；

　　（3）分別計(jì)算全部客戶的總RFM平均值和各個(gè)客戶簇的RFM平均值；

　　（4）把各個(gè)客戶簇的RFM平均值與全部客戶的RFM總平均值相比較，比較結(jié)果為小于或大于（等于）總平均值，從而確定各個(gè)客戶簇的RFM的變動(dòng)情況（大于（等于）的用“↑”表示，小于的用“↓”表示）；

　　（5）借鑒現(xiàn)有的客戶分類方法，根據(jù)每個(gè)客戶簇的RFM變動(dòng)情況分析該類客戶的類型；

　　（6）將確定好客戶類型的客戶數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)兩部分，最后使用已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)未知客戶進(jìn)行分類。

　　3.3 樣本客戶的分類結(jié)果

　　根據(jù)研究需要收集了廣西大學(xué)的3 200名移動(dòng)用戶最近6個(gè)月的消費(fèi)情況，將采集的數(shù)據(jù)進(jìn)行預(yù)處理后，利用RFM各指標(biāo)劃分客戶類別，接著將每類客戶的RFM各指標(biāo)的平均值與總RFM平均值作比較，通過對(duì)比得到每類客戶RFM的變動(dòng)情況并確定客戶的類型。將事先模擬專家分好類別的3 000份客戶數(shù)據(jù)作為訓(xùn)練樣本，另外200個(gè)作為預(yù)測(cè)樣本。表2是訓(xùn)練樣本客戶的分類結(jié)果。

　　3.4 網(wǎng)絡(luò)模型的測(cè)試和分類

　　3.4.1 測(cè)試

　　確定創(chuàng)建網(wǎng)絡(luò)模型的結(jié)構(gòu)后，利用MATLAB工具箱中的new函數(shù)建立一個(gè)SOM神經(jīng)網(wǎng)絡(luò)；將準(zhǔn)備好的樣本輸入到網(wǎng)絡(luò)中，利用train函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，用仿真函數(shù)sim對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)輸出仿真。利用事先模擬專家分好類別的200個(gè)測(cè)試數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)測(cè)試，圖3和圖4分別為SOM網(wǎng)絡(luò)模型對(duì)200個(gè)預(yù)測(cè)樣本數(shù)據(jù)進(jìn)行分類的結(jié)果圖和誤差分析圖。

　　圖3中，黑色小圓圈表示網(wǎng)絡(luò)預(yù)測(cè)客戶類別，黑色小星點(diǎn)表示模擬專家得到的客戶類別。當(dāng)黑色小圓圈與黑色小星點(diǎn)重合時(shí)，表明網(wǎng)絡(luò)預(yù)測(cè)輸出的結(jié)果與實(shí)際結(jié)果相一致；反之亦然。由圖可知，該SOM神經(jīng)網(wǎng)絡(luò)對(duì)客戶細(xì)分模型的預(yù)測(cè)輸出是有效的。

　　3.4.2 對(duì)隨機(jī)輸入的未知客戶數(shù)據(jù)進(jìn)行分類

　　確定該SOM神經(jīng)網(wǎng)絡(luò)已訓(xùn)練好之后，把2 000個(gè)未知類別的客戶數(shù)據(jù)投到該神經(jīng)網(wǎng)絡(luò)模型中分類，最終確定客戶的類別。如表3所示。

　　表3是該SOM神經(jīng)網(wǎng)絡(luò)對(duì)2 000個(gè)未知客戶進(jìn)行分類的結(jié)果，共分為五種客戶類型，但該分類結(jié)果還無法確定各類客戶之間的價(jià)值和重要性的差別。比如，對(duì)于客戶簇5、6，都是重要保持類客戶。這就需要分析各類客戶的終身價(jià)值[13]，并根據(jù)其大小進(jìn)行排序，以此作為客戶重要性分析的參考。顧客的終身價(jià)值運(yùn)算公式為：

　　其中，CIk是第k類客戶的RFM各指標(biāo)加權(quán)后的總得分，wR、wF、wM分別表示R、F、M指標(biāo)的權(quán)值，CRk、CFk、CMk分別表示第k類客戶的R、F、M各指標(biāo)標(biāo)準(zhǔn)化后的平均值。RFM各指標(biāo)的標(biāo)準(zhǔn)化運(yùn)算公式為：

　　其中，RL和RS分別表示指標(biāo)R的最大和最小值，F(xiàn)和M的表示相類似。

　　最后，根據(jù)加權(quán)總分的大小對(duì)各類客戶進(jìn)行排序，總分越大則表明客戶的終身價(jià)值越高，忠誠(chéng)度也越高，客戶相對(duì)更重要。表4為客戶類別終身價(jià)值排序結(jié)果。

　　由表4可知，客戶簇6的排名第一，故客戶簇6是企業(yè)最具價(jià)值的客戶；而客戶簇1的排名最后，其價(jià)值最低。客戶簇1為重要發(fā)展客戶，但因其價(jià)值無法立即顯現(xiàn)，因而企業(yè)不應(yīng)將有限的資源過多地投到它身上。客戶簇2的近度高，但是值度很小，屬于忠誠(chéng)度很低的客戶，所以企業(yè)應(yīng)該讓其自然發(fā)展。客戶簇3的終身價(jià)值排在第四，它們的近度提高了，同時(shí)值度也跟著提高，說明這類客戶對(duì)企業(yè)的信賴和忠誠(chéng)在慢慢地提高，企業(yè)可以適當(dāng)?shù)貙?duì)其推銷一些服務(wù)套餐。客戶簇4的近度和頻度都在減小，但是其值度增加，同時(shí)它的終身價(jià)值排名居中，因此屬于忠誠(chéng)度很高的客戶，企業(yè)應(yīng)該重點(diǎn)挽留。對(duì)于同一類別的客戶簇5和6，從表4可看出，在客戶價(jià)值上客戶簇6大于客戶簇5。企業(yè)應(yīng)該主動(dòng)與這類客戶進(jìn)行回訪，尤其是了解客戶簇6的需求，提高該類客戶的忠誠(chéng)度及消費(fèi)金額，為企業(yè)帶來更大的利潤(rùn)。

4 總結(jié)與展望

　　本文利用移動(dòng)客戶的RFM指標(biāo)對(duì)其進(jìn)行細(xì)分，并分析各個(gè)客戶簇的特征，在原有的分類基礎(chǔ)上進(jìn)一步計(jì)算客戶的終身價(jià)值指標(biāo)，并對(duì)每一類客戶的重要性進(jìn)行排序，根據(jù)其重要性排序得到了六類客戶，并對(duì)這六類客戶分別提出了一些針對(duì)性的營(yíng)銷建議，企業(yè)可以根據(jù)客戶的重要程度以及客戶的類型實(shí)施個(gè)性化的服務(wù)和營(yíng)銷。

　　但是，本文的研究還有很多需要改進(jìn)的地方。比如，其中權(quán)值的調(diào)整只考慮了學(xué)習(xí)率及輸入模式與獲勝神經(jīng)元及其鄰域，卻忽略了輸入模式分量與全體參與競(jìng)爭(zhēng)的神經(jīng)元權(quán)值向量間的某種相關(guān)關(guān)系。因此，本文的后續(xù)工作是在原有的基礎(chǔ)上改進(jìn)和完善更適用于移動(dòng)網(wǎng)絡(luò)客戶分類的神經(jīng)網(wǎng)絡(luò)算法，使細(xì)分結(jié)果更加有效、準(zhǔn)確。

參考文獻(xiàn)

　　[1] 科特勒．市場(chǎng)營(yíng)銷管理（上）[M]．北京：中國(guó)人民大學(xué)出版社，1996.

　　[2] KOHONEN T． Self-organized formation of topologically correct feature maps[J]． Biological Cybernetics，1982， 43（1）：59-69.

　　[3] 吳春旭，鮑滿園，茍清龍．自組織映射聚類算法在電信客戶細(xì)分中的應(yīng)用[J]．計(jì)算機(jī)應(yīng)用，2010，19（8）：168-172.

　　[4] 林盛，肖旭．基于RFM的電信客戶市場(chǎng)細(xì)分方法[J]．哈爾濱工業(yè)大學(xué)學(xué)報(bào)，2006，38（5）：759-760.

　　[5] 呂昱，程代杰．基于SOM的市場(chǎng)細(xì)分研究[J]．計(jì)算機(jī)科學(xué)，2005，32（12）：98-100.

　　[6] 楊于峰，余偉萍，田盼．基于SOM神經(jīng)網(wǎng)絡(luò)的品牌丑聞微博傳播分類預(yù)測(cè)研究[J]．情報(bào)雜志，2013，32（10）：24-28.

　　[7] 張靜．基于SOM的變壓器故障診斷研究[J]．電力學(xué)報(bào)，2014，29（4）：319-321.

　　[8] 孫進(jìn)進(jìn)，王苗苗．基于SOM神經(jīng)網(wǎng)絡(luò)的民用機(jī)場(chǎng)分類方法[J]．交通科技與經(jīng)濟(jì)，2013，15（5）：83-84.

　　[9] 張吉?jiǎng)偅耗龋甋OM網(wǎng)絡(luò)在高校教師職稱評(píng)審中的應(yīng)用[J]．計(jì)算機(jī)與數(shù)字工程，2013，41（2）：322-323.

　　[10] 陳伯成．自組織映射神經(jīng)網(wǎng)絡(luò)在客戶分類中的一種應(yīng)用[J]．系統(tǒng)工程理論與實(shí)踐，2004，24（3）：9-14.

　　[11] CHEN Y L， KUO M H， WU S Y， et al． Discovering recency， frequency， and monetary（RFM）sequential patterns from customers′ purchasing data[J]． Electronic Commerce Research and Applications， 2009，8（5）：241-251.

　　[12] 聞新，周露，王丹力，等．Matlab神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M]．北京：科學(xué)出版社，2002.

　　[13] 胡理增，薛恒新，于信陽(yáng)．以客戶終身價(jià)值為準(zhǔn)則的客戶重要程度識(shí)別系統(tǒng)[J]．系統(tǒng)工程理論與實(shí)踐，2005，25（11）：80-85.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容