摘 要: 利用基于RFM模型的自組織特征映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Map,,SOM)對移動客戶進行細分,可以有效地解決各類別特征不明顯,、特征參數(shù)相互交錯,、非線性分布的類型識別問題。研究過程中將客戶的屬性劃分為近度,、頻度,、值度三個指標,模擬專家分類的功能,,根據(jù)各個客戶簇的特征進一步分析客戶的終身價值,,量化分析客戶的重要性。最后利用相關(guān)的市場營銷知識對各個客戶類別提出相應(yīng)的營銷策略方案,。
關(guān)鍵詞: SOM神經(jīng)網(wǎng)絡(luò),;RFM模型;移動通信,;客戶細分,;營銷策略
0 引言
客戶細分(Customer Segmentation)是指將一個大的客戶群體劃分成一個個細分群的動作[1]。常用的客戶分類算法主要有K-means聚類算法,、決策樹算法,、BP神經(jīng)網(wǎng)絡(luò)算法、粒子群優(yōu)化(PSO)算法和自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)算法,。本文采用基于RFM模型的SOM神經(jīng)網(wǎng)絡(luò)對移動客戶進行細分,。自組織特征映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Maps,SOM)是由芬蘭赫爾辛基大學(xué)神經(jīng)網(wǎng)絡(luò)專家Kohonen教授在1981年提出的,。Kohonen認為[2],,當神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時將會分為不同的區(qū)域,各區(qū)域?qū)斎肽J接凶詣油瓿刹煌捻憫?yīng)特征,即無導(dǎo)師的學(xué)習(xí)并自動聚類,。吳春旭等[3]曾利用SOM神經(jīng)網(wǎng)絡(luò)對電信客戶進行細分并證明分類的有效性,。林盛等[4]曾利用RFM的模型對客戶進行細分,并使用K-均值聚類法,,但K值需要事先給定,,而K值的選定非常難以估計。本文之所以選擇SOM神經(jīng)網(wǎng)絡(luò)對移動客戶進行細分,,主要有三個方面的原因,,一是它的性能比較好,可以處理大量的數(shù)據(jù)集,;二是它對孤立點不敏感[5],;三是它可以自動地進行權(quán)值的調(diào)整,同時通過優(yōu)化學(xué)習(xí)率,,使其快速收斂,。
近年來,關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究很廣泛,。楊于峰等[6]利用SOM神經(jīng)網(wǎng)絡(luò)對品牌丑聞在微博上的傳播進行分類預(yù)測,。他們直接將RFM模型進行細化,利用客戶的動態(tài)變化屬性進行聚類,。張靜[7]在基于SOM的變壓器故障診斷研究中,,與DGA方法進行比較,結(jié)果表明前者的分類結(jié)果準確且快速,。孫進進和王苗苗[8]將SOM神經(jīng)網(wǎng)絡(luò)對民用機場進行分類,,更好地分析各個機場的特性。張吉剛等[9]利用SOM神經(jīng)網(wǎng)絡(luò)對高校教師職稱進行評審,,使得評價結(jié)果更加客觀和準確,。由此可知,根據(jù)研究對象的特殊性,,可以建立RFM模型進行聚類,,也可以直接對RFM指標進行具體化后再聚類,其結(jié)果都證明了SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果的準確性和客觀性,。
1 移動通信行業(yè)客戶RFM商業(yè)模型
客戶分類的常用方法有基于指標組合和基于顧客利潤率的客戶分類方法[10],。Arthur Hughes研究指出客戶數(shù)據(jù)庫中的RFM是數(shù)據(jù)分析的最好指標,而RFM的細分依據(jù)又是客戶的消費行為,。因此,,本文選用RFM指標模型對移動客戶進行細分。RFM模型[11]中的三個常用指標分別為:近度(Recency),、頻度(Frequency),、值度(Monentary)。傳統(tǒng)的RFM模式中,近度指最近一次購買到現(xiàn)在的時間間隔,。頻度指一定時間內(nèi)的購買頻率,。值度指購買的金額。針對移動通信行業(yè)的特殊性,,本文改用客戶在六個月內(nèi)的繳費情況來代替客戶的消費行為,??蛻舻腞FM指標分別是最近一次繳費距離調(diào)查日的時間間隔,、繳費的次數(shù)以及繳費的總額。這樣選取代替指標的理由是:首先,,繳費時間間隔一般比較大,,用它代替消費近度,可以避免消費近度難以區(qū)別的問題,;其次,,消費頻度高但是繳費次數(shù)不是很多,用繳費次數(shù)代替消費的頻度可以減少對消費頻度統(tǒng)計的工作量,;最后,,客戶的消費總額等于繳費總額。以下是本文采用的RFM指標與傳統(tǒng)RFM指標的對比,,如表1所示,。
2 SOM建模
2.1 網(wǎng)絡(luò)模型
芬蘭學(xué)者T.Kohonen于1981年提出了SOM神經(jīng)網(wǎng)絡(luò)[2],并給出SOM神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)模型,。如圖1,。
由圖1可以看到,SOM神經(jīng)網(wǎng)絡(luò)是由輸入層和輸出層構(gòu)成,。輸入層的神經(jīng)元個數(shù)為n,,由輸入向量的維數(shù)決定。輸出層的神經(jīng)元個數(shù)為m,,一般按照二維點陣進行排列,。其中,輸入層和輸出層的神經(jīng)元之間通過權(quán)值進行全連接,,且輸出層的神經(jīng)元之間也相互通過權(quán)值連接,。
2.2 SOM神經(jīng)網(wǎng)絡(luò)的算法流程
SOM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)主要分為如下8個步驟:
(1)初始化[12],。首先,,將[0,1]區(qū)間內(nèi)的隨機值賦給神經(jīng)網(wǎng)絡(luò)的連接權(quán),,令i=1,,2,3,…,,N,,j=1,2,,3,,…,M,;其次,,確定學(xué)習(xí)率
(t)的初始值
(0)(0<
(0)<1);最后以獲勝神經(jīng)元C為中心確定學(xué)習(xí)領(lǐng)域Nc(t),,該區(qū)域一般是正方形或圓形區(qū)域[12],,如圖2所示。Nc(t)為第t次學(xué)習(xí)過程中該領(lǐng)域所包含的神經(jīng)元個數(shù),,設(shè)達到最優(yōu)結(jié)果時總的學(xué)習(xí)次數(shù)為T,。
(2)歸一化,。從訓(xùn)練數(shù)據(jù)集合中隨機抽取一個輸入向量(p=1,,2,3,,…,,n),n代表輸入模式的維數(shù),,也即輸入向量的變量個數(shù),。
(3)預(yù)處理神經(jīng)元之間的連接權(quán)值,,分別計算它們與輸入對應(yīng)向量之間的歐式距離djk,,把其中與
距離最小的神經(jīng)元C作為獲勝神經(jīng)元。
?。?)自動更新神經(jīng)元C的學(xué)習(xí)半徑,,調(diào)整輸出節(jié)點的連接權(quán)值向量,權(quán)值調(diào)整如下:
?。?)調(diào)整完成后輸入訓(xùn)練集合中下一個神經(jīng)網(wǎng)絡(luò)的矢量Xp+1,。
(6)令t=t+1,,更新學(xué)習(xí)率并選取另一組訓(xùn)練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,,返回步驟(3)繼續(xù)循環(huán)操作。
?。?)當t=T時,,結(jié)束訓(xùn)練算法,。
(8)輸入測試樣本,,如果預(yù)測結(jié)果輸出與期望結(jié)果基本一致,,則網(wǎng)絡(luò)訓(xùn)練成功并結(jié)束訓(xùn)練,否則重新調(diào)整網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)并繼續(xù)訓(xùn)練,。
最后,,SOM神經(jīng)網(wǎng)絡(luò)的輸出如下:
3 案例分析
3.1 Kohonen網(wǎng)絡(luò)的構(gòu)建
本文采用Kohonen網(wǎng)絡(luò)模型:輸入層節(jié)點數(shù)Inum=3,即輸入向量為三維,;競爭層呈二維方陣排列,,總節(jié)點數(shù)K=36;輸出層的節(jié)點數(shù)g=6,,即客戶類別數(shù),。初始化輸入層的學(xué)習(xí)率為rate1min=0.01,,rate1max=0.1,;初始化輸出層學(xué)習(xí)率rate2min=0.5,rate2max=1,;初始化學(xué)習(xí)半徑r1min=0.4,,r1max=0.5。輸入層神經(jīng)元與競爭層神經(jīng)元之間的連接權(quán)值1=rand(Inum,,k),,競爭層各個神經(jīng)元與輸出節(jié)點神經(jīng)元之間的連接權(quán)值
2=(K,g),,迭代次數(shù)maxgen=10 000,。計算最優(yōu)節(jié)點[mindist,index]=min(dist(x,,
1)),。
3.2 基于RFM模型客戶分類思想
基于RFM模型的客戶細分指導(dǎo)思想主要包括了以下六個步驟:
(1)根據(jù)專家分析結(jié)果確定RFM的權(quán)值[4],,[R,,
F,
M]=[0.221,,0.341,,0.439];
?。?)根據(jù)客戶的RFM權(quán)值進行加權(quán)和劃分,,并利用SOM的自動聚類功能得到多個客戶簇;
?。?)分別計算全部客戶的總RFM平均值和各個客戶簇的RFM平均值,;
?。?)把各個客戶簇的RFM平均值與全部客戶的RFM總平均值相比較,比較結(jié)果為小于或大于(等于)總平均值,,從而確定各個客戶簇的RFM的變動情況(大于(等于)的用“↑”表示,,小于的用“↓”表示);
?。?)借鑒現(xiàn)有的客戶分類方法,,根據(jù)每個客戶簇的RFM變動情況分析該類客戶的類型;
?。?)將確定好客戶類型的客戶數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)兩部分,,最后使用已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對未知客戶進行分類。
3.3 樣本客戶的分類結(jié)果
根據(jù)研究需要收集了廣西大學(xué)的3 200名移動用戶最近6個月的消費情況,,將采集的數(shù)據(jù)進行預(yù)處理后,,利用RFM各指標劃分客戶類別,接著將每類客戶的RFM各指標的平均值與總RFM平均值作比較,,通過對比得到每類客戶RFM的變動情況并確定客戶的類型,。將事先模擬專家分好類別的3 000份客戶數(shù)據(jù)作為訓(xùn)練樣本,另外200個作為預(yù)測樣本,。表2是訓(xùn)練樣本客戶的分類結(jié)果,。
3.4 網(wǎng)絡(luò)模型的測試和分類
3.4.1 測試
確定創(chuàng)建網(wǎng)絡(luò)模型的結(jié)構(gòu)后,利用MATLAB工具箱中的new函數(shù)建立一個SOM神經(jīng)網(wǎng)絡(luò),;將準備好的樣本輸入到網(wǎng)絡(luò)中,,利用train函數(shù)對網(wǎng)絡(luò)進行訓(xùn)練,用仿真函數(shù)sim對網(wǎng)絡(luò)進行預(yù)測輸出仿真,。利用事先模擬專家分好類別的200個測試數(shù)據(jù)進行網(wǎng)絡(luò)測試,,圖3和圖4分別為SOM網(wǎng)絡(luò)模型對200個預(yù)測樣本數(shù)據(jù)進行分類的結(jié)果圖和誤差分析圖。
圖3中,,黑色小圓圈表示網(wǎng)絡(luò)預(yù)測客戶類別,,黑色小星點表示模擬專家得到的客戶類別。當黑色小圓圈與黑色小星點重合時,,表明網(wǎng)絡(luò)預(yù)測輸出的結(jié)果與實際結(jié)果相一致,;反之亦然。由圖可知,,該SOM神經(jīng)網(wǎng)絡(luò)對客戶細分模型的預(yù)測輸出是有效的,。
3.4.2 對隨機輸入的未知客戶數(shù)據(jù)進行分類
確定該SOM神經(jīng)網(wǎng)絡(luò)已訓(xùn)練好之后,把2 000個未知類別的客戶數(shù)據(jù)投到該神經(jīng)網(wǎng)絡(luò)模型中分類,,最終確定客戶的類別,。如表3所示。
表3是該SOM神經(jīng)網(wǎng)絡(luò)對2 000個未知客戶進行分類的結(jié)果,,共分為五種客戶類型,,但該分類結(jié)果還無法確定各類客戶之間的價值和重要性的差別,。比如,對于客戶簇5,、6,,都是重要保持類客戶。這就需要分析各類客戶的終身價值[13],,并根據(jù)其大小進行排序,,以此作為客戶重要性分析的參考。顧客的終身價值運算公式為:
其中,,CIk是第k類客戶的RFM各指標加權(quán)后的總得分,,wR、wF,、wM分別表示R,、F、M指標的權(quán)值,,CRk,、CFk、CMk分別表示第k類客戶的R,、F,、M各指標標準化后的平均值,。RFM各指標的標準化運算公式為:
其中,,RL和RS分別表示指標R的最大和最小值,F(xiàn)和M的表示相類似,。
最后,,根據(jù)加權(quán)總分的大小對各類客戶進行排序,總分越大則表明客戶的終身價值越高,,忠誠度也越高,,客戶相對更重要。表4為客戶類別終身價值排序結(jié)果,。
由表4可知,,客戶簇6的排名第一,故客戶簇6是企業(yè)最具價值的客戶,;而客戶簇1的排名最后,,其價值最低??蛻舸?為重要發(fā)展客戶,,但因其價值無法立即顯現(xiàn),因而企業(yè)不應(yīng)將有限的資源過多地投到它身上,??蛻舸?的近度高,,但是值度很小,屬于忠誠度很低的客戶,,所以企業(yè)應(yīng)該讓其自然發(fā)展,。客戶簇3的終身價值排在第四,,它們的近度提高了,,同時值度也跟著提高,說明這類客戶對企業(yè)的信賴和忠誠在慢慢地提高,,企業(yè)可以適當?shù)貙ζ渫其N一些服務(wù)套餐,。客戶簇4的近度和頻度都在減小,,但是其值度增加,,同時它的終身價值排名居中,因此屬于忠誠度很高的客戶,,企業(yè)應(yīng)該重點挽留,。對于同一類別的客戶簇5和6,從表4可看出,,在客戶價值上客戶簇6大于客戶簇5,。企業(yè)應(yīng)該主動與這類客戶進行回訪,尤其是了解客戶簇6的需求,,提高該類客戶的忠誠度及消費金額,,為企業(yè)帶來更大的利潤。
4 總結(jié)與展望
本文利用移動客戶的RFM指標對其進行細分,,并分析各個客戶簇的特征,,在原有的分類基礎(chǔ)上進一步計算客戶的終身價值指標,并對每一類客戶的重要性進行排序,,根據(jù)其重要性排序得到了六類客戶,,并對這六類客戶分別提出了一些針對性的營銷建議,企業(yè)可以根據(jù)客戶的重要程度以及客戶的類型實施個性化的服務(wù)和營銷,。
但是,,本文的研究還有很多需要改進的地方。比如,,其中權(quán)值的調(diào)整只考慮了學(xué)習(xí)率及輸入模式與獲勝神經(jīng)元及其鄰域,,卻忽略了輸入模式分量與全體參與競爭的神經(jīng)元權(quán)值向量間的某種相關(guān)關(guān)系。因此,,本文的后續(xù)工作是在原有的基礎(chǔ)上改進和完善更適用于移動網(wǎng)絡(luò)客戶分類的神經(jīng)網(wǎng)絡(luò)算法,,使細分結(jié)果更加有效、準確,。
參考文獻
[1] 科特勒.市場營銷管理(上)[M].北京:中國人民大學(xué)出版社,,1996.
[2] KOHONEN T. Self-organized formation of topologically correct feature maps[J]. Biological Cybernetics,,1982, 43(1):59-69.
[3] 吳春旭,,鮑滿園,,茍清龍.自組織映射聚類算法在電信客戶細分中的應(yīng)用[J].計算機應(yīng)用,2010,,19(8):168-172.
[4] 林盛,,肖旭.基于RFM的電信客戶市場細分方法[J].哈爾濱工業(yè)大學(xué)學(xué)報,2006,,38(5):759-760.
[5] 呂昱,,程代杰.基于SOM的市場細分研究[J].計算機科學(xué),2005,,32(12):98-100.
[6] 楊于峰,,余偉萍,田盼.基于SOM神經(jīng)網(wǎng)絡(luò)的品牌丑聞微博傳播分類預(yù)測研究[J].情報雜志,,2013,,32(10):24-28.
[7] 張靜.基于SOM的變壓器故障診斷研究[J].電力學(xué)報,2014,,29(4):319-321.
[8] 孫進進,,王苗苗.基于SOM神經(jīng)網(wǎng)絡(luò)的民用機場分類方法[J].交通科技與經(jīng)濟,2013,,15(5):83-84.
[9] 張吉剛,,梁娜.SOM網(wǎng)絡(luò)在高校教師職稱評審中的應(yīng)用[J].計算機與數(shù)字工程,2013,,41(2):322-323.
[10] 陳伯成.自組織映射神經(jīng)網(wǎng)絡(luò)在客戶分類中的一種應(yīng)用[J].系統(tǒng)工程理論與實踐,,2004,24(3):9-14.
[11] CHEN Y L,, KUO M H, WU S Y,, et al. Discovering recency,, frequency, and monetary(RFM)sequential patterns from customers′ purchasing data[J]. Electronic Commerce Research and Applications,, 2009,,8(5):241-251.
[12] 聞新,周露,,王丹力,,等.Matlab神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計[M].北京:科學(xué)出版社,2002.
[13] 胡理增,,薛恒新,,于信陽.以客戶終身價值為準則的客戶重要程度識別系統(tǒng)[J].系統(tǒng)工程理論與實踐,,2005,25(11):80-85.