BOSS解決方案分為業務支持系統和操作支持系統。主要組成包括網絡管理、系統管理、賬單、信息載體內部聯系的解決、計費以及客戶服務。隨著運營網絡系統、綜合業務系統、計費系統和辦公自動化系統等相繼投入使用,運營商積累了大量的歷史數據。
但在很多情況下,這些海量數據在原有的作業系統中無法得到提煉,使之升華為有用的信息。原因主要有兩方面:一是聯機作業系統因為需要保留足夠的詳細數據以備查詢而變得笨重不堪,系統資源的投資跟不上業務擴展的需要;二是管理者和決策者只能根據固定的、定時的報表系統獲得有限的業務信息,無法適應當今電信領域激烈的市場競爭。
而數據挖掘,就是從海量的數據中,抽取出潛在的、有價值的知識(模型或規則)的過程。也就是根據預定義的商業目標,對大量的企業數據進行探索和分析,揭示其中隱含的商業規律,并進一步將其模型化的先進有效技術過程。
現階段數據挖掘側重市場分析
數據挖掘技術在電信BOSS領域的應用大致分為幾個方面,主要有:一是基于呼叫詳細記錄的呼叫/計費分析;二是基于產品和銷售的營銷/效益分析;三是基于網管業務管理和事務管理層的運行/維護分析。前兩種與電信運營企業的業務運營和市場競爭密切相關,是目前主要運營商發展的重點。而針對網管和運行維護的分析對于提高設備的運行質量和服務質量起到非常關鍵的作用,是運營商內部下一步實施的重點。我們主要著重于前兩個方面進行分析研究。
客戶發展分析管理
客戶管理應用的目的是根據客戶的屬性(包括自然屬性和行為屬性),從不同角度深層次分析客戶,從而達到了解客戶的目的。針對不同的客戶采取不同的促銷活動以及提供更好和更有針對性的服務,分析的主要指標包括客戶總量分析、新增客戶分析、客戶流失分析、客戶行為分析、客戶信用度分析、客戶風險分析等等。以此增加新的客戶、提高客戶的忠誠度、降低客戶流失率、提高客戶消費額度等。
業務收入分析
包括業務總量分析、業務增長和流失分析、收入總量及變化分析、繳費及欠費分析等。業務量的綜合分析,是按照不同的地域、客戶特征、消費層次、呼叫類型、漫游類型等角度對客戶的業務量及其增量、新業務的使用量進行分析,以了解不同業務量的客戶構成、業務量的變化與發展趨勢。通過分析客戶的繳費情況,能夠清楚了解不同客戶繳費的及時率、欠費情況等,所喜歡的繳費渠道等,從而推出有針對性的繳費政策,提高繳費及時率,減少話費流失。
營銷管理分析
營銷管理業務范圍包括了解客戶、電信市場、客戶對產品的需求,以及提供如何建立并推銷產品或服務給目標客戶群等。通過對服務質量的分析,能夠了解目前客戶最關心的問題,通過將客戶流失和服務質量結合起來分析,能夠清楚客戶為什么會流失以及什么因素會導致客戶流失,從而有針對性地提高服務質量,采取相應措施,以減少客戶流失量。
BOSS系統數據挖掘實例
本文主要針對電信的BOSS解決方案進行研究,實際應用中的數據倉庫是Oracle,現針對Oracle數據庫進行闡述:
1.選擇數據源
存放于運營商操作型數據庫OLTP中(通常存放在RDBMS中)的各種業務數據和辦公自動化(OA)系統包含的各類文檔數據以及各類法律法規、市場信息、競爭對手的信息以及各類外部統計數據。如:客戶檔案信息,話費清單,優惠規則,其他運營商的經營報告等。
2.建立數據倉庫或數據集市
按照分析主題進行重新組織,建立主題事物表(包含用于分析的測量值和連接維表的主鍵),包含有關維表(含維屬性值和與事實表連接的代理鍵)的星型結構或多維數據庫,最終確定數據倉庫的物理存儲結構,同時組織存儲數據倉庫元數據,以支持用戶多角度、多層次的分析,發現數據趨勢。其具體實現可以分為:ROLAP、MOLAP和HOLAP。ROLAP基本數據和聚合數據均存放在RDBMS之中;MOLAP基本數據和聚合數據均存放于多維數據庫中;而HOLAP是ROLAP與MOLAP的綜合,基本數據存放于RDBMS之中,聚合數據存放于多維數據庫中,這是一個系統工程,是一個不斷建立、發展、完善的過程,需要較長的時間。
3.利用數據倉庫技術進行第一級數據挖掘
分類即區分數據類別。首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對未分類的數據進行分類。而估值與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理的是連續值的輸出,同時分類的類別是確定數目的,估值的量是不確定的。由于電信業務原因,沒有估值,僅進行分類,可以從中產生數據分布圖(散布圖)。對于關系模型,利用DISCOVERER進行分類,鉆取,數據過濾,分層次數據選取,建立相應的報表格式,為二級挖掘提供數據;對于多維數組模型表示的結構,發揮EXPRESS工具的便于針對矩陣運算的優勢進行操作。
4.在數據倉庫基礎上,利用相關的統計分析理論建立數學模型,進行第二級數據挖掘 。
第一,預測,即是對未來未知變量的預測,這種預測是需要時間來驗證的,即必須經過一定時間后,才知道預言準確性是多少。主要利用時間序列分析,線性分析,回歸分析,多元統計分析,灰色預測等方法進行。例如:業務收入預測,客戶風險預測,業務實施情況預測等。
第二,關聯規則和聚類,通過分析數據或記錄間的關聯程度,決定哪些事情將一起發生。將記錄分組,把相似的記錄在一個聚集(反映數據之間的關系)里。聚集和分類的區別是聚類不依賴于預先定義好的類,不需要訓練集。如相關業務密切程度分析等。
5.給出分析結論
利用決策樹,神經元網絡,灰色決策等方法進行決策分析。
6.代入實際數據,進行一致性驗證
不斷校驗誤差,修正模型,提高精確度,進行效果監控,優化分析結果,同時修改相應的決策行為。比如:一段時間某兩項業務關聯度高,然后出現異常,關聯度降低,那么在轉折點的分析將出現較大偏差,因此要進行連續的檢驗,以保證及時發現問題,修訂策略。