1引言
數據倉庫主要是由數據抽取、數據倉庫和數據倉庫日常維護系統三個部分組成。其中數據倉庫存儲元數據和用于決策分析相關的數據。元數據是數據倉庫的核心,它是描述數據的數據,用于存儲數據模型和定義數據結構、轉換規則、倉庫結構、控制信息等。數據倉庫日常維護包括數據的安全、歸納、備份、恢復等工作,而這些工作就需要利用數據庫管理系統(DBMS)的功能。應用層是建立在數據倉庫基礎之上的,它主要由聯機分析處理(OLAP,Online Analytical Protess)應用分析和數據挖掘兩部分組成[2]。決策者主要是利用決策支持工具,從數據倉庫中獲取準確科學的信息,進而做出科學性的決策。
2
CRM數據倉庫項目概述
CRM是指通過有效地管理客戶信息資源,為客戶提供滿意的產品和服務,同時與客戶建立起長期、穩定、相互信任的密切關系,為企業吸引新客戶,鎖定老客戶,提供效益和競爭優勢。它是企業“以產品為中心模式”向“以客戶為中心模式”轉移的必然結果。企業CRM的價值主要是在于以客戶為中心,所以,企業在實施CRM的過程中除了利用先進的信通信技術將客戶信息傳遞給企業之外,還需要對客戶信息進行分析、處理。
最近幾年來,被廣泛地應用在企業CRM中的數據倉庫,也取得了一定地效果。但是,傳統的CRM數據倉庫大都是基于C/S構架的,其在實際運用過程中存在著一定的弊端。但隨著數據倉庫技術及Web技術的飛速發展,將二種技術進行結合已成為可能,那就是基于Web的數據倉庫技術。基于Web的數據倉庫技術為解決傳統C/S模式的企業CRM數據倉庫的問題提供了解決方案。
3基于WEB的企業CRM數據倉庫的設計
3.1基于WEB的企業CRM數據倉庫的設計
企業CRM數據倉庫邏輯上設計分為如下的層次:文件存儲區、臨時存儲區、數據清洗區、基礎數據區、星型數據區、數據中心。
文件存儲區:
文件存儲區主要存放原銷售系統等多個源系統通過FTP上傳的數據文件。各系統每天按時傳送相關數據,作為CRM數據倉庫的數據來源。
臨時存儲區:
臨時存儲區主要存儲各數據文件導人的臨時數據。每個數據文件在臨時存儲區對應一個結構相同的數據結構
數據清洗區:
根據需要,對臨時存儲區的數據進行清洗,并存放到數據清洗區。
基礎數據區:
存放統一格式的各系統基礎數據。
星型數據區:
為了CRM能實現目的,對客戶信息進行多角度多層次的分析,這就需要在
客戶關系管理中引入維、事實、層次等概念。
維是與某一事件相關因素在關系模型中的抽象,舉例來說,在客戶購買商品這一事件中就包含了客戶、時間、地理、商品等維度;層次是人們觀察數據細致程度的體現,如從時間維上來看就可以分為年、季度、月、日等層次;而事實是不同維度在某一取值下的交叉點,是對某一事件的度量,例如“某某顧客于某一時問某個地區購買了某件商品”這個事件,就是分別選取了顧客維、時間維、地理維、商品維中的某個值,而這些維度取值的空間交叉點就是對這一事件的度量,如銷售額、數量等。
有了維、事實、層次等概念就能夠為客戶數據建立CRM數據倉庫模型了。為了能夠更好地使用關系表來表達客戶多維信息,這里主要劃分了兩類表:維表和事實表,前者是用來存儲維的層次、成員類別等維的描述數據,而后者是用來存儲指向各個維的外關鍵字和一些相應的測量數據,也就是CRM中的事實。
這個模型主要是由一個事實表及多個維表組成,事實表用于存放客戶的事實數據,表中的信息有多個維度,每個維度對應于一個維表,維表包括相應維度的描述信息,事實表和維表之間通過主/外鍵相聯系。
3.2數據倉庫物理設計
(1)表空間設計。其中tee為temp(臨時區),clear(清洗區),extract(轉換區)。Basic為基礎區,star為星型區,ods為數據中心。Teeidx為tee區的索引存放表空間。basicidx為基礎區索引存放表空間,star為星型區的索引存放表空間。這樣設計主要為了把邏輯意義的區分開,也為性能考慮可以在表名前加前綴作為區分表所在的區。其中數據庫中所有的業務表全部放在一個用戶下,便于在各個區之間進行加載轉換。
(2)歸檔設計。由于數據在數據倉庫中頻繁加載刪除和插入等操作,假如是選用歸檔模式會使數據庫產生大量日志。如果歸檔將嚴重影響性能,而且數據倉庫對數據恢復的要求不高。因此就決定采用非歸檔模式。
(3)安全性設計。數據庫中所有的業務表全部放在一個用戶下,以方便在各個區之間加載轉換。再建一個用戶用于展現,對所有的業務表只有只讀權限。
(4)備份恢復。這里采用每2天一次冷備份和一周一次邏輯備份。可以接受恢復兩天前的數據,然后通過etl重新從源數據庫中獲取最新數據。
(5)參數設計。由于數據倉庫經常刪除、插入,很少更新的特點,相對一般業務系統,加大塊的大小,增加preused和減少prefree。
上一篇:
CRM的缺點克服企業信息化管理軟件下一篇:
SaaS軟件快速增長CRM消滅管理黑洞