重要的進程,要加以明確資料採擷、 分析和類比模型是:
資料模型: 什麼資料將提供和它將流?
資料收集: 如何將資料收集這兩個中的物理和技術方面?
收集的資料: 將收集什麼資料?
資料類型: 資料類型將會收集的嗎?
資料格式: 如何將資料舉行?
資料倉庫: 在將資料舉行?
資料採擷: 我們將如何從倉庫中檢索資料?
資訊建模: 如何將創建模型和什麼的?
資訊訪問: 如何將訪問的資料模型和報告?
演示文稿和報告: 對什麼將我們報告?
大多數公司想要瞭解有關在每次接觸,客戶基本資訊,例如:
生命週期價值
X 出售和升級潛力
購置成本
通道的首選項
忠誠/保留期
購買行為模式
許多他們的資料會有不同的頻率的變化、 小食或發生。它將保留不同的時期。在某些情況下,可留聚合的資料,而不是來源資料。所有這些因素影響類比練習和最終的建模軟體要求的資料。
將資料轉換為有用的資訊,需要:
識別問題
裝配資料設置
建築模型
模型驗證
結果的解釋
自動化的交付
此後,必須使用建模工具和技術。這些可以分成兩組: 驅動的理論和資料驅動的。
驅動建模 (假設測試) 的理論試圖證實或反駁成見。驅動的理論建模工具要求使用者指定模型的大多數基於先驗知識,然後測試以查看模型是否有效。
資料驅動的自動建模工具創建基於他們的資料中發現的模式的模型。這還需要進行測試,就可以接納為有效。
模型是一個反覆運算的過程與最終模型通常被先驗知識的組合和新發現的資訊。引擎工具和技術包括:
統計技術
資料驅動的工具
相關
聚類分析
t 測試
因數分析
方差分析
CHAID (卡方自動交互探測器) 決策樹
線性回歸
視覺化工具
邏輯回歸
神經網路
判別分析
No comments:
Post a Comment