數據分析與挖掘
1.概述
信息分析的用途:
定性分析:邏輯推理;
定量分析:建立數學模型,計算,求解。
數據分析的對象包括:
時間序列:企業(yè)歷年的數據。
截面數據:企業(yè)同一時間的數據。
2.數據統(tǒng)計分析
數據分析的工作(階段)有哪些?
(1)選擇數字特征;
(2)收集并整理數據;
(3)計算數字特征;
(4)建立模型;
(5)檢驗模型誤差;
(6)利用模型預測;
(7)評價統(tǒng)計與預測結果。
記憶:
選擇、整理、計算、建模、檢驗、預測、評價
3.時間數據分析方法
是按時序排列的一組來自同一現(xiàn)象的觀察值。
(1)時間序列成分
趨勢:長期持續(xù)向上或持續(xù)向下的傾向。
季節(jié)變動:實際過程受各種影響而呈現(xiàn)的周期性波動。
規(guī)則波動:周期不等的變動,呈漲落交替之狀。
不規(guī)則波動:除去趨勢、季節(jié)變動和周期波動之后的波動。
(2)時間序列建模的步驟
1)取得時間序列樣本。
2)將樣本點畫成圖,進行相關分析。
3)模式識別與擬合。
4)預測未來。
時間序列常用模型:
(1)ARMA模型
(2)回歸模型
4.大數據系統(tǒng)和數據挖掘技術
(1)大數據
大數據常以萬億或EB衡量,且種類多、實時性 強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎設施、工具和技術可用來開發(fā)和利用大數據中蘊藏的價值。
(2)數據挖掘
數據挖掘與數據分析不同,區(qū)別在于:
1)處理工作量;(多與少的區(qū)別)
2)制約條件;(數據挖掘不做假設,自動建立方程)
3)處理對象;(數據挖掘對象類型繁多)
4)處理結果。(數據挖掘的結果不易解釋,著眼于預測未來,并提出決策建議)
(3)數據挖掘步驟
按照挖掘對象,數據挖掘分為數據庫與數據倉庫挖掘和網絡挖掘兩種。
數據挖掘一般有信息收集、數據集成、數據規(guī)約、數據清理、數據變換、數據挖掘、模式評估和知識表示8個步驟。
……
例:網絡信息挖掘的具體步驟有哪些?(4分)
網絡信息挖掘具體步驟如下:
1)確立目標樣本。
2)提取特征信息。
3)網絡信息獲取。
4)信息特征匹配。