2012年4月5日 星期四

[Statistical]Data mining 資料採礦

--何謂“資料採礦
 (摘自維基)
數據挖掘一般是指從大量的資料中自動搜索隱藏於其中的有著特殊關聯性(屬於Association rule learning)的信息的過程。
資料挖掘通常電腦科學有關,並通過統計在線分析處理情報檢索機器學習專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。
數據挖掘的方法:
  監督式學習非監督式學習 關聯性的分析 (Affinity Grouping)與購物籃分析(Market Basket Analysis)、聚類(Clustering)與描述(Description)
監督式學習包括:分類(Classification)、估計(Estimation)、預測(Prediction)


--概略介紹相關名詞
無國界理財、經營管理、股票、基金、期貨Investment論壇
Data Mining (資料採礦,應用演算法分析,發掘含藏在資料裡的趨勢訊息)
Data Warehouse (資料倉儲) 
Web Mining (網頁採礦)
KDD,Knowledge Discovery in Database (發掘資料庫知識)
Algorithm (演算法)
Decision tree (決策樹)
PMML(Predictive Model Markup Language) (預測模型標記語)
DMX,Data Mining Extensions (資料採礦延伸模組) 
Time Series Analysis (時間序列分析)
Machine Learning (機器學習)




--常用的資料採礦方法
羅吉斯迴歸(Logist Regression)
分類與迴歸樹(Classification and Regression Tree/CART)
類神經網路(Neural Network)
支持向量機(Support Vector Machine/SVM)


--資料採礦與機器學習網路探索起點
美國人工智慧協會的資料採礦與機器學習主題



--網站文章介紹
1.雲端運算的運用-資料採礦和商業智慧
                (摘自作者:邦昌 輔仁大學商學研究所)
雲端運算是基於虛擬化技術快速部署資源和獲得服務
特點
按需求提供資源、按使用量付費、成本低、通用性高、擴充性佳、使用方便、服務配置速度快等。
原理
資料採礦和商業智慧的相似,都是由資料提供資訊、產生知識,再由知識累積智慧,而雲端運算可以使這個過程在網際網路上進行。
也就是說,雲端運算可以提供基於「軟體即服務」的知識與智慧分析的服務。


應用雲端運算在資料採礦和商業智慧上的應用非常廣泛
如構建知識脈絡、繪製知識地圖、追蹤事件、推薦知識社群等。


雲端演算法應用於其他領域除資料採礦和商業智慧之外
如微軟與中國電信在整合雲端運算和電腦、電視、手機等的合作專案,主要是讓消費者與企業用戶體驗到任何時間、任何地點、使用任何連網的用戶終端設備,就可快速取得所需資訊與服務,享受便利的數位生活。

沒有留言:

張貼留言