第一講:R語言精要
本著循序漸進而又覆蓋R語言重要而有用的基本內容原則,本講從R語言入門開始,以前期的數據處理為核心,以實際案例為載體,內容包括R語言的向量、數據框、矩陣運算、缺失值和零值的處理、特別注重用R語言構造函數編程解決實際問題,詳細介紹強大的數據清洗整理plyr、zoo、car等常用包和強大的作圖ggplot2包,為使用R語言進行數據挖掘打下扎實的工具基礎。
主要案例:
案(an)例1:如何用R語(yu)言合并、排序、分析數據;
案例2:如何用(yong)R語言(yan)編程實現數(shu)據(ju)分析可視化圖片的jpeg格式輸出;
第二講:Logistic回歸與商業大數據建模
Logistic回歸是商業建模的常用重要數據挖掘方法,本講要講清楚Logistic回歸的建模原理、與多元線性模型的區別、R語言實現過程及回歸診斷注意事項、預測方法和結果解釋,讓學員徹底地掌握Logistic回歸解決問題的R語言方法。
2:R數據挖掘(一)
2.1 數據挖掘工業流程
2.2 先修統計知識
2.3 挖掘預處理
2.4 線性回歸
主要案例:
?案(an)例(li)1:利用Logistic回歸(gui)幫(bang)助(zhu)汽(qi)車情況預測;
?案例2:利用Logistic回歸(gui)幫助州(zhou)數據挖掘方案;
第三講:關聯規則和R語言實現
關(guan)聯規則(ze)(著名的(de)(de)“啤酒和(he)尿布(bu)”)是(shi)數(shu)據挖掘的(de)(de)基礎和(he)核(he)心技(ji)術之一,本(ben)講(jiang)將著重圍繞(rao)經(jing)典的(de)(de)Apriori算法(fa)和(he)eclat算法(fa),闡明關(guan)聯規則(ze)的(de)(de)支(zhi)持、置信和(he)提(ti)升程(cheng)度與控(kong)制,使用R語言快速完(wan)成關(guan)聯規則(ze)分析。
主要案例:
案例:使用R語(yu)言(yan)關聯規則方(fang)法(fa)幫助數(shu)據挖(wa)掘分(fen)析方(fang)案;
第四講:回歸決策分析和R語言實現
回歸是數(shu)據(ju)挖掘的(de)經典方法(fa),其原理(li)容易被理(li)解(jie)。
主要案例:
案例:進行回(hui)歸分析并完成相關目標變量的預測;
|