機器學習和數據挖掘課程
?
標收益
課程中的理論和經驗來自于對初級數據挖掘工程經常遇問題的歸納、分析與總結,有針對性的給出解決方法,課程將重現這些問題的經典案例,通過實例講解,并對應到學員的實際工作問題,使學員能夠把傳授的經驗和自己的問題結合起來,有效的啟發思路、激發興趣、提供解決問題需要的新思路新方法。
學員的收獲總結起來有3點:
1:了解實際的事例結合說基本算法的各種變體,開闊思路
2:將一次培訓深化為深入了解一個細分領域的一個渠道,之后可以接收到培訓內容中知識點對應的業界新更新。
3:加入“數據挖(wa)掘”職業圈(quan),學員(yuan)可(ke)以有(you)一個(ge)加入職業社交圈(quan)的(de)機會,和業內人士相(xiang)互(hu)交流,相(xiang)互(hu)切(qie)磋。
培訓對象
1:有一定的程序和數學基礎,希望對于數據挖掘有個知識體系的梳理,同時深入了解在實際生產過程中數據挖掘的各種算法的應用的,希望從初級走向中級的,數據增值產業的從業者。尤其是想做數據挖掘但是效果不顯著,希望在公司內部得到更多重視的團隊,派出兩三人參加這個課程,效果尤佳。
2:對于(yu)數據挖掘,商(shang)業智能感(gan)興趣(qu),希望(wang)從(cong)事類似的(de)工作,但是又感(gan)到所謂“大數據”知(zhi)識體系繁雜,無論是廣度還是深度都很難(nan)開始的(de)“迷茫”人(ren)士。
學員基礎
學員學習本課程應具備下列基礎知識:
1) 知道統計學的一些基本概念:平均分布,正態分布,方差,置信區間;?
2) 知道數據結構的一些基本概念:時間,空間復雜度;
3) 知道計算機體系(xi)結構的一些(xie)基本概念(nian):GPU,芯片,寄(ji)存器,內存尋址,總(zong)線(xian)傳輸,內網通(tong)信
課程大綱
?
主題 內容
廣義線(xian)性分類(lei)的原理和(he)應用
內容(rong):logistic Regression和(he)計算廣(guang)告(gao)學 n1.二分類問(wen)題的(de)(de)例子n2.邏輯回歸的(de)(de)數(shu)學原理n3.傳統廣(guang)告(gao),計算廣(guang)告(gao),廣(guang)告(gao)實時交(jiao)易平臺(tai)n4.數(shu)據預處理和(he)維度提取n5.LR在計算廣(guang)告(gao)中的(de)(de)應用n6.LR的(de)(de)效果測評,模型調(diao)優n7.LR模型中理論與工程的(de)(de)折中n8.LR和(he)他的(de)(de)小伙(huo)伴們:廣(guang)義(yi)線性模型n9.新情況(kuang),基于移(yi)動端的(de)(de)廣(guang)告(gao)實時交(jiao)易平臺(tai),LR的(de)(de)各(ge)種變體
決策樹,聚類和異常點檢測(ce)
內(nei)容(rong):決(jue)策樹(shu)(shu)和(he)異(yi)常(chang)(chang)點檢(jian)(jian)(jian)(jian)測(ce)(ce)n1.決(jue)策樹(shu)(shu)的(de)(de)原(yuan)理n2.各種(zhong)決(jue)策樹(shu)(shu)的(de)(de)生(sheng)成算法n3.決(jue)策樹(shu)(shu)在異(yi)常(chang)(chang)點檢(jian)(jian)(jian)(jian)測(ce)(ce)中的(de)(de)應用(yong)n4.決(jue)策樹(shu)(shu)的(de)(de)剪枝n5.其它異(yi)常(chang)(chang)點檢(jian)(jian)(jian)(jian)測(ce)(ce)的(de)(de)應用(yong)小技(ji)巧n6.聚類算法的(de)(de)原(yuan)理n7.聚類算法的(de)(de)常(chang)(chang)見問題:初始點選擇,n8.聚類算法和(he)決(jue)策樹(shu)(shu)在異(yi)常(chang)(chang)點檢(jian)(jian)(jian)(jian)測(ce)(ce)中的(de)(de)應用(yong)n9.結合(he)計(ji)算廣告(gao),談兩(liang)個異(yi)常(chang)(chang)點檢(jian)(jian)(jian)(jian)測(ce)(ce)小例子
巨型圖挖掘
1.復雜網(wang)絡介(jie)紹(shao)n2.當前巨型圖(tu)(tu)(tu)應用場景(jing)n3.隨機圖(tu)(tu)(tu),自(zi)然圖(tu)(tu)(tu),n4.常用的(de)(de)(de)(de)圖(tu)(tu)(tu)計算(suan)框架(google的(de)(de)(de)(de)bagel,graphlab的(de)(de)(de)(de)graphx)n5.巨型圖(tu)(tu)(tu)上(shang)的(de)(de)(de)(de)算(suan)法(fa)實(shi)現原(yuan)理n6.常用的(de)(de)(de)(de)基(ji)于圖(tu)(tu)(tu)的(de)(de)(de)(de)算(suan)法(fa)實(shi)現n7.隨機游走,pageRank基(ji)于圖(tu)(tu)(tu)的(de)(de)(de)(de)實(shi)現n8.svd介(jie)紹(shao)以(yi)及(ji)svd在(zai)圖(tu)(tu)(tu)框架的(de)(de)(de)(de)實(shi)現n9.圖(tu)(tu)(tu)挖掘與推薦(jian)系(xi)統(qzone的(de)(de)(de)(de)廣告系(xi)統廣點(dian)通(tong),twitter的(de)(de)(de)(de)內容(rong)推薦(jian))
?
?
·
?
?
?
?
?
?
?
?
?
?
?
?
?
?