?
目標收益
課程中的理論和經驗來自于對初級數據挖掘工程經常遇問題的歸納、分析與總結,有針對性的給出解決方法,課程將重現這些問題的經典案例,通過實例講解,并對應到學員的實際工作問題,使學員能夠把傳授的經驗和自己的問題結合起來,有效的啟發思路、激發興趣、提供解決問題需要的新思路新方法。
學員的收獲總結起來有3點:
1:了解實際的事例結合說基本算法的各種變體,開闊思路
2:將一次培訓深化為深入了解一個細分領域的一個渠道,之后可以接收到培訓內容中知識點對應的業界新更新。
3:加(jia)入(ru)“數據(ju)挖掘(jue)”職業圈,學員(yuan)可以有一個加(jia)入(ru)職業社(she)交(jiao)圈的機會,和業內人士(shi)相互(hu)交(jiao)流,相互(hu)切磋。
培訓對象
1:有一定的程序和數學基礎,希望對于數據挖掘有個知識體系的梳理,同時深入了解在實際生產過程中數據挖掘的各種算法的應用的,希望從初級走向中級的,數據增值產業的從業者。尤其是想做數據挖掘但是效果不顯著,希望在公司內部得到更多重視的團隊,派出兩三人參加這個課程,效果尤佳。
2:對于數據挖掘,商業(ye)智能感興趣,希望從事類似的(de)工作(zuo),但是又感到所(suo)謂(wei)“大數據”知識體系(xi)繁(fan)雜(za),無論是廣度(du)(du)還是深度(du)(du)都很難開始的(de)“迷茫”人士(shi)。
學員基礎
學員學習本課程應具備下列基礎知識:
1) 知道統計學的一些基本概念:平均分布,正態分布,方差,置信區間;?
2) 知道數據結構的一些基本概念:時間,空間復雜度;
3) 知道(dao)計算機體(ti)系結構的一(yi)些基本概念:GPU,芯片,寄(ji)存(cun)器(qi),內存(cun)尋址(zhi),總線傳輸(shu),內網通信
課程大綱
?
主題 |
內容 |
廣義線(xian)性分類(lei)的原理和應用(yong) |
內容:logistic Regression和計(ji)算廣(guang)(guang)(guang)(guang)(guang)告(gao)學 n1.二分類問題的(de)(de)例子n2.邏(luo)輯回(hui)歸的(de)(de)數學原理n3.傳統廣(guang)(guang)(guang)(guang)(guang)告(gao),計(ji)算廣(guang)(guang)(guang)(guang)(guang)告(gao),廣(guang)(guang)(guang)(guang)(guang)告(gao)實時交(jiao)易平(ping)臺(tai)n4.數據預處理和維度提(ti)取n5.LR在計(ji)算廣(guang)(guang)(guang)(guang)(guang)告(gao)中(zhong)的(de)(de)應用(yong)n6.LR的(de)(de)效果測評,模型調優n7.LR模型中(zhong)理論(lun)與工程的(de)(de)折(zhe)中(zhong)n8.LR和他的(de)(de)小伙伴們:廣(guang)(guang)(guang)(guang)(guang)義線(xian)性模型n9.新情(qing)況,基于移(yi)動端的(de)(de)廣(guang)(guang)(guang)(guang)(guang)告(gao)實時交(jiao)易平(ping)臺(tai),LR的(de)(de)各(ge)種(zhong)變體 |
決(jue)策樹,聚類(lei)和異常點檢測 |
內容(rong):決(jue)策(ce)(ce)(ce)樹(shu)和(he)異(yi)常(chang)點(dian)檢(jian)測(ce)n1.決(jue)策(ce)(ce)(ce)樹(shu)的(de)(de)(de)原理(li)n2.各種決(jue)策(ce)(ce)(ce)樹(shu)的(de)(de)(de)生(sheng)成算(suan)法(fa)n3.決(jue)策(ce)(ce)(ce)樹(shu)在異(yi)常(chang)點(dian)檢(jian)測(ce)中的(de)(de)(de)應用(yong)n4.決(jue)策(ce)(ce)(ce)樹(shu)的(de)(de)(de)剪枝n5.其它異(yi)常(chang)點(dian)檢(jian)測(ce)的(de)(de)(de)應用(yong)小技巧n6.聚(ju)類算(suan)法(fa)的(de)(de)(de)原理(li)n7.聚(ju)類算(suan)法(fa)的(de)(de)(de)常(chang)見問(wen)題:初始點(dian)選擇,n8.聚(ju)類算(suan)法(fa)和(he)決(jue)策(ce)(ce)(ce)樹(shu)在異(yi)常(chang)點(dian)檢(jian)測(ce)中的(de)(de)(de)應用(yong)n9.結合計(ji)算(suan)廣告,談兩個異(yi)常(chang)點(dian)檢(jian)測(ce)小例子 |
巨型圖挖掘 |
1.復雜網絡介紹(shao)n2.當前巨型(xing)圖(tu)(tu)(tu)(tu)應用場景n3.隨機圖(tu)(tu)(tu)(tu),自(zi)然圖(tu)(tu)(tu)(tu),n4.常用的(de)(de)圖(tu)(tu)(tu)(tu)計算框架(jia)(google的(de)(de)bagel,graphlab的(de)(de)graphx)n5.巨型(xing)圖(tu)(tu)(tu)(tu)上的(de)(de)算法實(shi)現原理n6.常用的(de)(de)基于圖(tu)(tu)(tu)(tu)的(de)(de)算法實(shi)現n7.隨機游走,pageRank基于圖(tu)(tu)(tu)(tu)的(de)(de)實(shi)現n8.svd介紹(shao)以及(ji)svd在圖(tu)(tu)(tu)(tu)框架(jia)的(de)(de)實(shi)現n9.圖(tu)(tu)(tu)(tu)挖掘與推薦系統(qzone的(de)(de)廣告系統廣點通,twitter的(de)(de)內容推薦) |