?
標收益
課程中的理論和經驗來自于對初級數據挖掘工程經常遇問題的歸納、分析與總結,有針對性的給出解決方法,課程將重現這些問題的經典案例,通過實例講解,并對應到學員的實際工作問題,使學員能夠把傳授的經驗和自己的問題結合起來,有效的啟發思路、激發興趣、提供解決問題需要的新思路新方法。
學員的收獲總結起來有3點:
1:了解實際的事例結合說基本算法的各種變體,開闊思路
2:將一次培訓深化為深入了解一個細分領域的一個渠道,之后可以接收到培訓內容中知識點對應的業界新更新。
3:加入(ru)“數據挖掘”職(zhi)業圈,學(xue)員可(ke)以有一個加入(ru)職(zhi)業社交圈的機會,和業內人士(shi)相(xiang)互交流,相(xiang)互切磋。
培訓對象
1:有一定的程序和數學基礎,希望對于數據挖掘有個知識體系的梳理,同時深入了解在實際生產過程中數據挖掘的各種算法的應用的,希望從初級走向中級的,數據增值產業的從業者。尤其是想做數據挖掘但是效果不顯著,希望在公司內部得到更多重視的團隊,派出兩三人參加這個課程,效果尤佳。
2:對于數(shu)據(ju)挖掘,商業(ye)智能感興趣(qu),希望(wang)從事(shi)類似的(de)工作,但是又感到所謂(wei)“大(da)數(shu)據(ju)”知識(shi)體系繁(fan)雜,無論(lun)是廣(guang)度還是深(shen)度都很難開(kai)始的(de)“迷茫”人士(shi)。
學員基礎
學員學習本課程應具備下列基礎知識:
1) 知道統計學的一些基本概念:平均分布,正態分布,方差,置信區間;?
2) 知道數據結構的一些基本概念:時間,空間復雜度;
3) 知(zhi)道計(ji)算機體系結構的一些基(ji)本概念:GPU,芯片(pian),寄(ji)存器(qi),內存尋址,總線傳輸,內網通信
課程大綱
?
主題 |
內容 |
廣義線性分類的原理和(he)應(ying)用 |
內容:logistic Regression和計算(suan)廣(guang)(guang)告(gao)學 n1.二分(fen)類問題的(de)(de)例子n2.邏輯回歸的(de)(de)數學原理(li)(li)n3.傳統廣(guang)(guang)告(gao),計算(suan)廣(guang)(guang)告(gao),廣(guang)(guang)告(gao)實時交易平臺n4.數據預(yu)處(chu)理(li)(li)和維(wei)度提取n5.LR在計算(suan)廣(guang)(guang)告(gao)中的(de)(de)應用n6.LR的(de)(de)效果測評,模(mo)型調(diao)優(you)n7.LR模(mo)型中理(li)(li)論與工程的(de)(de)折中n8.LR和他(ta)的(de)(de)小伙伴們:廣(guang)(guang)義線性模(mo)型n9.新情況(kuang),基于移動端的(de)(de)廣(guang)(guang)告(gao)實時交易平臺,LR的(de)(de)各種變體(ti) |
決策樹,聚(ju)類和異常點檢測 |
內容(rong):決(jue)(jue)策(ce)(ce)樹(shu)和(he)(he)異(yi)(yi)常點(dian)檢測(ce)n1.決(jue)(jue)策(ce)(ce)樹(shu)的(de)(de)(de)原理n2.各(ge)種決(jue)(jue)策(ce)(ce)樹(shu)的(de)(de)(de)生成算(suan)法n3.決(jue)(jue)策(ce)(ce)樹(shu)在異(yi)(yi)常點(dian)檢測(ce)中的(de)(de)(de)應用(yong)n4.決(jue)(jue)策(ce)(ce)樹(shu)的(de)(de)(de)剪枝n5.其它(ta)異(yi)(yi)常點(dian)檢測(ce)的(de)(de)(de)應用(yong)小技巧n6.聚(ju)類算(suan)法的(de)(de)(de)原理n7.聚(ju)類算(suan)法的(de)(de)(de)常見問(wen)題(ti):初始點(dian)選擇,n8.聚(ju)類算(suan)法和(he)(he)決(jue)(jue)策(ce)(ce)樹(shu)在異(yi)(yi)常點(dian)檢測(ce)中的(de)(de)(de)應用(yong)n9.結合(he)計(ji)算(suan)廣(guang)告,談兩(liang)個異(yi)(yi)常點(dian)檢測(ce)小例子 |
巨型圖挖掘 |
1.復雜網絡(luo)介紹n2.當前巨(ju)型圖(tu)應用(yong)場景n3.隨機圖(tu),自然圖(tu),n4.常用(yong)的圖(tu)計(ji)算(suan)框(kuang)架(google的bagel,graphlab的graphx)n5.巨(ju)型圖(tu)上的算(suan)法(fa)實(shi)現(xian)原(yuan)理n6.常用(yong)的基(ji)于(yu)圖(tu)的算(suan)法(fa)實(shi)現(xian)n7.隨機游(you)走,pageRank基(ji)于(yu)圖(tu)的實(shi)現(xian)n8.svd介紹以及svd在圖(tu)框(kuang)架的實(shi)現(xian)n9.圖(tu)挖掘(jue)與推薦系統(tong)(qzone的廣告系統(tong)廣點(dian)通(tong),twitter的內容(rong)推薦) |