機器學習和數據挖掘課程
?
目標收益
課程中的理論和經驗來自于對初級數據挖掘工程經常遇問題的歸納、分析與總結,有針對性的給出解決方法,課程將重現這些問題的經典案例,通過實例講解,并對應到學員的實際工作問題,使學員能夠把傳授的經驗和自己的問題結合起來,有效的啟發思路、激發興趣、提供解決問題需要的新思路新方法。
學員的收獲總結起來有3點:
1:了解實際的事例結合說基本算法的各種變體,開闊思路
2:將一次培訓深化為深入了解一個細分領域的一個渠道,之后可以接收到培訓內容中知識點對應的業界新更新。
3:加入“數據挖(wa)掘”職業圈,學員可以(yi)有一個加入職業社交(jiao)圈的機會,和業內人士相互(hu)交(jiao)流(liu),相互(hu)切(qie)磋。
培訓對象
1:有一定的程序和數學基礎,希望對于數據挖掘有個知識體系的梳理,同時深入了解在實際生產過程中數據挖掘的各種算法的應用的,希望從初級走向中級的,數據增值產業的從業者。尤其是想做數據挖掘但是效果不顯著,希望在公司內部得到更多重視的團隊,派出兩三人參加這個課程,效果尤佳。
2:對于數據(ju)挖(wa)掘,商(shang)業智(zhi)能感興趣,希望(wang)從(cong)事類(lei)似的(de)工作,但是(shi)又感到所(suo)謂“大(da)數據(ju)”知識體系繁雜,無論(lun)是(shi)廣度還是(shi)深度都很難(nan)開始(shi)的(de)“迷茫”人士。
學員基礎
學員學習本課程應具備下列基礎知識:
1) 知道統計學的一些基本概念:平均分布,正態分布,方差,置信區間;?
2) 知道數據結構的一些基本概念:時間,空間復雜度;
3) 知道(dao)計算機體系(xi)結構的一些基(ji)本概念:GPU,芯片,寄存器,內(nei)存尋(xun)址,總線傳(chuan)輸,內(nei)網(wang)通信
課程大綱
?
主題 內容
廣義線性分類的原(yuan)理和應用
內容:logistic Regression和計(ji)(ji)(ji)算廣告(gao)(gao)學(xue) n1.二(er)分類問題的(de)例子n2.邏(luo)輯(ji)回歸的(de)數學(xue)原理n3.傳(chuan)統廣告(gao)(gao),計(ji)(ji)(ji)算廣告(gao)(gao),廣告(gao)(gao)實時交易平(ping)臺n4.數據預處理和維度(du)提(ti)取n5.LR在(zai)計(ji)(ji)(ji)算廣告(gao)(gao)中(zhong)(zhong)的(de)應用n6.LR的(de)效果測(ce)評,模型調優(you)n7.LR模型中(zhong)(zhong)理論與工程的(de)折中(zhong)(zhong)n8.LR和他(ta)的(de)小伙伴們:廣義線性模型n9.新情況,基于移(yi)動端(duan)的(de)廣告(gao)(gao)實時交易平(ping)臺,LR的(de)各種變體
決策樹,聚類和(he)異常點檢測
內容:決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)和異(yi)(yi)常(chang)(chang)點(dian)(dian)(dian)檢測(ce)(ce)n1.決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)的(de)(de)(de)(de)原理n2.各種決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)的(de)(de)(de)(de)生成算法(fa)(fa)n3.決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)在(zai)(zai)異(yi)(yi)常(chang)(chang)點(dian)(dian)(dian)檢測(ce)(ce)中(zhong)的(de)(de)(de)(de)應用(yong)n4.決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)的(de)(de)(de)(de)剪枝n5.其它(ta)異(yi)(yi)常(chang)(chang)點(dian)(dian)(dian)檢測(ce)(ce)的(de)(de)(de)(de)應用(yong)小(xiao)技巧(qiao)n6.聚(ju)(ju)類(lei)(lei)算法(fa)(fa)的(de)(de)(de)(de)原理n7.聚(ju)(ju)類(lei)(lei)算法(fa)(fa)的(de)(de)(de)(de)常(chang)(chang)見問題(ti):初(chu)始點(dian)(dian)(dian)選擇,n8.聚(ju)(ju)類(lei)(lei)算法(fa)(fa)和決(jue)(jue)策(ce)(ce)樹(shu)(shu)(shu)(shu)在(zai)(zai)異(yi)(yi)常(chang)(chang)點(dian)(dian)(dian)檢測(ce)(ce)中(zhong)的(de)(de)(de)(de)應用(yong)n9.結(jie)合計(ji)算廣告,談兩個異(yi)(yi)常(chang)(chang)點(dian)(dian)(dian)檢測(ce)(ce)小(xiao)例(li)子
巨型圖挖掘
1.復雜網絡介紹(shao)(shao)n2.當前巨(ju)型圖(tu)應用(yong)場景n3.隨(sui)機圖(tu),自然圖(tu),n4.常用(yong)的(de)(de)(de)圖(tu)計算框(kuang)架(jia)(google的(de)(de)(de)bagel,graphlab的(de)(de)(de)graphx)n5.巨(ju)型圖(tu)上的(de)(de)(de)算法實(shi)現(xian)(xian)原理n6.常用(yong)的(de)(de)(de)基于(yu)圖(tu)的(de)(de)(de)算法實(shi)現(xian)(xian)n7.隨(sui)機游走,pageRank基于(yu)圖(tu)的(de)(de)(de)實(shi)現(xian)(xian)n8.svd介紹(shao)(shao)以及svd在圖(tu)框(kuang)架(jia)的(de)(de)(de)實(shi)現(xian)(xian)n9.圖(tu)挖掘與推薦系(xi)統(qzone的(de)(de)(de)廣告系(xi)統廣點通,twitter的(de)(de)(de)內容(rong)推薦)
?
?
?
?
?
?
?
?
?