
Python mrjob 操作 Hadoop培訓
Python是做數據分析好的語言。
大數(shu)據當(dang)然也離不(bu)開Hadoop,
Hadoop由JAVA寫(xie)成,
但Python也可以很好地操控它。
本(ben)課(ke)程(cheng)介(jie)紹了Python中MRjob模塊,
通過該模塊,
可以讓開發者非(fei)常簡單(dan)的通過(guo)Python來使用Hadoop進行(xing)數據(ju)分析。
1 Python MRJob模塊的安裝
2 使用MRJob實現文本統計
3 重寫MRJob函數實現復雜數據處理
4 Hadoop——Python各模塊介紹
5 Python MRJob的運(yun)行方式
1
Python玩轉Hadoop之MRjob入門
1.PythonMRJob模塊的安裝(zhuang)
2.HadoopPython各模塊介紹
3.使用MRJob實現文本統計
4.PythonMRJob的運(yun)行方(fang)式(shi)
5.重(zhong)寫MRJob函數(shu)實現復雜數(shu)據處理
1 使用 mrjob 實現詞組統計
2 實戰模擬 - 統計每部電影的熱度
3 實戰模擬 - 統計每部電影的觀看用戶列表
4 實戰模擬(ni) - 統計(ji)每個用(yong)戶(hu)的觀影列表
