
Hadoop Flume 收集數據培訓
Flume 可(ke)以從多個(ge)數(shu)據(ju)源獲取數(shu)據(ju),把這(zhe)些數(shu)據(ju)傳(chuan)給遠程主機(可(ke)能(neng)是一對多或流水線模型 中的(de)(de)多個(ge)目標),再把它們傳(chuan)給多個(ge)目的(de)(de)端。
盡管 Flume 提供了(le)開(kai)發(fa)自定義(yi)數(shu)據源和數(shu)據目的(de)端(duan)的(de)編程 API,但它原本就支持(chi)許多常見的(de)場景。
1
使用 Flume 收(shou)集數(shu)據
1.Flume核心概念(nian)agent
2.agent里面包含3個核心組件:source、channel、sink。
3.sink組件是用于把數據發送到目的地(di)的組件,目的地(di)包(bao)括(kuo)hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自定義。

請
登錄
后發表評論
新評論
全部
第1節(jie)
第2節
第3節
第4節
第5節
第6節(jie)
第7節
第8節
第9節
第10節
第11節
第12節
第(di)13節
第14節
第15節
第16節
第(di)17節
我的報(bao)告(gao) / 所(suo)有(you)報告