日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Flume之HDFS Sink 的参数解析及异常处理

發(fā)布時間:2023/12/16 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Flume之HDFS Sink 的参数解析及异常处理 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、配置詳解

typeSink類型為hdfshdfs.pathHDFS存儲路徑,支持按照時間分區(qū)集群的NameNode名字:單節(jié)點:hdfs://主機名(ip):9000/%Y/%m/%d/%HHA集群:hdfs://nameservice(高可用NameNode服務名稱)/%Y/%m/%d/%Hhdfs.filePrefix默認值:FlumeDataEvent輸出到HDFS的文件名前綴hdfs.fileSuffixEvent輸出到HDFS的文件名后綴hdfs.inUsePrefix臨時文件的文件名前綴Flume首先將Event輸出到HDFS指定目錄的臨時文件中,再根據(jù)相關(guān)規(guī)則重命名為目標文件hdfs.inUseSuffix默認值:.tmp臨時文件名后綴hdfs.rollInterval默認值:30間隔多久將臨時文件滾動成最終目標文件,單位:秒如果設置為0,則表示不根據(jù)時間滾動文件注:滾動(roll)指的是,HDFS Sink將臨時文件重命名成最終目標文件,并新打開一個臨時文件來寫數(shù)據(jù)hdfs.rollSize默認值:1024當臨時文件達到該大小時,滾動成目標文件,單位:byte該值設置為0,則表示文件不根據(jù)文件大小滾動生成hdfs.rollCount默認值:10當Event數(shù)據(jù)達到該數(shù)量時,將臨時文件滾動生成目標文件該值設置為0,則表示文件不根據(jù)Event數(shù)滾動生成hdfs.idleTimeout默認值:0當目前被打開的臨時文件在該參數(shù)指定的時間內(nèi),沒有任何數(shù)據(jù)寫入,則將該臨時文件關(guān)閉并重命名成目標文件,單位:秒該值設置為0,則表示禁用此功能,不自動關(guān)閉臨時文件hdfs.round默認值:false用于HDFS文件按照時間分區(qū),時間戳向下取整hdfs.roundValue默認值:1當round設置為true,配合roundUnit時間單位一起使用,例如roundUnit值為minute該值設置為1則表示一分鐘之內(nèi)的數(shù)據(jù)寫到一個文件中,相當于每一分鐘生成一個文件hdfs.roundUnit默認值:second按時間分區(qū)使用的時間單位,可以選擇second(秒)、minute(分鐘)、hour(小時)三種粒度的時間單位示例:a1.sinks.k1.hdfs.path = hdfs://nameservice/flume/events/%y/%m/%d/%H/%Ma1.sinks.k1.hdfs.round = truea1.sinks.k1.hdfs.roundValue = 10a1.sinks.k1.hdfs.roundUnit = minute當時間為2022-04-05 17:38:59時候,hdfs.path依然會被解析為:/flume/events/2022/04/05/17/30因為設置的是舍棄10分鐘內(nèi)的時間,因此,該目錄每10分鐘新生成一個hdfs.batchSize默認值:100每個批次刷寫到HDFS的Event數(shù)量hdfs.codeC默認值:不采用壓縮文件壓縮格式,目前支持的壓縮格式有g(shù)zip、bzip2、lzo、lzop、snappyhdfs.fileType默認值:SequenceFile文件類型,包括:SequenceFile、DataStream、CompressedStream該值設置為DataStream,則輸出的文件不會進行壓縮,不需要設置hdfs.codeC指定壓縮格式。該值設置為CompressedStream,則對輸出的文件進行壓縮,需要設置hdfs.codeC指定壓縮格式hdfs.maxOpenFiles默認值:5000最大允許打開的HDFS文件數(shù),當打開的文件數(shù)達到該值,則最早打開的文件將會被關(guān)閉hdfs.minBlockReplicas默認值:HDFS副本數(shù)寫入HDFS文件塊的最小副本數(shù)該參數(shù)會影響文件的滾動配置,一般將該參數(shù)配置成1,才可以按照配置正確滾動文件hdfs.writeFormat默認值:Writable文件的格式,目前可以選擇Text或者Writable兩種格式hdfs.callTimeout默認值:10000操作HDFS文件的超時時間,如果需要寫入HDFS文件的Event數(shù)比較大或者發(fā)生了打開、寫入、刷新、關(guān)閉文件超時的問題,可以根據(jù)實際情況適當增大超時時間,單位:毫秒hdfs.threadsPoolSize默認值:10每個HDFS Sink執(zhí)行HDFS IO操作打開的線程數(shù)hdfs.rollTimerPoolSize默認值:1HDFS Sink根據(jù)時間滾動生成文件時啟動的線程數(shù)hdfs.timeZone默認值:Local Time本地時間寫入HDFS文件使用的時區(qū)hdfs.useLocalTimeStamp默認值:false是否使用本地時間替換Event頭信息中的時間戳hdfs.closeTries默認值:0在發(fā)起關(guān)閉嘗試后,嘗試重命名臨時文件的次數(shù)如果設置為1,表示重命名一次失敗后不再繼續(xù)嘗試重命名操作,此時待處理的文件將處于打開狀態(tài),擴展名為.tmp如果設置為0,表示嘗試重命名操作次數(shù)不受限制,直到文件最終被重命名成功如果close調(diào)用失敗,文件可能仍然會處于打開狀態(tài),但是文件中的數(shù)據(jù)將保持完整,文件會在Flume重啟后關(guān)閉hdfs.retryInterval默認值:180 秒連續(xù)嘗試關(guān)閉文件的時間間隔。如果設置為0或小于0的數(shù),第一次嘗試關(guān)閉文件失敗后將不會繼續(xù)嘗試關(guān)閉文件,文件將保持打開狀態(tài)或者以“.tmp”擴展名結(jié)尾的臨時文件如果設置為0,表示不嘗試,相當于于將hdfs.closeTries設置成1serializer默認值:TEXT序列化方式,可選值有TEXT、avro_event或者實現(xiàn)EventSerializer.Builder接口的類kerberosPrincipalHDFS安全認證kerberos配置kerberosKeytabHDFS安全認證kerberos配置proxyUser代理用戶

二、簡單模板

agent_name.sources = source_name agent_name.channels = channel_name agent_name.sinks = sink_name# source agent_name.sources.source_name.type = avro XXX XXX# channel agent_name.channels.channel_name.type = file XXX XXX# sink agent_name.sinks.sink_name.type = hdfs agent_name.sinks.sink_name.hdfs.path = hdfs://${HA_NameNode_Name}/flume_data/yr=%Y/mon=%m/day=%d/hr=%H agent_name.sinks.sink_name.hdfs.writeFormat = Text agent_name.sinks.sink_name.hdfs.fileSuffix = _${hdfsFileSuffix}.log agent_name.sinks.sink_name.hdfs.fileType = DataStream agent_name.sinks.sink_name.hdfs.filePrefix = %Y%m%d%H%M agent_name.sinks.sink_name.hdfs.useLocalTimeStamp = true agent_name.sinks.sink_name.hdfs.rollInterval = 0 agent_name.sinks.sink_name.hdfs.rollSize = 125829120 agent_name.sinks.sink_name.hdfs.rollCount = 0 agent_name.sinks.sink_name.hdfs.minBlockReplicas = 1 agent_name.sinks.sink_name.hdfs.round = true agent_name.sinks.sink_name.hdfs.roundValue = 1 agent_name.sinks.sink_name.hdfs.roundUnit = hour agent_name.sinks.sink_name.hdfs.idleTimeout = 600# source | channel | sink 關(guān)聯(lián) agent_name.sources.source_name.channels = channel_name agent_name.sinks.sink_name.channel = channel_name

三、注意事項及異常

  • idleTimeout 的設置

    • 設置為0,如果flume程序突然宕機,就會導致 hdfs上的 .tmp后綴的文件無法會更改為完成的文件,造成一種假象,以為該文件正在寫入。當程序重啟時,就會有兩個 .tmp文件。

    • 如果idle Timeout有設置值m,當在m秒內(nèi)沒有數(shù)據(jù)寫入,就會把tmp文件改為已完成。后面再有數(shù)據(jù)過來的時候重新生成.tmp文件。

    • 建議:最好設置一個比較大的值,防止小文件產(chǎn)生,若不設置,宕機的話會有tmp文件

    • 為了能快速查看到數(shù)據(jù),可以設置該值較小,沒數(shù)據(jù)進行就滾動,因為臨時文件是不能被Hive查詢到,但是這樣會產(chǎn)生小文件

  • round 與 rollInterval 理解有誤

    • round、roundValue、roundUnit是基于路徑path去滾動生成文件夾的,針對文件夾而言

    • rollInterval、rollSize、rollCount是基于文件的條件限制滾動生成文件的,基于文件而言的

  • 異常:Error while trying to hflushOrSync

    • 問題排查:通過查看不同F(xiàn)lume的Agent日志發(fā)現(xiàn),同名的文件被不同的Flume Agent打開,在文件第二次打開后,先前打開的Agent擁有的token就失效了,因此無法關(guān)閉它,就會不斷的報錯:Error while trying to hflushOrSync!
    • 查看之前的flume配置文件發(fā)現(xiàn),每一個Flume-Agent配置的hdfsSink是完全一樣的,每個Flume-Agent讀取的source相同,有很大概率會出現(xiàn)多個Fume-Agent同時寫同名文件,導致部分Flume-Agent無法繼續(xù)。
    • 解決方案:不同F(xiàn)lume設置不同的文件后綴名
  • 總結(jié)

    以上是生活随笔為你收集整理的Flume之HDFS Sink 的参数解析及异常处理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 激情xxxx| 欧美xxxxx精品 | 理论片第一页 | 国精产品一区一区三区免费视频 | 一本大道东京热无码 | 午夜影院入口 | 69黄色片| 鸭子av | 九九九热 | 久久精品电影网 | 免费观看nba乐趣影院 | 999xxxx | www.av麻豆 | 国产亚洲欧美在线精品 | 亚洲裸体视频 | 久热免费 | 偷偷操网站 | 亚洲图片视频在线 | 色丁香婷婷综合久久 | 国产精品精品软件视频 | www.三级 | 中文字幕在线观看的网站 | 日韩不卡视频在线观看 | 极品美女高潮 | 91精品国产乱码久久久张津瑜 | 台湾佬av| 2019天天操| 欧美另类日韩 | 久久久77| 99亚洲精品 | 无码少妇一级AV片在线观看 | 亚洲第五页 | 国产精品99久久久久久动医院 | 国产精品成人69xxx免费视频 | 禁网站在线观看免费视频 | 伊人影院在线观看 | 我和单位漂亮少妇激情 | 国产无遮挡又黄又爽又色视频 | 久久激情久久 | 欧美一区二区三区在线免费观看 | 中国一区二区视频 | 啪啪在线视频 | 欧美精品第二页 | 欧美性受xxxx黑人 | 亚洲欧洲综合 | 免费av在 | 天堂资源中文在线 | 国产欧美一区二 | 国产资源在线观看 | 欧美激情18| 高级家教课程在线观看 | 亚洲天堂一区二区三区四区 | 欧美色图30p | jizz日本在线 | 欧美日韩国产一区二区三区在线观看 | 潘金莲三级80分钟 | 日韩欧美国产一区二区三区在线观看 | 五月天久久久 | 六月婷婷中文字幕 | 51精品国自产在线 | 麻豆国产尤物av尤物在线观看 | 国产一区两区 | 看av免费毛片手机播放 | 一本大道久久 | 欧美精品人妻一区二区 | 视频一区 国产 | 欧美一区二区三区视频在线观看 | 麻豆md0049免费 | 国产精品毛片av | 国产成人综合在线视频 | 波多野结衣小视频 | 男生操女生免费网站 | 人人草网站 | 国产成人无码AA精品区 | 爱情岛论坛永久入址在线 | 精品香蕉视频 | 一区精品二区国产 | 四虎影视成人永久免费观看亚洲欧美 | 夜夜爽网站 | 国产人成精品 | 亚洲最大福利视频 | 奇米影| 性爱视频免费 | 成人片免费看 | 日韩精品中文字 | av资源共享 | 影音先锋日韩资源 | 精品国产乱码一区二区三区99 | 国产成人在线免费观看 | 日韩在线免费观看av | 国产伦精品一区二区三区在线观看 | 午夜国产一级 | 粉嫩av一区二区三区免费观看 | xxx日韩| 91 色| 亚洲欧美日韩在线不卡 | 免费精品视频 | 色哟哟在线观看视频 | 欧美xxxx日本和非洲 |