當前位置：首頁 >

在linux上一行代码不用写实现自动采集+hadoop分词

發(fā)布時間：2024/4/17 47 豆豆

生活随笔收集整理的這篇文章主要介紹了在linux上一行代码不用写实现自动采集+hadoop分词小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在linux上一行代碼不用寫實現(xiàn)自動采集+hadoop分詞

將下面的shell腳本保存成到xxx.sh，然后執(zhí)行即可

cd /opt/hadoop

mkdir spider
wget -O spider/test.html "http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html" ?
hadoop fs -mkdir /spider
hadoop fs -put spider/test.html /spider

hadoop jar share/hadoop/mapreduce/wordcount.jar wordcount.wordcount /spider/test.html /fenci2

執(zhí)行結(jié)果如下：

轉(zhuǎn)載于:https://www.cnblogs.com/bdccloudy/p/7665264.html

總結(jié)

以上是生活随笔為你收集整理的在linux上一行代码不用写实现自动采集+hadoop分词的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Centos7下,简单DOCKER 使用
下一篇：【转】Linux中多线程wait使用注意

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

在linux上一行代码不用写实现自动采集+hadoop分词

總結(jié)