日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pig使用入门1

發(fā)布時間:2025/3/20 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 pig使用入门1 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1、在pig下載的安裝包,解壓完成了之后,有一個tutorial目錄,我們使用里面的數(shù)據(jù)來開始pig學習。如果tutorial目錄下沒有存在pigtutorial.tar.gz文件的話,那么需要使用ant來編譯出這個文件

  如果沒有ant,見分類linux下的ant安裝

2、進入tutorial目錄,執(zhí)行命令ant

  得到pigtutorial.tar.gz

3、使用tar -zxvf pigtutorial.tar.gz 解壓

4、上傳excite-small.log進入hdfs中

  $>hadoop dfs -put excite-smal.log /input

  因為使用pig處理的是hdfs中的文件

  我們下面將主要分析excite-small.log文件,該文件的數(shù)據(jù)結(jié)構(gòu)如下:

  UserID?? TimeStamp SearchQuery

5、執(zhí)行pig進入pig的上下文grunt

6、首先將excite-small.log加載到一個變量(也稱之為alias)中,我們將使用該變量來表示這個數(shù)據(jù)集:

  grunt> log = load 'excite-small.log' as (user, time, query);

  注意的是這時pig并沒有運行該命令,僅僅是解析了該命令,只有到使用dump命令或者是store命令時pig才會真正執(zhí)行該命令。dump命令將打印出這個變量的內(nèi)容,store命  令將變量所代表的內(nèi)容保存到一個文件中。

7、 grunt> describe log; 查看結(jié)構(gòu)(語句都以; 結(jié)束)

8、如果我們想要查看該log文件的前4行的話:

  grunt> lmt = limit log 4;

  grunt> dump lmt;(打印)

?

注意:如果出現(xiàn):Unable to open iterator for alias a,請檢查hadoop是否仍處于safemode狀態(tài),如果是,退出這個狀態(tài)。

轉(zhuǎn)載于:https://www.cnblogs.com/jsunday/p/3789632.html

總結(jié)

以上是生活随笔為你收集整理的pig使用入门1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。