鲲鹏数据开源库python_google_translator介绍
生活随笔
收集整理的這篇文章主要介紹了
鲲鹏数据开源库python_google_translator介绍
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
2019獨(dú)角獸企業(yè)重金招聘Python工程師標(biāo)準(zhǔn)>>>
?原文作者:西安鯤之鵬
原文鏈接:http://www.site-digger.com/html/articles/20130812/68.html
關(guān)于KPBroswer:
KPBroswer是一個(gè)基于QtWebKit的最小化瀏覽器程序,通過(guò)被第三方程序調(diào)用, 能實(shí)現(xiàn)對(duì)復(fù)雜頁(yè)面加載后數(shù)據(jù)(例如,復(fù)雜Ajax、數(shù)據(jù)加密)的抓取,支持屏幕截圖。 KP是“鯤鵬”二字的拼音首字母。 項(xiàng)目主頁(yè): https://bitbucket.org/qi/kpbroswer/ 適用場(chǎng)景: 頁(yè)面數(shù)據(jù)動(dòng)態(tài)加載(例如,Ajax過(guò)程過(guò)于復(fù)雜,分析成本太高); 數(shù)據(jù)加密(客戶端JS解密,解密算法難以獲取或難以用其它語(yǔ)言實(shí)現(xiàn)); 屏幕截圖; 跨平臺(tái)的抓取方案; 依賴庫(kù): PyQt4? Ubuntu下安裝方法:sudo apt-get install python-qt4 Windows下安裝方法:在這里下載二進(jìn)制安裝包直接安裝http://www.riverbankcomputing.co.uk/software/pyqt/download/ 調(diào)用方法: 若在Linux終端下運(yùn)行,需要安裝Xvfb。Ubuntu下安裝方法:apt-get install xvfb xfonts-base xfonts-75dpi xfonts-100dpi xfonts-wqy 調(diào)用舉例(Linux):xvfb-run python KPBroswer.py http://www.site-digger.com --flags=redice --output="page.html" --screenshot="sitedigger.jpg" 調(diào)用舉例(Windows):python KPBroswer.py http://www.site-digger.com --flags=redice --output="page.html" --screenshot="sitedigger.jpg" Usage: KPBroswer.py <URL> [options] Options: -h, --help ? ? ? ? ? ?show this help message and exit -p PROXY, --proxy=PROXY Proxy to use. -t TIMEOUT, --timeout=TIMEOUT The timeout time of loading page. -f FLAGS, --flags=FLAGS Flags need to wait for. Semicolon can be used as a eperator. -w WAIT_TIMEOUT, --wait_timeout=WAIT_TIMEOUT The timeout time of waitting for flags. -g, --gui ? ? ? ? ? ? Whether to show the broswer GUI. -o OUTPUT, --output=OUTPUT The output filename. -s SCREENSHOT, --screenshot=SCREENSHOT If the value is not empty, take a screenshot and save it here. 注意: Linux下不要忘記安裝相關(guān)字體庫(kù),否則截圖中的漢字將會(huì)是亂碼,如下圖site-digger-font-problem.jpg所示。 安裝后,就正常了,如圖site-digger.jpg所示。 示例: sample.py文件為一個(gè)Python以外部程序方式調(diào)用KPBroswer.py的示例,其它語(yǔ)言的調(diào)用可以參考其實(shí)現(xiàn)。 特別說(shuō)明:該文章為西安鯤之鵬的原創(chuàng)文章 ,你除了可以發(fā)表評(píng)論外,還可以轉(zhuǎn)載到你的網(wǎng)站或博客,但是請(qǐng)保留源地址,謝謝!!(尊重他人勞動(dòng),你我共同努力)轉(zhuǎn)載于:https://my.oschina.net/webscraping/blog/531907
總結(jié)
以上是生活随笔為你收集整理的鲲鹏数据开源库python_google_translator介绍的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 解决复制虚拟机时候网络不从eth0开始问
- 下一篇: python性能分析