日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬虫初识jsoup

發(fā)布時間:2025/3/20 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬虫初识jsoup 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

學(xué)習(xí)了幾天爬蟲,發(fā)現(xiàn)jsoup這款工具非常好用。對于初學(xué)者解析html文件方便,可以滿足簡單的要求。首先jsoup要下載jar包,然后配置路徑添加外部jar文件。。代碼就已我的博客為例。參考jsoup中文API
Elements這個對象提供了一系列類似于DOM的方法來查找元素,抽取并處理其中的數(shù)據(jù)。具體如下:

getElementById(String id) getElementsByTag(String tag) getElementsByClass(String className) getElementsByAttribute(String key) (and related methods) Element siblings: siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling() Graph: parent(), children(), child(int index) 元素數(shù)據(jù) attr(String key)獲取屬性attr(String key, String value)設(shè)置屬性 attributes()獲取所有屬性 id(), className() and classNames() text()獲取文本內(nèi)容text(String value) 設(shè)置文本內(nèi)容 html()獲取元素內(nèi)HTMLhtml(String value)設(shè)置元素內(nèi)的HTML內(nèi)容 outerHtml()獲取元素外HTML內(nèi)容 data()獲取數(shù)據(jù)內(nèi)容(例如:script和style標簽) tag() and tagName() 操作HTML和文本 append(String html), prepend(String html) appendText(String text), prependText(String text) appendElement(String tagName), prependElement(String tagName) html(String value)

從一個URL加載一個Document

解決方法 使用 Jsoup.connect(String url)方法:Document doc = Jsoup.connect("http://example.com/").get(); String title = doc.title(); 說明 connect(String url) 方法創(chuàng)建一個新的 Connection,get() 取得和解析一個HTML文件。如果從該URL獲取HTML時發(fā)生錯誤,便會拋出 IOException,應(yīng)適當(dāng)處理。Connection 接口還提供一個方法鏈來解決特殊請求,具體如下:Document doc = Jsoup.connect("http://example.com").data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post(); 這個方法只支持Web URLs (http和https 協(xié)議); 假如你需要從一個文件加載,可以使用 parse(File in, String charsetName) 代替。 import java.io.IOException;import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements;public class test {public static void main(String[] args) throws IOException{String url="https://blog.csdn.net/qq_40693171";Document doc=Jsoup.connect(url).get();// System.out.print(doc.html());//獲取整個頁面的htmlElements links1=doc.select("a");// System.out.println(links1);//將輸出系列a開頭<a href="https://blog.csdn.net/qq_40693171">好求窈窕</a>等等Elements links2=doc.select("a[onclick]");// System.out.println(links2);//輸出有onclick選項的內(nèi)容//<a href="https://blog.csdn.net/qq_40693171/article/details/79695414#comments" title="評論次數(shù)" οnclick=********>Elements links3=doc.select("a[href]");System.out.println(links3);//輸出a開頭且擁有href標簽的內(nèi)容//<a href="https://blog.csdn.net/qq_40693171?viewmode=contents"><span onclickElement links4=doc.getElementById("popuLayer_js_q");//;按照id選取,因為id只有一個,所以這個links4為element//System.out.print(links4);Elements links5=doc.getElementsByClass("panel_body itemlist");//閱讀排行//System.out.println(links5);輸出我博客的閱讀排行欄目Elements links6=doc.getElementsByTag("script");//按照標簽 比如<a href**>的a <script src=**>的script標簽//System.out.println(links6);//<script src="https://csdnimg.cn/pubfooter/js/publib_footer-1.0.3.js?v201804111810" type="text/javascript"></script>/** 假設(shè)要輸入所有鏈接* 上面只是初步選取,仍然不是最終想要的內(nèi)容*/for(Element link:links3)//遍歷數(shù)組{String a1=link.attr("href");//每個元素都有鏈接的屬性href="https" 操作就像是hasmap一樣的映射關(guān)系。System.out.print(a1);//https://blog.csdn.net/qq_40693171String a2=link.text();System.out.println(a2);//好求窈窕 ***}} }

輸出:


  • 如果對后端、爬蟲等感性趣歡迎關(guān)注我的個人公眾號交流:bigsai

總結(jié)

以上是生活随笔為你收集整理的爬虫初识jsoup的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 毛片在线免费播放 | 超碰超碰超碰超碰超碰 | 香蕉污视频在线观看 | 欧美日韩激情在线一区二区三区 | 国产亚洲欧洲 | 九九啪 | 欧美在线性爱视频 | 美女张开腿露出尿口 | 久久的色偷偷 | 靠逼动漫 | 香蕉视频三级 | 国产成人精品一区二区三区免费 | 国产免费一区二区 | 日韩中文在线观看 | 黄色一级在线视频 | 曰批免费视频播放免费 | 久久综合激情 | 亚洲成av人片久久 | 第四色男人天堂 | 久久新 | 国产精品66 | www久久久| 亚洲精品成人无码毛片 | 成年人av在线播放 | av一区二区三区免费观看 | 懂色av成人一区二区三区 | 狠狠操网站| 成人91视频| 好吊操免费视频 | 美国免费黄色片 | 好吊日在线观看 | 伊人网站在线观看 | 一级不卡毛片 | 中文字幕在线亚洲 | 欧美vieox另类极品 | 五月深爱网 | 91人人看| 99热自拍偷拍 | 免费的黄色小视频 | 在线播放国产视频 | 最新av片| 亚洲最大福利视频 | 美女一区二区视频 | 亚洲一区二区三区中文字幕 | c逼| 黄色网址在线免费 | 国产精品美女久久久久图片 | av网站在线看 | 久久免费少妇高潮久久精品99 | 美女三级黄色 | 人妻丰满熟妇无码区免费 | 免费麻豆国产一区二区三区四区 | 黄色香蕉网 | av中文字幕一区二区三区 | 不卡av在线播放 | 妞干网精品| 国内激情| 91婷婷 | av美女在线 | 一级片免费观看视频 | 国产精品人人人人 | 天堂视频免费在线观看 | 日本黄色片一级 | 国产视频在线免费观看 | 高清无打码| 91成人国产综合久久精品 | 亚洲精品合集 | 国产区欧美区日韩区 | 99热在线这里只有精品 | 在线观看黄色免费网站 | 亚洲精品字幕在线 | 中文字幕无码人妻少妇免费 | 欧美日韩一级黄色片 | 麻豆一级片| 正在播放木下凛凛xv99 | 国产一区在线视频观看 | 亚洲av综合色区无码一区 | 国产91熟女高潮一区二区 | 欧美成人福利视频 | 中文字幕免费高清 | 久久国产网 | 国产秋霞 | 亚洲免费av在线 | 亚洲第三十七页 | 欧美色图亚洲视频 | 男人天堂2019 | se欧美| 国产51页| 国产一区二区在 | 依人成人 | 爱草视频| 成人精品一区日本无码网 | 国产精品国产一区二区三区四区 | 久久69| 色欲av永久无码精品无码蜜桃 | 亚洲免费观看高清 | 亚洲视屏一区 | av一区免费 | 边啃奶头边躁狠狠躁 |