Jsoup解析HTML字符串
生活随笔
收集整理的這篇文章主要介紹了
Jsoup解析HTML字符串
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
在處理一個(gè)html字符串。我們可能需要對(duì)其進(jìn)行解析,修改內(nèi)容或者提取內(nèi)容等,那麼我們應(yīng)該解決這一系列的問(wèn)題呢?Jsoup可以幫助我們輕松的解決這些問(wèn)題。
我們可以使用靜態(tài)Jsoup.parse(String html) 方法或 Jsoup.parse(String html, String baseUri) 。
String html = "<html><head><title>First parse</title></head>"+ "<body><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html);解說(shuō):
A:
parse(String html, String baseUri) 這方法能夠?qū)⑤斎氲腍TML解析為一個(gè)新的文檔 (Document),參數(shù) baseUri 是用來(lái)將相對(duì) URL 轉(zhuǎn)成絕對(duì)URL,
并指定從哪個(gè)網(wǎng)站獲取文檔。如這個(gè)方法不適用,你可以使用 parse(String html) 方法來(lái)解析成HTML字符串如上面的示例。
B:
只要解析的不是空字符串,就能返回一個(gè)結(jié)構(gòu)合理的文檔,其中包含(至少) 一個(gè)head和一個(gè)body元素。
C:
一旦擁有了一個(gè)Document,你就可以使用Document中適當(dāng)?shù)姆椒ɑ蛩割?Element和Node中的方法來(lái)取得相關(guān)數(shù)據(jù)。
總結(jié)
以上是生活随笔為你收集整理的Jsoup解析HTML字符串的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Java用户修改密码
- 下一篇: Jsoup从元素中抽取属性 文本和HTM