java jsoup html_使用JAVA中的JSOUP从HTML中提取CSS样式
如果樣式嵌入在Element中,則只需使用.attr(“style”).
JSoup不是Html渲染器,它只是一個HTML解析器,因此您必須從檢索到的< style>中解析內(nèi)容.標(biāo)記html內(nèi)容.你可以使用一個簡單的正則表達(dá)式;但它并不適用于所有情況.您可能希望使用CSS解析器執(zhí)行此任務(wù).
public class Test {
public static void main(String[] args) throws Exception {
String html = "\n" +
"
\n"+"
Page 1\n"+"\n"+
"
\n"+"
"\n"+
"\n"+
"\n"+
"";
Document doc = Jsoup.parse(html);
Element style = doc.select("style").first();
Matcher cssMatcher = Pattern.compile("[.](\\w+)\\s*[{]([^}]+)[}]").matcher(style.html());
while (cssMatcher.find()) {
System.out.println("Style `" + cssMatcher.group(1) + "`: " + cssMatcher.group(2));
}
}
}
將輸出:
Style `ft00`: font-size:11px;font-family:Times;color:#ffffff;
Style `ft01`: font-size:11px;font-family:Times;color:#ffffff;
總結(jié)
以上是生活随笔為你收集整理的java jsoup html_使用JAVA中的JSOUP从HTML中提取CSS样式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: git 如何清理操作日志_git如何清空
- 下一篇: 关于html文档,关于HTML的简介