java利用htmlparser得到网页html内容
生活随笔
收集整理的這篇文章主要介紹了
java利用htmlparser得到网页html内容
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
java利用htmlparser得到網(wǎng)頁(yè)html內(nèi)容,利用org.htmlparser.Parser包我們可以很輕松取到任何頁(yè)面的源代碼,方法如下:
?
/*** 返回網(wǎng)頁(yè)內(nèi)容* * @param path* @return*/public static String getItemDesc() {String htmlStr = "";try {URL url = new URL("http://www.lingshij.com");URLConnection conn = url.openConnection();conn.setConnectTimeout(5000);conn.setReadTimeout(15000);Parser parser = new Parser();parser.setConnection(conn);parser.setEncoding("GBK");TextExtractingVisitor visitor = new TextExtractingVisitor();parser.visitAllNodesWith(visitor);htmlStr = visitor.getExtractedText();} catch (ParserException e) {e.printStackTrace();} catch (MalformedURLException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} catch (Exception e) {e.printStackTrace();}return htmlStr;}?
轉(zhuǎn)載于:https://www.cnblogs.com/stream1/archive/2012/08/03/htmlparser.html
總結(jié)
以上是生活随笔為你收集整理的java利用htmlparser得到网页html内容的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。