日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 前端技术 > HTML >内容正文

HTML

Java正则表达式匹配、替换HTML内容

發布時間:2024/1/17 HTML 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Java正则表达式匹配、替换HTML内容 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

第一:像網頁鏈接<a .......... href="[url1]" .......>之間的內容中[URL[絕對地址替換成相對地址,首先要查找匹配這個鏈接,查找匹配這個串的正則表達式串為

(<\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)

??? //查找匹配的代碼如下:
????String? patternStrs="(<\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)";
??? PatternCompiler complier = new Perl5Compiler();
??? PatternMatcher matcher = new Perl5Matcher();

??? Pattern patternForLink = complier.compile(patternStrs,
????????????????????????????????????????????? Perl5Compiler.
????????????????????????????????????????????? CASE_INSENSITIVE_MASK);
??? PatternMatcherInput input = new PatternMatcherInput(htmlContent);
??? while (matcher.contains(input, patternForLink)) {
????? MatchResult match = matcher.getMatch();
??????//處理匹配的結果,是要替換還是要其他處理
??? }

??? 第二:對其他的標簽也類似只要把匹配的字符串改一下為要匹配的標簽就可以了。(如IMG標簽)
(<\s*img\s+(?:[^\s>]\s*){0,})src\s*=\s*("|'|)([^\2\s>]*)\2((?:\s*[^\s>]){0,}\s*>),這樣就可以處理
<img.....................src="[url]"...............>的標簽匹配,對其他的標簽也一樣......
總結:對于大量要處理的文本,建議還是用到正則表達式,而要處理的文本比較少時,用普通的字符串API處理函數就足夠了。

轉載于:https://www.cnblogs.com/bihailantian/archive/2010/09/20/1831951.html

總結

以上是生活随笔為你收集整理的Java正则表达式匹配、替换HTML内容的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。