java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言
今天又對(duì)我的博客首頁(yè)進(jìn)行了一次版本的更新,使其自適應(yīng)屏幕,獲得更好的用戶體驗(yàn),然后就出現(xiàn)點(diǎn)小問(wèn)題,那就是原來(lái)的摘要是人為添加的,有長(zhǎng)有短,對(duì)自適應(yīng)屏幕有影響,所以我們現(xiàn)在是截取文章的前200個(gè)字來(lái)完成的。
通過(guò)閱讀前輩的文章然后自己寫(xiě)了一個(gè)工具類(lèi),用java代碼來(lái)去掉文章的html標(biāo)簽,然后截取前200字,本來(lái)可以用前端來(lái)做的,但是前端來(lái)操作勢(shì)必會(huì)對(duì)頁(yè)面進(jìn)行重新的渲染,影響頁(yè)面的打開(kāi)速度,所以我建議后端是最穩(wěn)妥的方式,當(dāng)然你也可以用來(lái)防止xss攻擊,將值傳到這個(gè)工具類(lèi)里,獲取純文本后就可以防止xss攻擊。
代碼部分:import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class OutHtml {
public String delHTMLTag(String htmlStr){
String regEx_script="
String regEx_style="
String regEx_html="<[^>]+>"; //定義HTML標(biāo)簽的正則表達(dá)式
Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher m_script=p_script.matcher(htmlStr);
htmlStr=m_script.replaceAll(""); //過(guò)濾script標(biāo)簽
Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher m_style=p_style.matcher(htmlStr);
htmlStr=m_style.replaceAll(""); //過(guò)濾style標(biāo)簽
Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher m_html=p_html.matcher(htmlStr);
htmlStr=m_html.replaceAll(""); //過(guò)濾html標(biāo)簽
return htmlStr.trim(); //返回文本字符串
}
}
這樣就可以用java代碼來(lái)去掉文章的html標(biāo)簽,然后你們直接復(fù)制調(diào)用就完全OK
你還沒(méi)有登錄,請(qǐng)先使用 QQ登錄 或 注冊(cè)!
文章評(píng)論
發(fā)表評(píng)論
總結(jié)
以上是生活随笔為你收集整理的java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 黑客档案
- 下一篇: axureux中后台管理信息系统通用原型