收集正则
? ?過濾所有非中文非英文字符 :replaceAll("[^\\u4e00-\\u9fa5|A-Za-z]", " ")
? 過濾標點符號:replaceAll("[\\pP‘’“”]", " ")
判斷獲得的每個字符的unicode編碼,漢字是有范圍的,具體是\u4E00-\u9FA5 和 \uF900-\uFA2D 不在這個范圍中的就不是漢字。 \u表示是16進制轉載于:https://www.cnblogs.com/linchuxin/archive/2012/03/16/2400673.html
總結
- 上一篇: IIS+php无法上传图片(转载自htt
- 下一篇: VS 2005 不能调试无法找到调试信息