日常笔记系列:java汉字判断
生活随笔
收集整理的這篇文章主要介紹了
日常笔记系列:java汉字判断
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
首先了解一下漢字的unicode編碼表:
| 基本漢字 | 20902字 | 4E00-9FA5 |
| 基本漢字補充 | 38字 | 9FA6-9FCB |
| 擴展A | 6582字 | 3400-4DB5 |
| 擴展B | 42711字 | 20000-2A6D6 |
| 擴展C | 4149字 | 2A700-2B734 |
| 擴展D | 222字 | 2B740-2B81D |
| 康熙部首 | 214字 | 2F00-2FD5 |
| 部首擴展 | 115字 | 2E80-2EF3 |
| 兼容漢字 | 477字 | F900-FAD9 |
| 兼容擴展 | 542字 | 2F800-2FA1D |
| PUA(GBK)部件 | 81字 | E815-E86F |
| 部件擴展 | 452字 | E400-E5E8 |
| PUA增補 | 207字 | E600-E6CF |
| 漢字筆畫 | 36字 | 31C0-31E3 |
| 漢字結構 | 12字 | 2FF0-2FFB |
| 漢語注音 | 22字 | 3105-3120 |
| 注音擴展 | 22字 | 31A0-31BA |
| 〇 | 1字 | 3007 |
一般在使用時候,基本漢字就夠了,也就是2萬的那個,如果需要對漢字進行判斷,就需要正則判斷一下就可以。如果要求比較嚴格,可以對regEx部分的Unicode的范圍進行合理的擴大就可以實現更大范圍的判斷。
import java.util.regex.Matcher; import java.util.regex.Pattern;public static boolean isChinese(String str) {String regEx = "[\u4e00-\u9fa5]";Pattern pat = Pattern.compile(regEx);Matcher matcher = pat.matcher(str);boolean flg = false;if (matcher.find())flg = true;return flg;}總結
以上是生活随笔為你收集整理的日常笔记系列:java汉字判断的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 汉字unicode编码范围
- 下一篇: 和画意思相近的字_画字五行属什么,画字在