當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

将unicode转换成汉字

發(fā)布時(shí)間：2023/12/29 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了将unicode转换成汉字小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

將unicode轉(zhuǎn)換成漢字的引申

unicode轉(zhuǎn)換成漢字方法：

public static String UnicodeToString(String str) { Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))"); Matcher matcher = pattern.matcher(str); char ch; while (matcher.find()) { ch = (char) Integer.parseInt(matcher.group(2), 16); str = str.replace(matcher.group(1), ch + ""); } return str; }

上述方法利用pattern類和matcher類實(shí)現(xiàn)轉(zhuǎn)換，但是在eclipse中調(diào)試該方法后發(fā)現(xiàn)，標(biāo)準(zhǔn)16進(jìn)制的unicode組成的String串看到的就是中文，其他形式可以變通使用。這里見到了pattern類，簡(jiǎn)單學(xué)習(xí)一下。

pattern類

public final class Pattern

extends Object implements Serializable 正則表達(dá)式的編譯表示形式。

指定為字符串的正則表達(dá)式必須首先被編譯為此類的實(shí)例。然后，可將得到的模式用于創(chuàng)建 Matcher 對(duì)象，依照正則表達(dá)式，該對(duì)象可以與任意字符序列匹配。執(zhí)行匹配所涉及的所有狀態(tài)都駐留在匹配器中，所以多個(gè)匹配器可以共享同一模式。

因此，典型的調(diào)用順序是

Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
? boolean b = m.matches();

在僅使用一次正則表達(dá)式時(shí)，可以方便地通過此類定義 matches 方法。此方法編譯表達(dá)式并在單個(gè)調(diào)用中將輸入序列與其匹配。語(yǔ)句

boolean b = Pattern.matches("a*b", "aaaaab"); 等效于上面的三個(gè)語(yǔ)句，盡管對(duì)于重復(fù)的匹配而言它效率不高，因?yàn)樗辉试S重用已編譯的模式。

此類的實(shí)例是不可變的，可供多個(gè)并發(fā)線程安全使用。Matcher 類的實(shí)例用于此目的則不安全。

正則表達(dá)式的構(gòu)造摘要

的非捕獲組構(gòu)造匹配字符字符類預(yù)定義字符類POSIX 字符類（僅 US-ASCII）java.lang.Character 類（簡(jiǎn)單的 java 字符類型）Unicode 塊和類別的類邊界匹配器Greedy 數(shù)量詞Reluctant 數(shù)量詞Possessive 數(shù)量詞Logical 運(yùn)算符Back 引用引用特殊構(gòu)造（非捕獲）

x	字符 x
\\	反斜線字符
\0n	帶有八進(jìn)制值 0 的字符 n (0 <= n <= 7)
\0nn	帶有八進(jìn)制值 0 的字符 nn (0 <= n <= 7)
\0mnn	帶有八進(jìn)制值 0 的字符 mnn（0 <= m <= 3、0 <= n <= 7）
\xhh	帶有十六進(jìn)制值 0x 的字符 hh
\uhhhh	帶有十六進(jìn)制值 0x 的字符 hhhh
\t	制表符 ('\u0009')
\n	新行（換行）符 ('\u000A')
\r	回車符 ('\u000D')
\f	換頁(yè)符 ('\u000C')
\a	報(bào)警 (bell) 符 ('\u0007')
\e	轉(zhuǎn)義符 ('\u001B')
\cx	對(duì)應(yīng)于 x 的控制符
[abc]	a、b 或 c（簡(jiǎn)單類）
[^abc]	任何字符，除了 a、b 或 c（否定）
[a-zA-Z]	a 到 z 或 A 到 Z，兩頭的字母包括在內(nèi)（范圍）
[a-d[m-p]]	a 到 d 或 m 到 p：[a-dm-p]（并集）
[a-z&&[def]]	d、e 或 f（交集）
[a-z&&[^bc]]	a 到 z，除了 b 和 c：[ad-z]（減去）
[a-z&&[^m-p]]	a 到 z，而非 m 到 p：[a-lq-z]（減去）
.	任何字符（與行結(jié)束符可能匹配也可能不匹配）
\d	數(shù)字：[0-9]
\D	非數(shù)字： [^0-9]
\s	空白字符：[ \t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	單詞字符：[a-zA-Z_0-9]
\W	非單詞字符：[^\w]
\p{Lower}	小寫字母字符：[a-z]
\p{Upper}	大寫字母字符：[A-Z]
\p{ASCII}	所有 ASCII：[\x00-\x7F]
\p{Alpha}	字母字符：[\p{Lower}\p{Upper}]
\p{Digit}	十進(jìn)制數(shù)字：[0-9]
\p{Alnum}	字母數(shù)字字符：[\p{Alpha}\p{Digit}]
\p{Punct}	標(biāo)點(diǎn)符號(hào)：!"#$%&'()*+,-./:;<=>?@[\]^_`{\|}~
\p{Graph}	可見字符：[\p{Alnum}\p{Punct}]
\p{Print}	可打印字符：[\p{Graph}\x20]
\p{Blank}	空格或制表符：[ \t]
\p{Cntrl}	控制字符：[\x00-\x1F\x7F]
\p{XDigit}	十六進(jìn)制數(shù)字：[0-9a-fA-F]
\p{Space}	空白字符：[ \t\n\x0B\f\r]
\p{javaLowerCase}	等效于 java.lang.Character.isLowerCase()
\p{javaUpperCase}	等效于 java.lang.Character.isUpperCase()
\p{javaWhitespace}	等效于 java.lang.Character.isWhitespace()
\p{javaMirrored}	等效于 java.lang.Character.isMirrored()
\p{InGreek}	Greek 塊（簡(jiǎn)單塊）中的字符
\p{Lu}	大寫字母（簡(jiǎn)單類別）
\p{Sc}	貨幣符號(hào)
\P{InGreek}	所有字符，Greek 塊中的除外（否定）
[\p{L}&&[^\p{Lu}]]	所有字母，大寫字母除外（減去）
^	行的開頭
$	行的結(jié)尾
\b	單詞邊界
\B	非單詞邊界
\A	輸入的開頭
\G	上一個(gè)匹配的結(jié)尾
\Z	輸入的結(jié)尾，僅用于最后的結(jié)束符（如果有的話）
\z	輸入的結(jié)尾
X?	X，一次或一次也沒有
X*	X，零次或多次
X+	X，一次或多次
X{n}	X，恰好 n 次
X{n,}	X，至少 n 次
X{n,m}	X，至少 n 次，但是不超過 m 次
X??	X，一次或一次也沒有
X*?	X，零次或多次
X+?	X，一次或多次
X{n}?	X，恰好 n 次
X{n,}?	X，至少 n 次
X{n,m}?	X，至少 n 次，但是不超過 m 次
X?+	X，一次或一次也沒有
X*+	X，零次或多次
X++	X，一次或多次
X{n}+	X，恰好 n 次
X{n,}+	X，至少 n 次
X{n,m}+	X，至少 n 次，但是不超過 m 次
XY	X 后跟 Y
X\|Y	X 或 Y
(X)	X，作為捕獲組
\n	任何匹配的 n^th 捕獲組
\	Nothing，但是引用以下字符
\Q	Nothing，但是引用所有字符，直到 \E
\E	Nothing，但是結(jié)束從 \Q 開始的引用
(?:X)	X，作為非捕獲組
(?idmsux-idmsux)	Nothing，但是將匹配標(biāo)志i d m s u x on - off
(?idmsux-idmsux:X)	X，作為帶有給定標(biāo)志 i d m s u x on - off
(?=X)	X，通過零寬度的正 lookahead
(?!X)	X，通過零寬度的負(fù) lookahead
(?<=X)	X，通過零寬度的正 lookbehind
(?<!X)	X，通過零寬度的負(fù) lookbehind
(?>X)	X，作為獨(dú)立的非捕獲組

總結(jié)

以上是生活随笔為你收集整理的将unicode转换成汉字的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：标准pcm数据(正弦波、方波、三角波)解
下一篇： GMGC数娱节前瞻，好玩好看有逼格