日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > java >内容正文

java

java utf-8 gbk_Java 字符转码之UTF-8转为GBK/GB2312

發(fā)布時(shí)間:2023/12/10 java 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java utf-8 gbk_Java 字符转码之UTF-8转为GBK/GB2312 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

java跟python類似的做法,在java中字符串的編碼是java修改過的一種Unicode編碼,所以看到j(luò)ava中的字符串,心理要默念這個(gè)東西是java修改過的一種Unicode編碼的編碼。

packagestring;importjava.nio.charset.Charset;public classUTF82GBK {public static void main(String[] args) throwsException {//系統(tǒng)的默認(rèn)編碼是GBK

System.out.println("Default Charset=" +Charset.defaultCharset());

String t= "hfjkds中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國hfsdkj fjldsajflkdsjaflkdsjalf sfdsfadas";//思路:先轉(zhuǎn)為Unicode,然后轉(zhuǎn)為GBK

String utf8 = new String(t.getBytes( "UTF-8"));//等同于://String utf8 = new String(t.getBytes( "UTF-8"),Charset.defaultCharset());

System.out.println(utf8);

String unicode= new String(utf8.getBytes(),"UTF-8");//等同于://String unicode = new String(utf8.getBytes(Charset.defaultCharset()),"UTF-8");

System.out.println(unicode);

String gbk= new String(unicode.getBytes("GBK"));//等同于://String gbk = new String(unicode.getBytes("GBK"),Charset.defaultCharset());

System.out.println(gbk);

}

}

packagecom.mkyong;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.InputStreamReader;public classUTF8ToGBK {public static void main(String[] args) throwsException {

File fileDir= new File("/home/user/Desktop/Unsaved Document 1");

BufferedReader in= new BufferedReader(newInputStreamReader(new FileInputStream(fileDir), "UTF-8"));

String str;while ((str = in.readLine()) != null) {

System.out.println(str);//java內(nèi)部只有unicode編碼 所以str是unicode編碼

String str2 = new String(str.getBytes("GBK"), "GBK");//str.getBytes("GBK")是gbk編碼,但是str2是unicode編碼

System.out.println(str2);

}

in.close();

}

}

問題的關(guān)鍵是new String(xxx.getBytes("gbk"), "gbk")這句話是什么意思,xxx.getBytes("gbk")得到的數(shù)組編碼是GBK,因此必須必須告訴java:我傳給你的數(shù)組是gbk編碼的,你在轉(zhuǎn)換成你內(nèi)部的編碼的時(shí)候記得要進(jìn)行一些處理,new String(xxx.getBytes("gbk"), "gbk"),這句話第二個(gè)“gbk”是告訴java傳遞給它的是gbk編碼的字符串。

String fullStr = new String(str.getBytes("UTF-8"), "UTF-8");//正常

String fullStr2 = new String(str.getBytes("UTF-8"), "GBK");//不正常,java內(nèi)置的編碼->utf8 被當(dāng)成GBK編碼轉(zhuǎn)換成java內(nèi)置的編碼

看一下jdk文檔是怎么說的

public String(byte[] bytes,

Charset charset)

Constructs a new?String?by decoding the specified array of bytes using the specified?charset.

那現(xiàn)在的問題就是,我怎么在String中持有GBK編碼的東西呢?

String str3 = new String(str.getBytes("GBK"),"ISO-8859-1");

System.out.println(new String(str3.getBytes("ISO-8859-1"),"GBK"));

總結(jié)

以上是生活随笔為你收集整理的java utf-8 gbk_Java 字符转码之UTF-8转为GBK/GB2312的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。