java utf-8 gbk_Java 字符转码之UTF-8转为GBK/GB2312
java跟python類似的做法,在java中字符串的編碼是java修改過的一種Unicode編碼,所以看到j(luò)ava中的字符串,心理要默念這個(gè)東西是java修改過的一種Unicode編碼的編碼。
packagestring;importjava.nio.charset.Charset;public classUTF82GBK {public static void main(String[] args) throwsException {//系統(tǒng)的默認(rèn)編碼是GBK
System.out.println("Default Charset=" +Charset.defaultCharset());
String t= "hfjkds中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國hfsdkj fjldsajflkdsjaflkdsjalf sfdsfadas";//思路:先轉(zhuǎn)為Unicode,然后轉(zhuǎn)為GBK
String utf8 = new String(t.getBytes( "UTF-8"));//等同于://String utf8 = new String(t.getBytes( "UTF-8"),Charset.defaultCharset());
System.out.println(utf8);
String unicode= new String(utf8.getBytes(),"UTF-8");//等同于://String unicode = new String(utf8.getBytes(Charset.defaultCharset()),"UTF-8");
System.out.println(unicode);
String gbk= new String(unicode.getBytes("GBK"));//等同于://String gbk = new String(unicode.getBytes("GBK"),Charset.defaultCharset());
System.out.println(gbk);
}
}
packagecom.mkyong;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.InputStreamReader;public classUTF8ToGBK {public static void main(String[] args) throwsException {
File fileDir= new File("/home/user/Desktop/Unsaved Document 1");
BufferedReader in= new BufferedReader(newInputStreamReader(new FileInputStream(fileDir), "UTF-8"));
String str;while ((str = in.readLine()) != null) {
System.out.println(str);//java內(nèi)部只有unicode編碼 所以str是unicode編碼
String str2 = new String(str.getBytes("GBK"), "GBK");//str.getBytes("GBK")是gbk編碼,但是str2是unicode編碼
System.out.println(str2);
}
in.close();
}
}
問題的關(guān)鍵是new String(xxx.getBytes("gbk"), "gbk")這句話是什么意思,xxx.getBytes("gbk")得到的數(shù)組編碼是GBK,因此必須必須告訴java:我傳給你的數(shù)組是gbk編碼的,你在轉(zhuǎn)換成你內(nèi)部的編碼的時(shí)候記得要進(jìn)行一些處理,new String(xxx.getBytes("gbk"), "gbk"),這句話第二個(gè)“gbk”是告訴java傳遞給它的是gbk編碼的字符串。
String fullStr = new String(str.getBytes("UTF-8"), "UTF-8");//正常
String fullStr2 = new String(str.getBytes("UTF-8"), "GBK");//不正常,java內(nèi)置的編碼->utf8 被當(dāng)成GBK編碼轉(zhuǎn)換成java內(nèi)置的編碼
看一下jdk文檔是怎么說的
public String(byte[] bytes,
Charset charset)
Constructs a new?String?by decoding the specified array of bytes using the specified?charset.
那現(xiàn)在的問題就是,我怎么在String中持有GBK編碼的東西呢?
String str3 = new String(str.getBytes("GBK"),"ISO-8859-1");
System.out.println(new String(str3.getBytes("ISO-8859-1"),"GBK"));
總結(jié)
以上是生活随笔為你收集整理的java utf-8 gbk_Java 字符转码之UTF-8转为GBK/GB2312的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 适配PS5:索尼新品牌推出27英寸4K
- 下一篇: 中介者模式java_图解Java设计模式