當前位置：首頁 > 编程语言 > java >内容正文

java

Java io字符流读入英文_Java IO 系列教程(四)-字符输入流(2)

發布時間：2023/12/2 java 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java io字符流读入英文_Java IO 系列教程(四)-字符输入流(2) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文介紹字符輸入流

在前面一節中，我們向一個文件中寫入了一些字符，通過圖片可以看出總共是6個中文字符和一個換行，總共是20個字節，可以推算出字符編碼是utf-8，每個漢子占3三個字節。本文就用字符輸入流來讀一下。

代碼部分

package io.charStream;

import java.io.FileInputStream;

import java.io.FileReader;

/**

* @Author: micro cloud fly

* @Description: 字符流學習-FileReader

* @Date: Created in 10:20 上午 2020/10/20

public class Demo1 {

public static void main(String[] args) throws Exception {

//文件內容為Abcdefg，當文件中有中文時，utf-8編碼的每個中文占三個字節，那么每個字節讀取的時候打印出來就是亂碼了

FileInputStream inputStream = new FileInputStream("/Users/java0904/Pictures/imgs/1.txt");

//int count = 0;

打印

//while((count=inputStream.read())!=-1){

// System.out.println((char)count);

//}

文件內容為:希望你開心hah234，打印出來的是一片亂碼

//inputStream = new FileInputStream("/Users/java0904/Pictures/imgs/2.txt");

//count = 0;

打印

//while((count=inputStream.read())!=-1){

// System.out.println((char)count);

//}

//改為用字符流進行讀取，filereader內部做了編碼的確認工作，即使有中文也有英文，讀取也不會亂碼，是不是很神奇

FileReader fileReader = new FileReader("/Users/java0904/Pictures/imgs/filewriter.txt");

//int count = 0;

//while ((count = fileReader.read()) != -1) {

// System.out.println((char) count);

//}

//也可以一次讀取多個

int count = 0;

char[] cbuf = new char[1];

while ((count = fileReader.read(cbuf)) != -1) {

System.out.println("count:"+ count +", "+new String(cbuf, 0, count));

}

System.out.println("----");

}

輸出

count:1, 你

count:1, 好

count:1,

count:1, 我

count:1, 是

count:1, 小

count:1, 微

----

問題

以下這段代碼需要格外注意下

int count = 0;

char[] cbuf = new char[1];

while ((count = fileReader.read(cbuf)) != -1) {

System.out.println("count:"+ count +", "+new String(cbuf, 0, count));

}

我們都知道java中char類型占用2個字節，而文件中的中文是占用3個字節，那么為什么一個2字節的char數組，可以裝入3字節的漢字呢？

這其中一定是java搞的鬼了。

原因

java 是采用Unicode編碼，它為每種語言中的每個字符設定了統一并且唯一的二進制編碼，以滿足跨語言、跨平臺進行文本轉換、處理的要求。通常Unicode占用兩字節，也就說Unicode用兩字節就能表示世界上全部語言。UTF-8(是針對Unicode的一種可變長度字符編碼。重點是“可變”，UTF-8根據存儲的字符類型不一樣，他所占的字節是不一樣的，例如，英文時，只占用1個字節，中文時則膨脹為3個字節。

編譯后生成的class文件會把漢字轉化成Unicode的兩字節，也就說Java內部或者說Jvm內部對字符的編碼計算基于Unicode雙字節，而外部顯示存儲則是用UTF-8，通過這種方式從而實現兩字節的Char存儲UTF-8編碼的字符。

總結

以上是生活随笔為你收集整理的Java io字符流读入英文_Java IO 系列教程(四)-字符输入流(2)的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： tim如何恢复聊天记录(腾讯tim怎么用
下一篇：下载不了java应用程序_Java 7u

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

java

Java io字符流读入英文_Java IO 系列教程(四)-字符输入流(2)

總結