當前位置：首頁 > 编程语言 > java >内容正文

java

Java：根据字节数截取字符串，但是汉字不能截取半个。

發布時間：2025/3/15 java 44 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java：根据字节数截取字符串，但是汉字不能截取半个。小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

截取字符串指定指定字節數的內容，如果指定的字節數在漢字的中間，漢字不能截取部分，只截取前面的內容。

package com.lcx.test;import java.io.UnsupportedEncodingException; /*** * 截取字符串指定指定字節數的內容，如果指定的字節數在漢字的中間，漢字不能截取部分，只截取前面的內容。如"ab我",截取3個字節的字符，如果采用非iso-8859-1編碼漢字所占字符超過1個字節，所以此時只能截取"ab" 。題目意思：應該是字符串中不存在亂碼的情況下，如果編碼形式是iso-8859-1,那么截取字符串就是截取的字節格式，所以主要考核的是非iso-8859-1編碼格式是如何截取。思路：假設截取 n個字節，截取字符串的n個字符，n個字符的GBK編碼的字節數一定>=要截取字節個數，如果等于說明全是字母如果不等，說明包含漢字，截取的n個字符的字節數>需要截取的n個字節,故截取字符n-1，再次進行比較，直到，字節數n 和截取字符串的字節數相等,那么所截取的字符串就是結果。 * @author**/ public class SubStringByBytes {/*** @param args* @throws UnsupportedEncodingException*/public static void main(String[] args) throws UnsupportedEncodingException {String en = "a";String cn = "我";System.out.println("英文_ISO-8859-1：" + en.getBytes("ISO-8859-1").length);System.out.println("漢字_ISO-8859-1：" + cn.getBytes("ISO-8859-1").length);System.out.println("英文_GBK：" + en.getBytes("GBK").length);System.out.println("漢字_GBK：" + cn.getBytes("GBK").length);System.out.println("英文_UTF-8：" + en.getBytes("UTF-8").length);System.out.println("漢字_UTF-8：" + cn.getBytes("UTF-8").length);String str = "abc我們啊ddd";/** 這里還和截取何種編碼的字節數有關，如果截取9個字節* GBK 是 abc我們啊* UTF8是 abc我們*/System.out.println(subStringByBytes(str, 9,"gbk"));System.out.println(subStringByBytes(str, 9,"utf-8"));}/*** * @param str 要截取的字符串* @param bytes 截取的字節數* @return* @throws UnsupportedEncodingException*/public static String subStringByBytes(String str, int bytes,String charSetName) throws UnsupportedEncodingException {String subAfter = str.substring(0, bytes);int temp = bytes;try {//直到截取的字符串的字節數和需要的截取的字節數相等位為止while(bytes < subAfter.getBytes(charSetName).length){subAfter = subAfter.substring(0,--temp );}} catch (UnsupportedEncodingException e) {e.printStackTrace();}return subAfter;}/*** * @return 當前系統的編碼格式 */public static String getSystemEncode() {System.getProperties().list(System.out);// 得到當前的系統屬性。并將屬性列表輸出到控制臺String encoding = System.getProperty("file.encoding");System.out.println("Encoding:" + encoding);return encoding;} }
重點就是要區分英文單個字符串和漢字單個字符串的不同，在非iso-8859-1的情況下都不相同，這樣就可以進行區分了。

結果截圖：

漢字在各種編碼下所占字節數請見：

http://www.cnblogs.com/lancidie/archive/2013/04/12/3017241.html

總結

以上是生活随笔為你收集整理的Java：根据字节数截取字符串，但是汉字不能截取半个。的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Django_模板
下一篇：好文推荐：深入分析Java线程池的实现原

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

java

Java：根据字节数截取字符串，但是汉字不能截取半个。

總結