shell 批量转换文件编码
相信大家在平時(shí)的跨平臺(tái)編程中碰到過文件編碼問題,比如在Windows代碼字符編碼方式是GB2312,然而轉(zhuǎn)到Linux卻只支持utf-8,雖然對(duì)代碼部分沒啥影響,但是很多中文注釋部分,卻一片亂碼,很讓人討厭。如果一個(gè)一個(gè)文件處理,轉(zhuǎn)換再另存為,很麻煩,下面就介紹一種使用shell腳本來批量轉(zhuǎn)換文件,其中使用到iconv工具。
轉(zhuǎn)換工具iconv
首先讓我們來認(rèn)識(shí)一下iconv工具,iconv命令可以將一種已知的字符集文件轉(zhuǎn)換成另一種已知的字符集文件。支持的編碼方式有:Unicode相關(guān)編碼,如UTF-8、UTF-16等等,各國(guó)采用的ANSI編碼,其中包括GB2312、BIG5等中文編碼方式。[^1]
iconv [選項(xiàng)…] [文件…]
| 參數(shù) | 說明 |
|---|---|
| -f, --from-code=NAME | 原始文本編碼 |
| -t, --to-code=NAME | 輸出文本編碼 |
| -l, --list | 列出所有已知的編碼集 |
| -c | 輸出文件中省略掉無效字符 |
| -o, --output=FILE | 輸出文件名 |
| -s, --silent | 不輸出警告 |
| -?, --help | 幫助 |
| -V, --version | 程序版本 |
舉例:
iconv -f gb2312 -t utf-8 gb.txt > utf8.txt
將gb里的編碼從GB2312轉(zhuǎn)化成UTF-8 并重定向到utf8.txt
轉(zhuǎn)換腳本
將輸入文件夾的所有的GB2312編碼的cpp,h,c文件轉(zhuǎn)換為utf-8編碼文件
#!/bin/bash
filelist=$(find $1 -name "*.cpp" -o -name "*.h" -o -name "*.c")
for file in $filelist
doecho $fileiconv -f gb2312 -t utf-8 $file > tmpif [ $? -eq 0 ] thenmv tmp $filefi
done
小結(jié)
本文介紹一種shell下使用iconv工具批量轉(zhuǎn)換文件編碼的方法。
參考文件
[^1] : https://baike.baidu.com/item/iconv/524310?fr=aladdin
總結(jié)
以上是生活随笔為你收集整理的shell 批量转换文件编码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 对单链表反转链表
- 下一篇: Visual Studio 中文显示乱码