日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > linux >内容正文

linux

java处理linux中的 m_Linux下处理BOM头和^M的简单方法

發(fā)布時(shí)間:2023/12/10 linux 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java处理linux中的 m_Linux下处理BOM头和^M的简单方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Linux在網(wǎng)絡(luò)服務(wù)器、嵌入式設(shè)備的市場(chǎng)上占有較大份額,Microsoft Windows在桌面操作系統(tǒng)上占有較大的份額,因此有很多的人喜歡用Windows去控制操作Linux。

既然用Windows去控制Linux,難免導(dǎo)致Windows系統(tǒng)上的產(chǎn)生的文件以某種途徑傳到了Linux系統(tǒng)中,因而導(dǎo)致顯示問(wèn)題或者出現(xiàn)亂碼的情況。

例如用Windows自帶的“記事本”(notepad)程序默認(rèn)保存的文件會(huì)在每一行的結(jié)尾處帶有^M標(biāo)記。

PS: 一些常見(jiàn)的錯(cuò)誤例子:有的人可能有疑問(wèn),為什么我用記事本把文件保存成UTF-8也不好用。還有的人在執(zhí)行“sed -i '/^$/d' filename”時(shí)發(fā)現(xiàn)明明有空格卻沒(méi)有刪除。

因此在日常使用過(guò)程中,無(wú)論是用什么工具編輯文件上傳到Linux服務(wù)器,都需要注意換行符問(wèn)題。

現(xiàn)象:

1.cat程序顯示有問(wèn)題

如文件的開(kāi)頭顯示“?t”

2.bash、python等文件執(zhí)行時(shí)報(bào)錯(cuò)

如-bash: ./someshname.sh: /bin/bash^M: bad interpreter: No such file or directory

但是這種情況如果不想轉(zhuǎn)換換行符,可以直接用相應(yīng)的解釋器去執(zhí)行這個(gè)文件,如/bin/bash?./someshname.sh

3.其他應(yīng)用程序如php、java等運(yùn)行時(shí)報(bào)錯(cuò)

解釋:

換行符(newline、line ending、end of line(eol)或line break),是一種控制字符,用于區(qū)分表示每一行的結(jié)束。換行符通常由line feed (LF)和carriage return (CR)兩者中的一種或者它們的組合出現(xiàn)在計(jì)算機(jī)系統(tǒng)中,常見(jiàn)的換行符有三種:LF (UNIX and OS X \n)

CR (Classic Mac \r)

CRLF(Windows \r\n)

LF是Line Feed的縮寫(xiě),CR是Carriage Return的縮寫(xiě),他們的控制字符(\r,\n還是\r\n)由對(duì)應(yīng)的ANSCII表示。

之所以出現(xiàn)“^M ”是因?yàn)閊M在ANSCII中就表示Carriage Return即\r所以如果在Linux的某個(gè)打印輸出中出現(xiàn)了^M,表示換行符是Windows格式的。

BOM是Byte order mark的縮寫(xiě),釋義為“字節(jié)順序標(biāo)記”,用于明確表明此文件屬于Unicode編碼,其他的一些作用可以參考維基百科的英文頁(yè)面(顯然中文頁(yè)面解釋的不全面)。

解決辦法:

這個(gè)問(wèn)題其實(shí)簡(jiǎn)單到?jīng)]有必要用一篇文章的篇幅來(lái)表述,簡(jiǎn)答說(shuō)就一句話:可以借助dos2unix 工具,將Windows格式的文本文件轉(zhuǎn)化成Linux下可用的格式。但為了方便那些需要詳細(xì)了解的人,特地多寫(xiě)幾句如下。

# Remove BOM and ^M (BOM and ^M can come from Windows notepad program and save as 'ANSI' or 'UTF-8')

# such as "example^M$", ANSI, ASCII text, with CRLF line terminators

# such as "M-oM-;M-?example^M$", UTF-8, UTF-8 Unicode (with BOM) text, with CRLF line terminators

# Linux right format is "example$", ASCII text

# other method is using vim [noeol][dos] :set ff=unix

# determine file typefile?testfilename

# display $ at end of each line, display TAB characters as ^I, use ^ and M- notation, except for LFD and TABocat?-A?testfilename

#Text file format converters. Convert text files with DOS or Mac line endings to Unix line endings and vice versa.

# Debian & Ubuntu: apt-get install dos2unix

# RHEL & CentOS: yum install dos2unix

# DOS/Mac to Unix and vice versa text file format converterdos2unix?testfilename

關(guān)于顯示亂碼問(wèn)題

1.有可能跟終端(SSH連接工具)有關(guān)系,嘗試調(diào)整字符編碼為utf-8

2.有可能是系統(tǒng)原因,如缺少中文支持

一些可用的參考:

tag:bad interpreter,移除BOM,dos2unix命令,CRLF,Linux換行符

--end--

總結(jié)

以上是生活随笔為你收集整理的java处理linux中的 m_Linux下处理BOM头和^M的简单方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。