linux 中xls格式的文件,如何在命令行中将XLS文件转换为CSV [Linux] | MOS86
將Microsoft Excel工作表(XLS文件)轉(zhuǎn)換為逗號分隔文件(CSV)在使用Office產(chǎn)品時相對來說非常簡單,但程序員在命令行中可能是一項繁瑣的任務(wù)。當(dāng)您使用XLS文件時,可能會出現(xiàn)這種情況,并且您需要在格式化數(shù)據(jù)后填寫數(shù)據(jù)庫。將XLS轉(zhuǎn)換為CSV是理想的方式,因為CSV是可以容易地以任何語言操作的格式,無論是Shell,Perl,Ruby,Python還是Java。在這篇文章中,我們將看到將XLS文件轉(zhuǎn)換為CSV的最佳方法,我們還將討論使用這些方法的專業(yè)和缺點。
catdoc(C)
我們要談的第一個命令行工具是catdoc。該工具用C寫成V.B.瓦格納。
1.1如何安裝it:
從這里下載工具。轉(zhuǎn)到您的下載目錄并解壓縮。您可以使用以下命令(萬一遇到問題):
gunzip catdoc-0.94.2.柏油。gz tar xvf catdoc-0.94.2.tar
現(xiàn)在我們有一個catdoc-0.94.2目錄。進入該目錄,并運行以下命令來安裝它.:
./ configure make make install
安裝是一個簡單的過程,你不應(yīng)該在這里遇到任何問題。
1.2如何使用it:
有幾個選項來運行命令。一世這些選項用于指定在源文件中使用哪個字符編碼,以及目標(biāo)文件的字符編碼方式。這里我使用了cpl1252這是Microsoft字符編碼和8859-1,它用于西歐字符編碼。您可以使用help命令使用可用的其他選項。
xls2csv --help1.3優(yōu)點和缺點:
Pros:直接安裝
Cons:在多個頁面方案中沒有選擇性轉(zhuǎn)換,它覆蓋了xls文件中存在的所有工作表(一個解決方法是在每個工作表中顯式指定頁腳,然后在命令中使用選項-b),問題幾乎沒有歐洲字符,日期字段的問題(日期字段混亂了大時間),與報價混淆。
xls2csv(在Perl中)
我們要討論的第二個工具是Ken Prows在Perl中編寫的Perl腳本xls2csv。
2.1如何安裝it:
在這里下載腳本。Gunzip和tar就像我們在上一節(jié)中所做的那樣,去提取的目錄,并使用以下命令安裝它.:
perl Makefile。PL make make test make install
記住這個Perl腳本使用一些其他Perl模塊:
Locale::Recode Unicode::Map Spreadsheet::ParseExcel Text::CSV_XS
在安裝xls2csv時,會給出所提到的perl模塊尚未安裝的錯誤。它會要求您下載模塊。詢問時下載并安裝這些模塊。所有這些模塊安裝都需要root權(quán)限。如果您沒有root權(quán)限,那么您應(yīng)該按照此處給出的說明來安裝Perl模塊。
2.2如何使用it:
以下命令可用于將Microsoft Excel轉(zhuǎn)換為csv:
xls2csv -x我們使用與以前的工具相同的字符編碼。
2.3優(yōu)點和cons:
Pros:好的西歐字符轉(zhuǎn)換和日期字段,支持選擇性多頁轉(zhuǎn)換,
Cons:幾個Perl模塊需要安裝,第一個單元格不應(yīng)該是空的(否則它跳過整個行),混淆引號
有幾個其他方式也是如此。Python和Java中的一些腳本也可以使用,但它們不如這里討論的兩個。我希望文章解決你的問題。問題和建議始終受到歡迎。干杯:)
.
總結(jié)
以上是生活随笔為你收集整理的linux 中xls格式的文件,如何在命令行中将XLS文件转换为CSV [Linux] | MOS86的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Protel DXP 使用教程 - 自定
- 下一篇: linux命令sel是什么意思,sel