html拆分单元格多行,拆分一个单元格中多行字符到不同单元格
有如下格式excel數(shù)據(jù):
Number? ?? ?? ???ID? ?? ?? ?? ?? ? Assignment
1? ?? ?? ?? ?? ?? ?? ?A? ?? ?? ?? ?? ?? ?? ???AS1
B? ?? ?? ?? ?? ?? ?? ???AS2
C? ?? ?? ?? ?? ?? ?? ???AS3
2? ?? ?? ?? ?? ?? ?? ?A? ?? ?? ?? ?? ?? ?? ???AS5
D? ?? ?? ?? ?? ?? ?? ???AS2
3? ?? ?? ?? ?? ?? ?? ?E? ?? ?? ?? ?? ?? ?? ???AS6
...
以Number為1的這個(gè)觀察值來說,ID:A,B,C在同一個(gè)excel單元格里的不同行,同理Assigment:AS1,AS2,AS3也在同一個(gè)excel單元格里的不同行。
現(xiàn)想用stata將同一個(gè)單元格中不同行的string轉(zhuǎn)入不同觀察值,如下格式所示:
Number? ?? ?? ?ID? ?? ?? ?? ?? ?? ? Assignment
1? ?? ?? ?? ?? ?? ???A? ?? ?? ?? ?? ?? ?? ?? ???AS1
1? ?? ?? ?? ?? ?? ???B? ?? ?? ?? ?? ?? ?? ?? ???AS2
1? ?? ?? ?? ?? ?? ???C? ?? ?? ?? ?? ?? ?? ?? ???AS3
2? ?? ?? ?? ?? ?? ???A? ?? ?? ?? ?? ?? ?? ?? ???AS5
2? ?? ?? ?? ?? ?? ???D? ?? ?? ?? ?? ?? ?? ?? ???AS2
3? ?? ?? ?? ?? ?? ???E? ?? ?? ?? ?? ?? ?? ?? ???AS6
...
哪位高手有什么好的解決方法么?
非常感謝!
2013-6-25 00:51:20 上傳
我已將voodoo提供的方法評(píng)為最佳答案,思路清晰,程序簡潔明了。sungmoo提供的方案也很好,但是正如voodoo所說,excel copy+paste到stata產(chǎn)生錯(cuò)行,用Stata編程解決錯(cuò)行,并達(dá)成最終目的,這恐怕只有像sungmoo一樣具備極高超技能才能解決,一般人不太容易理解。
但是voodoo的方法離完美還差那么一點(diǎn)點(diǎn),問題就在于第一步excel的預(yù)處理,這里還要感謝那么現(xiàn)在的問題就轉(zhuǎn)換為如何用Stata處理導(dǎo)入excel帶來的換行問題。Dr Nick Cox編寫的charlist(需要ssc install)可以查看variable中包含的ASCII碼,但是很遺憾,經(jīng)我試驗(yàn),這個(gè)命令并不顯示“換行”字符。經(jīng)Statalist上Joseph Coveney的提示,char(10)和 char(13)分別代表line feed和carriage return。于是我用subinstr解決字符替換問題。最后結(jié)合voodoo的代碼后,我編寫完整程序如下:
***import data***
clear
import excel "Example.xlsx", sheet("sheet1") firstrow
***replace line feed with "///"***
gen ids=subinstr(ID,char(10),"///",.)
gen assignments=subinstr(Assignment,char(10),"///",.)
***split each ID and Assignment into different observations***
split ids, gen(ID) parse("///")
split assignments, gen(Assignment) parse("///")
drop ID Assignment ids assignments
***reshape to long data***
reshape long ID Assignment, i(Number) j(num)
drop if ID==""&Assignment==""
針對(duì)上述程序,sungmoo又提出了讓代碼更簡潔的修改建議
import excel "Example.xls", sh("sheet1") first clear
split ID, p(`=char(10)')
split Assignment, p(`=char(10)')
drop ID Assignment
reshape long ID Assignment, i(Number)
drop if ID==""
最后感謝所有參與這個(gè)帖子討論的人,真的獲益良多。
總結(jié)
以上是生活随笔為你收集整理的html拆分单元格多行,拆分一个单元格中多行字符到不同单元格的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 诚之和:滴滴禁闭百日司机、用户与暗战
- 下一篇: 陈老师排课12A(6天上4下4)小学专用