对于XLS碎片提取的深入研究
生活随笔
收集整理的這篇文章主要介紹了
对于XLS碎片提取的深入研究
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
這幾天一直在研究了復(fù)合文檔了(主要是XLS的碎片提取)。 XLS文檔是MS運用的比較成熟的一種結(jié)構(gòu),對于文字方面MS采用了SST共享字符的方法,把出現(xiàn)量比較大的字符放在FC00標志下的一個模塊中,而對于單獨的SHEET而言只分為表格模塊、風格等等地方。 WORKBOOK中采用了MS NTFS文件系統(tǒng)元文件的記錄方法:頭+長度+指針(數(shù)據(jù)區(qū)),當然WORKBOOK起始也是有標志的,而SHEET表的個數(shù)、偏移值在WORKBOOK模塊中也得到了體現(xiàn)。 SHEET中的模塊也就是剛才提到的表格個數(shù)(行列等)、風格。這些也是比較明顯的。 對于碎片的定位可以借助于這些信息,如SHEET個數(shù),偏移值。然后根據(jù)這些來定位每個SHEET表,而SHEET表的大小也可以對碎片提供幫助。可以說每個模塊的屬性對于定位都是很有幫助的! 最近實驗了一個大小為4.5M的XLS(存放路徑為C:\Documents and Settings\Administrator\桌面,文件系統(tǒng)為NTFS)。由于該位置操作系統(tǒng)要做頻繁的操作,所以產(chǎn)生碎片的機率也是比較高的。經(jīng)過長達兩天多的實驗,終于有了實質(zhì)性進展,其它的就是經(jīng)驗了,呵呵!對了該文件有11個碎片,累!
轉(zhuǎn)載于:https://blog.51cto.com/chs163/194400
總結(jié)
以上是生活随笔為你收集整理的对于XLS碎片提取的深入研究的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PASSWORD,ENABLE,CONS
- 下一篇: 强大的DataGrid组件[7]_自定义