PDF结构分析
一、 簡單了解PDF
1 PDF格式
一個PDF文檔從根本上來說是一個8字節序列。 其實PDF格式和我們已經熟知的HTML,XML等結構化的文件格式一樣,包含有關鍵字,分隔符,數據等等。不同的是PDF文件是按照二進制流的方式保存的,而html文件則是可讀的文本方式保存的。
2 PDF規范的發展
PDF規范的6次升級:
1.11995 加入了文檔加密(40字節),線索樹,名字樹,鏈接,設備獨立色彩資源。
1.21996 表單, 半色調屏幕,和其他的一些高級色彩特性, 對中文,日文和韓文的支持
1.32000 數字簽名, 邏輯結構, JavaScript, 嵌入式文件,Masked Images, 平滑陰影, 支持 CID字體的附加色彩。
1.42001 文件加密 (128 字節), 標簽式 PDF, 訪問控制,透明,元數據流
1.52003 文檔加密 (公鑰), JPEG 2000 壓縮,可選的內容組,附加的注解類型
1.62005 文檔加密 (AES),增加最大文件支持,加入3D支持,額外的注解類型
3 PDF文件的基本組成
這四部分分別為:
l 文件頭,指明了該文件所遵從的PDF規范的版本號,它出現在PDF<
總結
- 上一篇: 90后中国程序员“黑吃黑”博彩网站,半年
- 下一篇: 嵌入生活的嵌入式,超市里的电子价签