分享制作精良的知识管理系统 配置SQL Server文档数据库 完美实现博客文章的的下载,存储和浏览...
前一篇文章《分享制作精良的知識管理系統 博客備份程序 Site Rebuild》已經提到如何使用Site Rebuild來下載您所喜歡的博客文章,但是還不能實現把下載的文件導入進數據庫中,無法實現在線瀏覽服務器中的文檔數據。這一篇文章則幫助您建立文檔數據庫,現博客文章的的下載,存儲和瀏覽。
打開Data Loader程序,執行Setting程序,打開的界面效果如下
點擊ConnectionString后面的按鈕,填寫正確的數據庫配置,如下所示
如下圖所示,點擊OK,返回主程序窗體。
?
打開SQL Server數據庫管理程序,新創建一個名稱為Document的數據庫,運行下面的SQL 腳本以創建表結構
/****** 對象: Table [dbo].[CATEGORY] 腳本日期: 11/04/2011 10:27:21 ******/ SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO CREATE TABLE [dbo].[CATEGORY]([RECNUM] [int] IDENTITY(1,1) NOT NULL,[NAME] [nvarchar](200) NULL,CONSTRAINT [PK_CATEGORY] PRIMARY KEY CLUSTERED ([RECNUM] ASC )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY] ) ON [PRIMARY]/****** 對象: Table [dbo].[DOCUMENT] 腳本日期: 11/04/2011 16:46:37 ******/ SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO CREATE TABLE [dbo].[DOCUMENT]([RECNUM] [int] IDENTITY(1,1) NOT NULL,[SUBJECT] [nvarchar](2000) NULL,[BODY_TYPE] [nvarchar](50) NULL,[BODY] [ntext] NULL,[CREATE_DATE] [datetime] NULL,[CATEGORY] [int] NULL,[CREATE_BY] [nvarchar](50) NULL,[COMPUTER] [nvarchar](200) NULL,[PATH] [nvarchar](2000) NULL,CONSTRAINT [PK_DOCUMENT] PRIMARY KEY CLUSTERED ([RECNUM] ASC )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY] ) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]/****** Object: Table [dbo].[SETTINGS] Script Date: 11/07/2011 00:04:28 ******/ SET ANSI_NULLS ON GOSET QUOTED_IDENTIFIER ON GOCREATE TABLE [dbo].[SETTINGS]([RECNUM] [int] IDENTITY(1,1) NOT NULL,[DOWNLOADED_PATH] [nvarchar](800) NULL,[CONNECTION_STRING] [nvarchar](800) NULL,[FAILED_CLEANUP_FILE] [nvarchar](400) NULL,CONSTRAINT [PK_SETTINGS] PRIMARY KEY CLUSTERED ([RECNUM] ASC )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY] ) ON [PRIMARY]GO INSERT dbo.SETTINGS( DOWNLOADED_PATH ,CONNECTION_STRING ,FAILED_CLEANUP_FILE) VALUES ( 'G:\Document', -- DOWNLOADED_PATH - nvarchar(800)NULL , -- CONNECTION_STRING - nvarchar(800)NULL -- FAILED_CLEANUP_FILE - nvarchar(400))最后一句的腳本,是為了創建配置數據選項。再次打開Setting程序,會顯示出這個表的內容。
這就是所需要做的所有動作,按照前一篇文章的介紹,你可以很容易的達到下面的效果
截圖中的文章取自TerryLee的設計模式系列,成一個體系,放在一起閱讀,很方便。
?
請到epn.codeplec.com(http://epn.codeplex.com/releases/view/68647)中下載最新的Data Loader程序,以體驗離線閱讀博客文章。所有的文章和數據文檔都在您自己的電腦中,您可以對它進行編輯,加工,提煉,學習。
到目前為止,Data Loader還需要改善的地方
1 通常一篇文章中會帶有一小段代碼下載,自動下載文檔的同時,也希望可以下載到它的附件。
2 增強搜索能力,創建新的Index Builder程序,以適應在海量的文檔數據庫中搜索您需要的文檔。
3 文檔的下載,導入,需要增加進度條(Progress Bar)以顯示當前狀態,這樣界面會友好一些。
4? 在分析,下載和導入各個模塊中,增加多線程處理能力,以提高處理速度。
5? 增加新的應用,比如PPT下載,以搜索好的PPT數據資料。Image Download是用于下載網站中的圖片,比如,經常看到一些做的非常好的界面效果圖,于是就想到這個批量方式來獲取這些數據,以集中研究UI設計。
6 壓縮與解壓縮處理。相同內容的文章,RTF格式一般是DOC格式三到四倍的尺寸大小,導致RTF格式比較消耗硬盤空間。以我的本機為例,2723個DOC文檔,一共是745MB,而RTF格式則達到5G,存到數據庫中,數據庫的尺寸增加達到8G左右。需要對文檔作壓縮處理,處理思路是使用我們熟悉的ICSharpCode.SharpZipLib.dll和zip格式。
?
希望對你有幫助,歡迎提出寶貴意見。
轉載于:https://www.cnblogs.com/JamesLi2015/archive/2011/11/11/2245296.html
總結
以上是生活随笔為你收集整理的分享制作精良的知识管理系统 配置SQL Server文档数据库 完美实现博客文章的的下载,存储和浏览...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PPT图片内嵌文字效果
- 下一篇: 使用 Python 构建电影推荐系统