抓取AJAX网页的方法-Firefox组件,C#集成
現(xiàn)在AJAX的使用越來越廣泛了,但是如果經(jīng)常寫網(wǎng)頁抓取程序的人會(huì)發(fā)現(xiàn),很多網(wǎng)頁內(nèi)容是通用AJAX進(jìn)行加載的,實(shí)際抓取到的內(nèi)容寥寥無幾。
通過網(wǎng)絡(luò)到處查找方法,發(fā)現(xiàn)用firefox瀏覽器能夠正常把AJAX內(nèi)容通過HTML呈現(xiàn)出來,那么是否意味著我們獲取AJAX網(wǎng)頁有希望了?
功夫不負(fù)有心人,進(jìn)一步研究發(fā)現(xiàn),firefox確實(shí)有一款C#組件,可以用C#集成到桌面程序中。
1)需要引用一個(gè)叫Skybound.Gecko.dll的文件。
2)此外還需要導(dǎo)入一個(gè)firefox支持的文件夾,代碼如下:
Xpcom.Initialize(@"C:\xulrunner-1.9.1.14.en-US.win32.sdk\xulrunner-sdk\bin");
xulrunner-1.9.1.14.en-US.win32.sdk這個(gè)文件夾比較大,壓縮后都有二十多M,無法上傳,可以去google一下,但是記得一定要搜這個(gè)名字,因?yàn)槲以囘^其它的有些不能用。
3)直接指定URL就可以訪問網(wǎng)站了,可以通過this.geckoWebBrowser1.Navigate(URL);來指定。還有很多功能,自己去發(fā)現(xiàn)吧。
?
轉(zhuǎn)載于:https://www.cnblogs.com/zzy2740/archive/2011/09/25/2190029.html
總結(jié)
以上是生活随笔為你收集整理的抓取AJAX网页的方法-Firefox组件,C#集成的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学习Asp.Net经常会用到的函数集
- 下一篇: C#使用SQLite数据库的代码示例