Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
生活随笔
收集整理的這篇文章主要介紹了
Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
簡介
本文介紹net處理html頁面元素的工具類(HtmlAgilityPack.dll)的使用,用途比較多的應該是例如采集類的功能,采集到的html字符串要怎樣處理是一個頭痛的問題,如果是截取就太麻煩了而且容易出錯。所有就用到本文的第三方dll來處理了。
?
下載
下載地址:http://htmlagilitypack.codeplex.com/
點擊“download”按鈕直接下載。
?
使用
1.添加HtmlAgilityPack.dll引用(引用類using HtmlAgilityPack;)。
2.簡單根據html中input的id獲取value代碼如下:
// 模擬用戶請求 WebClient webClient = new WebClient(); webClient.Encoding = System.Text.Encoding.UTF8; string htmlContext = webClient.DownloadString("http://stone_w.cnblogs.com/"); webClient.Credentials = CredentialCache.DefaultCredentials; // 添加授權證書 webClient.Headers.Add("User-Agent", "Microsoft Internet Explorer"); webClient.Headers.Add("Host", "www.cnblogs.com");// 獲取html元素(htmlContext為html頁面字符串) HtmlDocument htmlDoc = new HtmlDocument(); htmlDoc.LoadHtml(htmlContext); // 加載html頁面 HtmlNode navNode = htmlDoc.GetElementbyId("id名稱"); Response.Write(navNode.Attributes["value"].Value);?
總結
HtmlAgilityPack可以根據id查詢value,還可以獲取單個元素節點,都是HtmlDocument類的內置方法,大家可以試著練練。謝謝完~
?
?
?
?
總結
以上是生活随笔為你收集整理的Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Oracle 游标的练习
- 下一篇: vb中filecopy拷贝文件