漂亮的html页面源码_爬虫数据分析之html
1、 html
html 不是一種編程語(yǔ)言,而是一種標(biāo)記語(yǔ)言,是制作網(wǎng)頁(yè)所必須的,你在瀏覽器里看到的每一個(gè)頁(yè)面,不論簡(jiǎn)單還是復(fù)雜,都是用html編寫的,包括你現(xiàn)在看到的這篇文章。
用html寫一個(gè)簡(jiǎn)單的頁(yè)面,是非常容易的,你也可以,將下面這段內(nèi)容復(fù)制到一個(gè)文本文件中,另存為 test.html,然后雙擊文件,瀏覽器就會(huì)打開(kāi)它
<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><title>這是一個(gè)例子</title></head><body><div><p>這是一段文字</p></div></body> </html>瀏覽器里,會(huì)顯示一個(gè)簡(jiǎn)單的頁(yè)面,內(nèi)容只有一句話“這是一段文字”,上面的這段內(nèi)容,就是所謂的網(wǎng)頁(yè)源碼。
2、 如何查看網(wǎng)頁(yè)源碼
以谷歌瀏覽器為例,在打開(kāi)的網(wǎng)頁(yè)上空白區(qū)域單擊右鍵,就會(huì)出現(xiàn)一個(gè)下拉菜單,其中一個(gè)菜單便是“顯示網(wǎng)頁(yè)源代碼”
點(diǎn)擊這個(gè)菜單,你就可以查看到網(wǎng)頁(yè)的源碼了。
如果你仔細(xì)觀察,網(wǎng)頁(yè)的樣子幾乎一樣,最常見(jiàn)的標(biāo)簽如下
<html> <head> <title> <body> <div> <a>
不管是什么標(biāo)簽,他們都成對(duì)的出現(xiàn),有一個(gè)<div>,必有一個(gè)</div> 與之相對(duì)應(yīng),我們想要的數(shù)據(jù),就放在這些標(biāo)簽之中。
你想寫一個(gè)爬蟲(chóng),首先你得知道,你想要的內(nèi)容在哪里,他們?cè)谀男?biāo)簽中,弄清楚這些,你才能寫程序去這些標(biāo)簽中提取你想要的內(nèi)容。
總結(jié)
以上是生活随笔為你收集整理的漂亮的html页面源码_爬虫数据分析之html的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: java shiro security_
- 下一篇: 字符串匹配算法(AC自动机 Aho-Co