日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

python网页结构分析_Python爬虫基础之网页组成解析

發(fā)布時間:2025/3/15 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python网页结构分析_Python爬虫基础之网页组成解析 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

當(dāng)我們用瀏覽器訪問網(wǎng)站時,每個網(wǎng)頁的大不相同,你是否想過它為什么會呈現(xiàn)多種不同的樣式呢?就讓我們一起了解一下網(wǎng)頁的基本組成、結(jié)構(gòu)和節(jié)點(diǎn)等內(nèi)容吧!

網(wǎng)頁的組成

網(wǎng)頁可以分為三大部分——HTML、CSS和JavaScript。如果把網(wǎng)頁比作一個人的話,HTML相當(dāng)于骨架,JavaScript相當(dāng)于肌肉,CSS相當(dāng)于皮膚,三者結(jié)合起來才能形成一個完善的網(wǎng)頁。下面我們先來介紹一下這三部分的內(nèi)容:

HTML:HTML是用來描述網(wǎng)頁的一種語言,其全稱叫做Hyper Text Markup Language,即超文本標(biāo)記語言。網(wǎng)頁包括文字、按鈕、圖片和視頻等各種復(fù)雜的元素,其基礎(chǔ)架構(gòu)就是HTML。不同類型的元素通過不同類型的標(biāo)簽來表示,如圖片使用img表示,視頻使用video表示,段落用p標(biāo)簽表示,它們之間的布局又常通過布局標(biāo)簽div嵌套組合而成,各種標(biāo)簽通過不同的排列和嵌套才形成了網(wǎng)頁的框架。在Chrome瀏覽器中打開百度,右擊選擇‘檢查’項,打開開發(fā)者模式,這時在Element選項卡中即可看到網(wǎng)站的源代碼:

這就是HTML,整個網(wǎng)頁就是由各種標(biāo)簽嵌套組合而成的。這些標(biāo)簽定義的節(jié)點(diǎn)元素相互嵌套和組合形成了復(fù)雜的層次關(guān)系,就形成了網(wǎng)頁的架構(gòu)。

2.CSS:HTML定義了網(wǎng)頁的結(jié)構(gòu),但是只有HTML頁面的布局并不美觀,可能只是簡單的節(jié)點(diǎn)元素的排列,為了讓網(wǎng)頁看起來更好看一些,這里借助了CSS。

CSS,全稱叫做Cascading Style Sheets,即層疊樣式表。“層疊”是指當(dāng)在HTML中引用了數(shù)個樣式文件,并且樣式發(fā)生沖突時,瀏覽器能依據(jù)層疊順序處理?!皹邮健敝妇W(wǎng)頁中文字大小、顏色、元素間距、排列等格式。

CSS是目前唯一的網(wǎng)頁頁面排版樣式標(biāo)準(zhǔn),有了它的幫助,頁面才會變得更為美觀,下圖就是CSS:

這就是多個CSS樣式。我們以第一個為例,大括號前面是一個CSS選擇器。此選擇器的意思是首先選中id為head_wrapper的節(jié)點(diǎn)。大括號內(nèi)部寫的就是一條條樣式規(guī)則,例如position指定了這個元素布局方式為相對布局,height指定元素的高度為38.2%占滿父元素其他的意思是一樣可以看出來的。也就是說我們將位置、寬度、高度等樣式配置統(tǒng)一寫成這樣的形式,然后用大括號括起來,接著在開頭再加上CSS選擇器,這就代表這個樣式對CSS選擇器選中的元素生效,元素就會根據(jù)此樣式來展示了。

在網(wǎng)頁中,一般會統(tǒng)一定義整個網(wǎng)頁的樣式規(guī)則,并寫入CSS文件中(其后綴為css)。在HTML中,只需要用link標(biāo)簽即可引入寫好的CSS文件,這樣整個頁面就會變得美觀、優(yōu)雅。

3.JavaScript:簡稱JS,是一種腳本語言。HTML和CSS配合使用,提供給用戶的只是一種靜態(tài)信息,缺乏交互性。我們在網(wǎng)頁里可能會看到一些交互和動畫效果,如下載條、提示框、輪播圖等,這通常就是JavaScript的功勞。它的出現(xiàn)使得用戶與信息之間不只是一種瀏覽與顯示的關(guān)系,而是實(shí)現(xiàn)了一種實(shí)時、動態(tài)、交互的頁面功能。

JavaScript通常也是以單獨(dú)的文件形式加載的,后綴為js,在HTML中通過script標(biāo)簽即可引入,例如:

綜上所述,HTML定義了網(wǎng)頁的內(nèi)容和結(jié)構(gòu),CSS描述了網(wǎng)頁的布局,JavaScript定義了網(wǎng)頁的行為。

上文就是關(guān)于Python爬蟲基礎(chǔ)之網(wǎng)頁組成解析的主要內(nèi)容,想了解更多關(guān)于Python的知識請關(guān)注php中文網(wǎng)瀏覽更多相關(guān)信息!

以上就是Python爬蟲基礎(chǔ)之網(wǎng)頁組成解析的詳細(xì)內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!

本文轉(zhuǎn)載于:快資訊,如有侵犯,請聯(lián)系a@php.cn刪除

總結(jié)

以上是生活随笔為你收集整理的python网页结构分析_Python爬虫基础之网页组成解析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。