【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)
選擇題
題目:GET和POST的區(qū)別,以下說法不正確的有()。
題目:以下屬于HTTP協(xié)議的主要特點(diǎn)的是()。
題目:增量式爬蟲中的()指的是:爬蟲以相同的頻率訪問所有網(wǎng)頁,不考慮網(wǎng)頁的改變頻率。
題目:以下哪個(gè)屬于深層網(wǎng)頁()
題目:由HTTP客戶端發(fā)起一個(gè)請求,建立一個(gè)到服務(wù)器指定端口的TCP連接,這個(gè)端口默認(rèn)是()端口。
題目:一次HTTP由()組成。
題目:以下哪個(gè)HTTP響應(yīng)狀態(tài)表示服務(wù)器端錯(cuò)誤()
題目:網(wǎng)絡(luò)爬蟲實(shí)際上是一種"自動化瀏覽網(wǎng)絡(luò)”的程序,或者說是一種網(wǎng)絡(luò)機(jī)器人,被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站,以獲取或更新這些網(wǎng)站的內(nèi)容和檢索方式。
題目:POST提交的數(shù)據(jù)大小有限制,最多只能有1024字節(jié)。
題目:網(wǎng)絡(luò)爬蟲不需要遵守任何限制。
題目:網(wǎng)絡(luò)爬蟲順著網(wǎng)頁及其超鏈接組成的網(wǎng)爬行,每到一個(gè)網(wǎng)頁就用抓取程序?qū)⑦@個(gè)網(wǎng)頁抓下來,將內(nèi)容抽取出來,同時(shí)抽取超鏈接,作為進(jìn)一步爬行的線索。
題目:HTTP協(xié)議是無狀態(tài)協(xié)議。
題目:HTTP的請求頭域可能包含Accept、Accept-Charset、Accept-Encoding、Accept-Language等字段。
題目:網(wǎng)絡(luò)爬蟲被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站,以獲取或更新這些網(wǎng)站的內(nèi)容和檢索方式 。
題目:通用網(wǎng)絡(luò)爬蟲對于爬行速度和存儲空間要求較低。
題目:Deep Web 爬蟲爬行過程中最重要部分就是鏈接提取。
題目:數(shù)據(jù)的預(yù)處理ETL的L表示()。
題目:正則表達(dá)式的規(guī)則中,()表示匹配所有非空白字符。
題目:正則表達(dá)式中,()匹配除了換行符之外的任意字符。
題目:以下關(guān)于正則表達(dá)式的說法,不正確的是()
題目:正則表達(dá)式中\(zhòng)w表示任意數(shù)字字符。
題目:正則表達(dá)式的量詞?表示0次或1次。
題目:爬蟲工具只能用Java語言編寫。
題目:增量式網(wǎng)絡(luò)爬蟲只會在需要的時(shí)候爬行新產(chǎn)生或發(fā)生更新的頁面。
題目:正則表達(dá)式中的\w表示任意單詞字符。
題目:HTTP請求的()方法是在Request-URI所標(biāo)識的資源后附加新的數(shù)據(jù)。
題目:網(wǎng)絡(luò)數(shù)據(jù)采集是指通過()或網(wǎng)站公開API等方式從網(wǎng)站上獲取數(shù)據(jù)信息。。
題目:以下關(guān)于正則表達(dá)式中常用正則規(guī)則的說法,不正確的有()
題目:GET 請求獲取Request-URI所標(biāo)識的資源 。
題目:HTTP請求的GET方法 請求獲取由Request-URI所標(biāo)識的資源的響應(yīng)消息報(bào)頭。
題目:深度優(yōu)先策略比較適合垂直搜索或站內(nèi)搜索, 但爬行頁面內(nèi)容層次較深的站點(diǎn)時(shí)會造成資源的巨大浪費(fèi)。
題目:廣度優(yōu)先策略能夠有效控制頁面的爬行深度。
題目:HTTP的響應(yīng)包括Content-Encoding、Content-Length、Content-Type等。
答案:
A、對
總結(jié)
以上是生活随笔為你收集整理的【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【渝粤教育】广东开放大学 商法 形成性考
- 下一篇: 【渝粤教育】广东开放大学 机械制造基础