日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

当当图书分类html,基于httpclient与jsoup的抓取当当图书页面数据简单Demo

發(fā)布時(shí)間:2023/12/31 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 当当图书分类html,基于httpclient与jsoup的抓取当当图书页面数据简单Demo 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

public classTest {/***

*簡(jiǎn)單抓取當(dāng)當(dāng)圖書(shū)分類(lèi)中某一頁(yè)指定信息輸出到控制臺(tái)并保存到文件中*/

public static void main(String[] args) throwsIOException {

CloseableHttpClient httpclient=HttpClients.createDefault();//創(chuàng)建一個(gè)文件,用來(lái)保存信息

BufferedWriter writer=new BufferedWriter(new FileWriter("D:\book.csv"));try{//發(fā)送請(qǐng)求URL填入當(dāng)當(dāng)網(wǎng)圖書(shū)分類(lèi)某一頁(yè)面的地址

HttpGet httpget = new HttpGet("http://category.dangdang.com/cp01.36.04.08.00.00.html");

System.out.println("Executing request " +httpget.getRequestLine());//Create a custom response handler

ResponseHandler responseHandler = response ->{int status =response.getStatusLine().getStatusCode();if (status >= 200 && status < 300) {

HttpEntity entity=response.getEntity();return entity != null ? EntityUtils.toString(entity) : null;

}else{throw new ClientProtocolException("Unexpected response status: " +status);

}

};//得到請(qǐng)求體也就是頁(yè)面源碼responseBody

String responseBody =httpclient.execute(httpget, responseHandler);

System.out.println("----------------------------------------");//使用Jsoup解析得到一個(gè)document對(duì)象,代表這個(gè)頁(yè)面

Document document=Jsoup.parse(responseBody);//這是人為分析源碼中的數(shù)據(jù)后,取docunment中需要的元素

Element pos=document.getElementsByClass("bigimg").get(0);

Elements list=pos.children();for(Element e:list){

Element name= e.getElementsByClass("pic").get(0);

Element detail= e.getElementsByClass("detail").get(0);

Element author= e.getElementsByAttributeValue("name","itemlist-author").get(0);

Element press= e.getElementsByAttributeValue("name","P_cbs").get(0);

Element market= e.getElementsByClass("search_pre_price").get(0);

Element sale= e.getElementsByClass("search_now_price").get(0);

System.out.println("圖書(shū)名:"+name.attr("title"));

System.out.println("簡(jiǎn)介:"+detail.text());

System.out.println("作者:"+author.text());

System.out.println("出版社:"+press.text());

System.out.println("市場(chǎng)價(jià):"+market.text());

System.out.println("驚喜價(jià):"+sale.text());

System.out.println("--------------------");//添加要寫(xiě)入文件的信息

writer.write(name.attr("title")+","+detail.text()+","+author.text()+","+press.text());

writer.newLine();

}

}finally{

writer.close();

httpclient.close();

}

}

}

總結(jié)

以上是生活随笔為你收集整理的当当图书分类html,基于httpclient与jsoup的抓取当当图书页面数据简单Demo的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。