日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > java >内容正文

java

Java编写抓取用户信息代码_[代码全屏查看]-一个基于JAVA的知乎爬虫,抓取知乎用户基本信息...

發布時間:2025/3/19 java 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Java编写抓取用户信息代码_[代码全屏查看]-一个基于JAVA的知乎爬虫,抓取知乎用户基本信息... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

[1].[代碼] [Java]代碼

作者:臥顏沉默

鏈接:https://www.zhihu.com/question/36909173/answer/97643000

來源:知乎

著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

/**

*

* @param httpClient Http客戶端

* @param context Http上下文

* @return

*/

public boolean login(CloseableHttpClient httpClient, HttpClientContext context){

String yzm = null;

String loginState = null;

HttpGet getRequest = new HttpGet("https://www.zhihu.com/#signin");

HttpClientUtil.getWebPage(httpClient,context, getRequest, "utf-8", false);

HttpPost request = new HttpPost("https://www.zhihu.com/login/email");

List formParams = new ArrayList();

yzm = yzm(httpClient, context,"https://www.zhihu.com/captcha.gif?type=login");//肉眼識別驗證碼

formParams.add(new BasicNameValuePair("captcha", yzm));

formParams.add(new BasicNameValuePair("_xsrf", ""));//這個參數可以不用

formParams.add(new BasicNameValuePair("email", "郵箱"));

formParams.add(new BasicNameValuePair("password", "密碼"));

formParams.add(new BasicNameValuePair("remember_me", "true"));

UrlEncodedFormEntity entity = null;

try {

entity = new UrlEncodedFormEntity(formParams, "utf-8");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

request.setEntity(entity);

loginState = HttpClientUtil.getWebPage(httpClient,context, request, "utf-8", false);//登錄

JSONObject jo = new JSONObject(loginState);

if(jo.get("r").toString().equals("0")){

System.out.println("登錄成功");

getRequest = new HttpGet("https://www.zhihu.com");

HttpClientUtil.getWebPage(httpClient,context ,getRequest, "utf-8", false);//訪問首頁

HttpClientUtil.serializeObject(context.getCookieStore(),"resources/zhihucookies");//序列化知乎Cookies,下次登錄直接通過該cookies登錄

return true;

}else{

System.out.println("登錄失敗" + loginState);

return false;

}

}

/**

* 肉眼識別驗證碼

* @param httpClient Http客戶端

* @param context Http上下文

* @param url 驗證碼地址

* @return

*/

public String yzm(CloseableHttpClient httpClient,HttpClientContext context, String url){

HttpClientUtil.downloadFile(httpClient, context, url, "d:/test/", "1.gif",true);

Scanner sc = new Scanner(System.in);

String yzm = sc.nextLine();

return yzm;

}

總結

以上是生活随笔為你收集整理的Java编写抓取用户信息代码_[代码全屏查看]-一个基于JAVA的知乎爬虫,抓取知乎用户基本信息...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。