日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python 知乎美女_听说知乎大神用python爬取高颜值美女,是怎么操作的?

發布時間:2023/12/10 python 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python 知乎美女_听说知乎大神用python爬取高颜值美女,是怎么操作的? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 數據源

知乎話題『美女』下所有問題中回答所出現的圖片

2 抓取工具

Python 3,并使用第三方庫 Requests、lxml、AipFace,代碼共 100 + 行

3 必要環境Mac / Linux / Windows (Linux 沒測過,理論上可以。Windows 之前較多反應出現異常,后查是 windows 對本地文件名中的字符做了限制,已使用正則過濾)

無需登錄知乎(即無需提供知乎帳號密碼)

人臉檢測服務需要一個百度云帳號(即百度網盤 / 貼吧帳號)

如果你剛學對代碼不是很熟,最好看講解比較生動的視頻方便自己理解,最好是看最新的,沒有的話??梢匀バ【嶱ython學習裙:七衣衣九七七巴而五(數字的諧音)自己去里面下,多操作練習積累項目經驗才是王道,

4 人臉檢測庫

AipFace,由百度云 AI 開放平臺提供,是一個可以進行人臉檢測的 Python SDK。可以直接通過 HTTP 訪問,免費使用。

5 檢測過濾條件過濾所有未出現人臉圖片(比如風景圖、未露臉身材照等)

過濾所有非女性(在抓取中,發現知乎男性圖片基本是明星,故不考慮;存在 AipFace 性別識別不準的情況)

過濾所有非真實人物,比如動漫人物 (AipFace Human 置信度小于 0.6)

過濾所有顏值評分較低圖片(AipFace beauty 屬性小于 45,為了節省存儲空間;再次聲明,AipFace 評分無任何客觀性)

6 實現邏輯通過 Requests 發起 HTTP 請求,獲取『美女』下的部分討論列表

通過 lxml 解析抓取到的每個討論中 HTML,獲取其中所有的 img 標簽相應的 src 屬性

通過 Requests 發起 HTTP 請求,下載 src 屬性指向圖片(不考慮動圖)

通過 AipFace 請求對圖片進行人臉檢測

判斷是否檢測到人臉,并使用 『4 檢測過濾條件』過濾

將過濾后的圖片持久化到本地文件系統,文件名為 顏值 + 作者 + 問題名 + 序號

返回第一步,繼續

7 抓取結果

直接存放在文件夾中(angelababy 實力出境)。另外說句,目前抓下來的圖片,除 baby 外,88 分是最高分。個人對其中的排序表示反對,老婆竟然不是最高分

9 運行準備安裝 Python 3,Download Python

安裝 requests、lxml、baidu-aip 庫,都可以通過 pip 安裝,一行命令

申請百度云檢測服務,免費。人臉識別-百度AI

最后順便說下,不管你是為了Python就業還是興趣愛好,記住:項目經驗永遠是核心,如果你缺python新項目練習,去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,里面很多新教程項目,還可以跟老司機交流討教!

本文的文字及圖片來源于網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。

總結

以上是生活随笔為你收集整理的python 知乎美女_听说知乎大神用python爬取高颜值美女,是怎么操作的?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。