日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬去朋友圈_利用Python爬取朋友圈数据,爬到你开始怀疑人生

發布時間:2024/7/19 python 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬去朋友圈_利用Python爬取朋友圈数据,爬到你开始怀疑人生 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

人生最難的事是自我認知,用Python爬取朋友圈數據,讓我們重新審視自己,審視我們周圍的圈子。

文:朱元祿(@數據分析-jacky)

哲學的兩大問題:1、我是誰?2、我們從哪里來?

本文 jacky試圖用Python,數據化、聚類化我們的人格標簽,試圖回答"我是誰?"這個哲學問題。

(一)確定數據源

自我認知,很難,必須它證。

物以類聚,人以群分。每個人的社交圈,家庭圈,朋友圈的屬性,基本我們人格的特征屬性。我們所處的階級,在別人眼中的印象,在我們的朋友圈中都會得到印證。

朋友圈數據中最具人格屬性的因素是個性簽名,那么下面我們就把所有好友的個性簽名作為我們的研究對象,以此出發爬取數據。

(二) 使用Python的itchat 包對好友的個性簽名數據進行分析

這里我們用到Python一個比較冷門的庫——itchat,它很好的兼容了wechat個人賬號的API接口,讓我們能更加便捷的爬取wechat數據,itchat的功能很強大,這里我們僅用它爬取wechat中我們每個好友的個性簽名。

之后,我們要分析出自定義詞云圖中個性簽名使用的高頻詞語是什么。

最后,生成可視化詞云圖,直觀的給出洞察結果。

源代碼如下:

# coding:utf-8

import itchat

import re

itchat.login()

friends = itchat.get_friends(update=True)[0:]

tList = []

for i in friends:

signature = i["Signature"].replace(" ", "").replace("span", "").replace("class", "").replace("emoji", "")

rep = re.compile("1f\d.+")

signature = rep.sub("", signature)

tList.append(signature)

# 拼接字符串

text = "".join(tList)

# jieba分詞

import jieba

wordlist_jieba = jieba.cut(text, cut_all=True)

wl_space_split = " ".join(wordlist_jieba)

# wordcloud詞云

import matplotlib.pyplot as plt

from wordcloud import WordCloud, ImageColorGenerator

import os import numpy as np

import PIL.Image as Image

d= os.path.dirname(os.path.abspath( __file__ ))

alice_coloring = np.array(Image.open(os.path.join(d, "wechat.jpg")))

my_wordcloud = WordCloud(background_color="white", max_words=2000,mask=alice_coloring,max_font_size=400, random_state=420,font_path='/Users/sebastian/Library/Fonts/Arial Unicode.ttf').generate(wl_space_split)

image_colors = ImageColorGenerator(alice_coloring)

plt.imshow(my_wordcloud.recolor(color_func=image_colors))

plt.imshow(my_wordcloud)

plt.axis("off")

plt.show()

下面對于代碼的解析,僅跟初學 Python的朋友提示三點:

1)代碼第24行,其他網絡版本的代碼為d= os.path.dirname(__file__),最好換成jacky這個版本的:

d=os.path.dirname(os.path.abspath(__file__)),具體原因jacky就不做過多解釋了;

2)代碼第25行,一定要提前在環境路徑下創建wechat.jpg的圖片,這樣云圖才能順利生成,并生成你希望的形狀。

3)提前在終端安裝jieba,matplotlib,wordcloud,numpy包

注意以上三點,想不運行成功都難。

運行上面的代碼,得到下面的云圖:

(三)數據洞察

以jacky的朋友圈為例,在云圖中,我們可以看見,高頻詞有:自己,創始人,電商,成功,努力,營銷,互聯網,數據,夢想,生活,咨詢,我們,未來。

其實,這些詞jacky還可以繼續用機器學習算法搞一下,但到這就淺嘗則止吧。

從這些具體的信息中,可以抽象出我的個人人格標簽,具體解析:

自己,我們:說明我很自我,很自大,很自以為是;

努力,未來,夢想:說明我想通過努力來實現自己的價值;

創始人:說明我的社交圈還OK;

互聯網,數據:說明我的能力屬性;

營銷,咨詢:說明了我賴以生存的飯碗;

代理:這... ... 不好說了... ...

End

轉載請注明出處

總結

以上是生活随笔為你收集整理的python爬去朋友圈_利用Python爬取朋友圈数据,爬到你开始怀疑人生的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 狠狠躁夜夜躁人人爽视频 | 日韩av片在线免费观看 | 国产小视频在线观看免费 | 理论片国产 | 中文字幕av免费 | 好爽…又高潮了毛片免费看 | 精品国产一区三区 | 国产人妖在线 | 黄视频网站在线观看 | 中文字幕一区二区人妻电影 | 97超级碰碰人妻中文字幕 | 欧美在线黄 | 久久国产精品精品国产 | 免费在线日韩av | 成人免费在线小视频 | 国产一区中文字幕 | 欧美在线激情 | 一个色在线视频 | 高清一二三区 | 黄色精品在线 | 亚洲高清在线一区 | 毛片网在线观看 | 久久久久亚洲av无码专区桃色 | 亚洲天堂一区二区在线观看 | 亚洲精品国产精品乱码不99 | 男人都懂的网址 | a∨鲁丝一区鲁丝二区鲁丝三区 | 一区二区三区四区精品 | yjizz视频 | 在线不卡一区二区 | 欧美性生活网站 | 欧美男人又粗又长又大 | 中文久久乱码一区二区 | 宅宅少妇无码 | 黄色小视频在线免费观看 | 无码 制服 丝袜 国产 另类 | 亚洲欧美日韩不卡 | 美女100%露胸无遮挡 | 涩涩视频网 | 国产综合视频一区二区 | 久久天堂视频 | 亚洲国产精品视频一区 | 欧美激情一级精品国产 | yy6080久久 | 后进极品白嫩翘臀在线视频 | 欧美激情aaa | 国产精品第6页 | 夜色成人网 | 美女av一区二区 | 成年人网站免费看 | 中文字幕在线视频免费观看 | 美女四肢被绑在床扒衣 | 日韩最新视频 | 人妻互换一二三区激情视频 | 香蕉视频一区 | 六月丁香久久 | 老司机午夜福利视频 | 日本中文字幕网 | 99riav视频| 欧美另类videos | 男女猛烈无遮挡 | 久久成人亚洲 | 深夜小视频在线观看 | 天天热天天干 | 中文字幕丰满人伦在线 | 亚洲三级图片 | 高清18麻豆 | 国产av无码国产av毛片 | 国产日本精品 | 久久久91精品 | 少妇大叫太粗太大爽一区二区 | 亚洲а∨天堂久久精品2021 | 97伊人| 中文字幕日韩欧美在线 | 日本无遮羞调教打屁股网站 | 国产在线综合视频 | 日韩视频在线免费 | 伊人网狼人| 无人码人妻一区二区三区免费 | 一级二级av | 久久综合免费 | 亚洲高清在线免费观看 | 久久久久夜 | 亚洲精品久久久久久久久久吃药 | 91最新在线| 91成年视频 | 国产奶水涨喷在线播放 | 成人福利免费视频 | 精品福利在线视频 | 佐佐木明希av在线 | 久久在线精品视频 | 欧美aaa一级片 | 奇米激情 | 久久久久久久人妻无码中文字幕爆 | 欧美日b片 | 国内自拍欧美 | 在线男人天堂 | 亚洲影院在线 | 免费网站在线观看黄色 |