日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

[数据集]新浪微博数据集MicroblogPCU

發(fā)布時(shí)間:2023/12/13 综合教程 31 生活家
生活随笔 收集整理的這篇文章主要介紹了 [数据集]新浪微博数据集MicroblogPCU 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

數(shù)據(jù)集下載地址:下載

摘要:MicroblogPCU是從新浪微博採集到的。它能夠被用于研究機(jī)器學(xué)習(xí)方法和社會(huì)關(guān)系研究。

這個(gè)數(shù)據(jù)集被原作者用于探索微博中的spammers(發(fā)送垃圾信息的人)。他們的demo在這里

數(shù)據(jù)集的屬性信息:

weibo_user.csv
-user_id: 用戶ID
-user_name: 用戶昵稱
-gender:性別,male,female。other
-class:賬戶級(jí)別
-message:賬戶注冊(cè)位置或其它個(gè)人信息
-post_num: 郵政編碼
-follower_num: followers的數(shù)量
-followee_num: followee的數(shù)量
-follow ratio: followee_num/follower_num;
-is_spammer: manually annotated label, 1 表示 spammer,0 表示 non-spammer;

user_post.csv
-post_id:微博的ID
-post_time:公布時(shí)間
-poster_id: 公布用戶的ID
-repost_num:轉(zhuǎn)發(fā)數(shù)量
-commnet_num: 評(píng)論數(shù)量

followe-followee.csv
-follower: the nickname of follower;
-follower_id: the user ID of follower;
-followee: the nickname of followee;
-followee_id: the user ID of followee;

post.csv和user_post.csv類似, and the post in it are retrievalled by a certain key word related to a topic;

取出當(dāng)中的一部分?jǐn)?shù)據(jù)做關(guān)系圖

install.packages('igraph')
library(igraph)

follower_followee<-read.csv('microblogPCU/follower_followee.csv')
follower_followee_part<-follower_followee[1:1000,]

gg<-graph.data.frame(data.frame(er=follower_followee_part$follower_id,ee=follower_followee_part$followee_id))
plot(gg,
     vertex.label=NA,      ##不顯示標(biāo)簽
     edge.arrow.mode='-',  ##不使用箭頭
     vertex.size = 5       ##設(shè)置結(jié)點(diǎn)圓的大小
     )

參考:https://archive.ics.uci.edu/ml/datasets/microblogPCU

轉(zhuǎn)載請(qǐng)注明出處:http://blog.csdn.net/zhyoulun/article/details/46442899

總結(jié)

以上是生活随笔為你收集整理的[数据集]新浪微博数据集MicroblogPCU的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。