日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

mongodb添加多条数据_分析了一万多条拼车数据,看看北上广深的各位都回哪过年...

發(fā)布時(shí)間:2023/12/15 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 mongodb添加多条数据_分析了一万多条拼车数据,看看北上广深的各位都回哪过年... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

快過年了,很多同學(xué)都踏上了返鄉(xiāng)的路?,F(xiàn)在交通這么發(fā)達(dá),除了高鐵飛機(jī)外,還可以搭順風(fēng)車回家。今天的這篇文章我們就來分析一下拼車數(shù)據(jù),看看今年大家都回哪兒過年。

分析了一萬多條拼車數(shù)據(jù),看看北上廣深的各位都回哪過年作者:ElliotBai |?來源:InTrirty

前言

很早之前發(fā)過一篇關(guān)于某拼車平臺(tái)爬蟲的文章,因?yàn)楣ぷ鞅容^忙,一直沒有下文。最近年底稍微空了些,加上碰上春節(jié)返鄉(xiāng)大潮,剛好再拿過來寫一下數(shù)據(jù)分析的思路。

本次數(shù)據(jù)樣本共13041條,本別采集了北京、上海、廣州、深圳、杭州的某一天出行數(shù)據(jù),由于手動(dòng)操作難以保證取樣的公平性,所以不能對(duì)全部數(shù)據(jù)結(jié)果的準(zhǔn)確性做保證,本文以提供思路參考為主,先放一張路線圖:

統(tǒng)計(jì)結(jié)果

好了知道大家比較關(guān)心結(jié)果,所以先把結(jié)果放一放,后面再接著講分析過程。

乘客性別

先單獨(dú)把性別拎出來看一下,后面再根據(jù)城市進(jìn)行分析,結(jié)果顯示,拋開未設(shè)置性別的乘客不論,總體來看順風(fēng)車的用戶群中,男性(占比49.39%)還是多于女性(占比31.55%)的。畢竟跨城順風(fēng)車,大過年的,女性乘客對(duì)于安全性的憂慮還有要有的。

城市訂單

真實(shí)數(shù)據(jù)的話訂單數(shù)量應(yīng)該是深圳 > 北京 > 廣州 > 上海 > 杭州,但是同一個(gè)城市內(nèi)的乘客性別比例應(yīng)該還是具有一定的參考價(jià)值的,可以看到北京、上海、深圳的女性乘客數(shù)量占比都是高于男性的。?

客單價(jià)

原本是想比較一下平均路程長(zhǎng)度,但是想想這個(gè)事情太折騰了,由于平臺(tái)主要還是依靠路程來計(jì)算拼車費(fèi)用的,所以通過計(jì)算客單價(jià)的話大概也能反映一下平均形成長(zhǎng)度(我猜的,然后結(jié)果是這樣的,沒想到廣州是最高的,也可能是我統(tǒng)計(jì)錯(cuò)誤

哪里乘客最壕

有時(shí)候有些偏遠(yuǎn)地區(qū)訂單或者順路司機(jī)少,乘客會(huì)加價(jià)希望司機(jī)接單,于是統(tǒng)計(jì)了一下各城市加價(jià)訂單的占比和平均的加價(jià)額度,得出如下結(jié)果:

占比最高的城市是深圳,平均加價(jià)額度最高的城市也是深圳,看來深圳的小哥哥小姐姐們的確出手闊錯(cuò),然而加價(jià)比例最低的是北京,不過這也不能說明帝都人民不壕氣,可能就是人家繁華,司機(jī)多。

返鄉(xiāng)路線圖

最后放幾張返鄉(xiāng)的路線圖

北京

上海

廣州

深圳

杭州

杭州明顯有別與其它幾個(gè)城市,一個(gè)是杭州的數(shù)據(jù)樣本多,另外一個(gè)平臺(tái)上杭州黃牛多,那些最遠(yuǎn)的單子就是黃牛廣告單

爬蟲思路

注冊(cè)成為司機(jī),利用mitm抓包存儲(chǔ)拼車單

統(tǒng)計(jì)思路

數(shù)據(jù)的話我是通過本地Mongodb存儲(chǔ),所以直接用python操作Mongodb數(shù)據(jù)。

Pymongo

關(guān)于Mongodb數(shù)據(jù)庫的連接,直接上代碼:

client = MongoClient('mongodb://localhost:27017')
spring = client.spring
collection = spring['orders']

以上代碼的意思就是連接本地Mongodb-spring數(shù)據(jù)庫-orders文檔集合

Pyecharts

Pyecharts(http://pyecharts.org)是大名鼎鼎的Echarts的Python可視化圖表庫,用起來挺順手的,而且文檔規(guī)范,基本上可以零門檻入門,具體實(shí)現(xiàn)請(qǐng)移步文檔。

這里介紹一下關(guān)于Pyecharts的圖表樣式配置,為了保持各圖表的樣式統(tǒng)一(偷懶),Pyecharts提供了一個(gè)Style類,可用于在同一個(gè)圖或者多個(gè)圖內(nèi)保持統(tǒng)一的風(fēng)格

from pyecharts import Style,Geo

style = Style(
? ?title_color="#fff",
? ?title_pos="center",
? ?width=1100,
? ?height=600,
? ?background_color='#404a59'
)
# style.init_style 會(huì)返回類初始化的風(fēng)格配置字典
geo = Geo("全國(guó)主要城市空氣質(zhì)量", "data from pm2.5", **style.init_style)

這樣,就創(chuàng)建了一個(gè)Geo地理坐標(biāo)系圖表

代碼解讀

因?yàn)槿看a有點(diǎn)長(zhǎng),所以抽了一段舉個(gè)例子,主要思路就是從Mongodb取出指定數(shù)據(jù),或者通過$group管道對(duì)數(shù)據(jù)進(jìn)行處理,最后通過pyecharts生成相應(yīng)的圖表,呈現(xiàn)

from pymongo import MongoClient
from pyecharts import Style,GeoLines

def getLines(self):
? ?# 連接數(shù)據(jù)庫
? ?client = MongoClient('mongodb://localhost:27017')
? ?spring = self.client.spring
? ?collection = self.spring['orders']
? ?
? ?# Mongodb的操作,$match-篩選出'from_poi.city.city_name'為'杭州'的文檔,
? ?# 再通過$group管道,按照目標(biāo)城市統(tǒng)計(jì)出匯總數(shù)量
? ?line_hangzhou = collection.aggregate([
? ? ? ?{'$match': {'from_poi.city.city_name': '杭州'}},
? ? ? ?{'$group': {'_id': '$to_poi.city.city_name', 'count': {'$sum': 1}}}
? ?])
? ?# 按照Geolines圖表的數(shù)據(jù)格式格式化數(shù)據(jù)
? ?line_hangzhou_ = []
? ?for line in line_hangzhou:
? ? ? ?line_hangzhou_.append(["杭州", line['_id'], line['count']])
? ? ? ?
? ?# 創(chuàng)建一個(gè)GeoLines圖表
? ?citylines = GeoLines("春節(jié)遷移路線圖", **style.init_style)
? ?# 添加數(shù)據(jù)以及樣式
? ?citylines.add("從杭州出發(fā)",
? ? ? ? ? ? ? ? ?line_hangzhou_,
? ? ? ? ? ? ? ? ?**geo_style)
? ?# 生成html文件
? ?citylines.render("results/citylines.html")

源碼已上傳Github,可在此獲取:

https://github.com/bkidy/Dida_spider

看完本文有收獲,歡迎轉(zhuǎn)發(fā)、留言、點(diǎn)右下角好看哦。

總結(jié)

以上是生活随笔為你收集整理的mongodb添加多条数据_分析了一万多条拼车数据,看看北上广深的各位都回哪过年...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。