日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

Airbnb(爱彼迎)用户数据分析——tableau可视化和MySQL分析

發布時間:2024/5/14 数据库 63 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Airbnb(爱彼迎)用户数据分析——tableau可视化和MySQL分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文利用Airbnb用戶的注冊、訂單和日志行為等數據,從用戶畫像、營銷渠道轉化率、訂單漏斗分析三方面進行分析。我們需要考慮以下3個問題:

  • 愛彼迎的目標用戶是什么樣的人群?有什么特點?
  • 這些人群接受信息的渠道有哪些?或者說需求對應出現的場景在什么時候什么地方?
  • 以什么樣的方式給他們傳遞愛彼迎的產品價值是有效的,印象深刻的?
  • 這三個問題分別定義了傳播的對象、渠道、效率。
    有了要解決的問題,我們就可以據此來定義相應的分析指標。

    用戶畫像描述了Airbnb客戶的整體特征,如性別比例、年齡分層、所屬地比例、目的地等幾個方面進行刻畫。同時刻畫了注冊用戶的設備、賬號類別等基本信息,掌握用戶渠道來源。

    營銷方面針對不同營銷渠道和營銷內容(例如網站的不同推廣計劃)的注冊量和下單轉化率進行分析,了解更有效的營銷渠道和效果,從而有針對性的投放廣告,節約成本。

    訂單漏斗分析根據客戶的行為日志數據對用戶的活躍程度、下單率、付款率、復購率進行了可視化,可以觀察整體流程中的薄弱點,從而有針對性的提高某一方面的轉化率。

    本文參考了文章Airbnb(愛彼迎)產品分析報告里的一些指標觀點。

    數據描述

    數據來源于Kaggle競賽,主要包含以下信息:

    • train_users.csv - 用戶訓練集
      • id: 用戶ID
      • date_account_created: 賬戶創建日期
      • timestamp_first_active: 第一次瀏覽的時間戳,注意由于用戶注冊前就可以瀏覽,因此可能早于注冊日期和第一次預定日期。
      • date_first_booking: 第一次預定日期
      • gender:性別
      • age :年齡
      • signup_method :注冊方式
      • signup_flow: 注冊來源網頁
      • language: 語言偏好
      • affiliate_channel: 營銷渠道
      • affiliate_provider: 營銷來源,例如google等
      • first_affiliate_tracked: 在注冊之前,用戶與之交互的第一個營銷內容
      • signup_app :注冊使用的app
      • first_device_type :第一次使用時的設備類型
      • first_browser :第一次使用時的瀏覽器
      • country_destination:旅行目的地
    • sessions.csv - 用戶行為日志
      • user_id: to 與用戶表的ID 對應
      • action :用戶行為
      • action_type :用戶行為類型
      • action_detail :用戶行為具體細節
      • device_type:設備類型
    • countries.csv - 數據集中目的地國家的總結統計和地點
    • age_gender_bkts.csv 用戶年齡分組、性別、目的地的總結統計

    數據預處理

    在開始分析之前,首先對數據進行預處理,包括重復值、缺失值、異常值等的處理。

    import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np sns.set(style="darkgrid") plt.rcParams['font.sans-serif']=['SimHei'] #用來正常顯示中文標簽 plt.rcParams['axes.unicode_minus']=False #用來正常顯示負號data = pd.read_csv('train_users_2.csv') sum(data['id'].value_counts() == 1) #觀察是否有重復id data.info()

    對比ID數量為1 的ID個數和總數據量,發現并沒有重復ID ,說明數據中是沒有重復ID 的,ID 可以用作主鍵。
    查看16個變量的缺失值情況如下:

    id 213451 non-null object date_account_created 213451 non-null object timestamp_first_active 213451 non-null float64 date_first_booking 88908 non-null object gender 213451 non-null object age 125461 non-null float64 signup_method 213451 non-null object signup_flow 213451 non-null int64 language 213451 non-null object affiliate_channel 213451 non-null object affiliate_provider 213451 non-null object first_affiliate_tracked 207386 non-null object signup_app 213451 non-null object first_device_type 213451 non-null object first_browser 213451 non-null object country_destination 213451 non-null object

    可以觀察到缺失值情況如下,并分別對其制定相應的缺失值補充:

    變量意義缺失個數可能原因缺失填充
    date_first_booking第一次預定日期124543沒有發生預定0
    age年齡87990注冊頁面不是必填項0
    first_affiliate_tracked第一次預定推銷內容6065未經過推銷untracked
    #缺失值處理 data['age'] = data['age'].fillna(0) data['first_affiliate_tracked'] = data['first_affiliate_tracked'].fillna('untracked') data['date_first_booking'] = data['date_first_booking'].fillna(0) data.info()

    處理后不再具有缺失值。
    下面對數據進行簡單的描述性統計,以便觀察數據形態。

    data.columns #'id'標識變量 ;'date_account_created', 賬戶創建日期;'timestamp_first_active', 第一次活動的時間戳;'date_first_booking', 第一次預定日期 #離散變量:'gender', 'signup_method','signup_flow','language', 'affiliate_channel','affiliate_provider','first_affiliate_tracked', 'signup_app','first_device_type', 'first_browser', 'country_destination' #連續變量'age' class_column = ['gender', 'signup_method','signup_flow','language', 'affiliate_channel','affiliate_provider','first_affiliate_tracked', 'signup_app','first_device_type', 'first_browser', 'country_destination'] continuous_column = ['age'] for column in class_column:plt.hist(data[column])plt.title(column)plt.show()print('統計值:',data[column].value_counts())

    由于變量較多,這里不再一一列舉,用gender這一變量進行舉例說明。

    取值個數
    -unknown-95688
    FEMALE63041
    MALE54440
    OTHER282

    同理可以觀察到連續變量age的直方圖分布如下:

    可以很明顯的看到其中有一些年齡非常大,這是不合實際的,因此需要進行異常值處理,這里將年齡大于100歲的都當做異常值處理成0

    #異常值處理 data["age"][data.age>100]=0 #可視化 plt.hist(data.loc[data['age'] != 0 ,'age']) plt.show()data.to_csv('train_users.csv')


    此時年齡的分布就比較正常了,雖然有效的年齡數據并不多,但我們仍然可以看做是整體數據的一個隨機抽樣,是可以代表整體年齡水平的。

    用戶畫像

    首先是用戶特點的刻畫,根據所有的數據,可以從目標旅行地點、客戶性別、客戶年齡、客戶來源地幾個方面獲取用戶的特點。

    上面的動態可視化展示了目標旅行地點、客戶性別、客戶年齡三個方面的特性,從以上結果中我們大致可以發現幾點:

  • 除了NDF表示的不明確地點外,目標旅行地點以美國為主,有6萬以上的游客,其次是意大利、法國等一些歐洲國家,但需要注意的是以上數據截止到2014年,當時Airbnb還沒進入中國市場。
  • 性別上排除未采集到的信息和無效信息,整體男女比例FAMALE:MALE=63041:54440,基本持平,說明在Airbnb上的旅行受眾沒有明顯的男女區分。
  • 年齡上各個國家的均值及四分位數基本都保持在20-60的范圍內,說明用戶基本為中青年人群。
  • 以受眾最多的美國為例,單獨觀察其性別和年齡分布:

    可以看到在62374的美國旅行地用戶中,有22679的女性和19457的男性,男女比例基本持平,男性用戶略低,在年齡分布中大部分用戶的年齡分布在30-60歲,也符合中青年的受眾群體特點。

    下面介紹一下客戶來源地。

    可以看到用戶幾乎都來自說英語的國家,可以狹義的認為是美國或英國,這是由于當時處于Airbnb發展初期,業務范圍主要在西方一些國家。

    上面只是簡單介紹了用戶的來源地,但實際上更有用的分析是獲客渠道的分析,即人群接受信息的渠道。

    觀察上面的圖表,可以得到以下信息:

  • 用戶在注冊Airbnb賬號時大多數會選擇通用的注冊方式,但同時使用Facebook賬號進行注冊的用戶也不少,而使用Google賬號注冊的用戶則較少,這可以說明旅行產品和社交網絡平臺的聯合可能是一個潛在的功能,可以開發注冊,識別好友,一鍵分享等功能。
  • 在注冊方式中,大部分人會選擇使用網頁注冊,那么在網頁中投放Airbnb廣告可能會獲得比較高的獲客量,由于數據中沒有提供網頁注冊的轉化率情況,這方面暫時沒有數據可以支持。
  • 在注冊設備一方面,注冊量比較高的是ipad、iphone、mac三種,這可能是由于本身這三種設備的使用率較高,而且也可以發現的一點是,無論在哪種設備上,注冊使用的瀏覽器前三名分別是Safari、Google、Firefox。
  • 根據以上信息及分析,在Airbnb的廣告投放上更好的渠道方案可能是在Safari等常用瀏覽器的網頁投放,可以增加獲客量。

    營銷渠道分析

    下面考慮用戶的留存效率問題,最直觀的指標就是客戶的訂單轉化率,這里我們把客戶第一次訂單日期為空的用戶認為是沒有進行下單,從而計算轉化率。
    先來簡單看一下Airbnb2010年-2014年以來用戶注冊數和訂單數變化情況。

    可以很清晰的看到:

  • 2010-2014無論是用戶注冊數還是訂單數都逐年增加。
  • 每年的7、8月份都會有注冊數和訂單數的小高峰,處于旅行旺季。
  • 自2012年以來,注冊數和訂單數有明顯的快速增長是Airbnb的高速發展期。
  • 2014年夏天之后,訂單數有斷崖式下降。
  • 我們可以通過分析不同營銷方式和營銷內容的轉化率來確定之后的營銷投放重點:

    可以看到:

  • 注冊量最多的是direct(直接從應用商店下載),用戶可能是從網絡上獲取到相關信息后自行前往應用商店下載,從這里我們無法明顯看到營銷的效果。
  • 還有獲客比較高的是Google的sem-brand和sam-non-brand,且相較于sam-non-brand來說sem-brand更高一點。
  • 如果從轉化率的角度分析,baidu、Yahoo、Google、yandex等幾個網站的sem系列推廣都比較高,其中Google的轉化率和獲客都比較高
  • 相對而言獲客和轉化率不太好的有Facebook的content,baidu的轉化率雖然比較高,但獲客量卻不太多。
  • 漏斗分析

    session數據表中關于action_detail這一列中,查看具體有哪些項:

    SELECT DISTINCTaction_detail FROMsessions

    由于有很多,這里不再一一列出,其中比較重要的幾列有:

    名稱意義
    reservations下單操作
    payment_instruments支付操作

    根據這些變量和數據,我們可以制作轉化率漏斗

    step1 產生活動的用戶數

    SELECTCOUNT( DISTINCT user_id ) FROMsessions

    共有用戶135483。

    step2 活躍用戶數

    規定產生10次以上活動的用戶為活躍用戶。

    SELECTCOUNT( DISTINCT user_id ) FROMsessions WHEREuser_id IN ( SELECT user_id FROM sessions GROUP BY user_id HAVING COUNT( user_id ) > 10 )

    共有活躍用戶111977

    step3 下單用戶數

    SELECTCOUNT( DISTINCT user_id ) FROMsessions WHEREaction_detail = 'reservations'

    共有10366用戶下單。

    step4 支付用戶數

    SELECTCOUNT( DISTINCT user_id ) FROMsessions WHEREaction_detail = 'payment_instruments'

    實際共有9018用戶支付過。

    step5 復購用戶數

    SELECTCOUNT( DISTINCT user_id ) FROMsessions WHEREuser_id IN (SELECTuser_id FROMsessions WHEREaction_detail = 'payment_instruments'GROUP BYuser_id HAVINGCOUNT( user_id ) >= 2)

    有4153用戶多次在Airbnb支付。
    將以上數據計算比例轉化為圖形可以得到:

    總結分析

    同樣的,按照文章架構,從用戶特點、營銷渠道、漏斗分析三個方面稍作總結。

  • Airbnb的用戶特點為大多數為中青年,男女比例均衡,用戶多為美國人,采用網頁注冊的用戶居多(如Google、Firefox等),往往會關聯Facebook等社交賬號。據此可以給出建議:營銷重點為中青年人士,且有巨大的海外市場可以繼續挖掘,如一些亞洲、東歐國家,廣告更適合在搜索引擎投放,可以與社交平臺產生聯動。
  • 在營銷上,Airbnb自2012年起有大幅度的用戶增長,但2015年左右有下滑,需進一步分析原因,這就需要優化拉新的措施,例如邀請新用戶獲得抽獎機會或‘錦鯉’營銷等。營銷內容中效果比較好的是Google的sem-brand,當然其他營銷也有潛力。
  • 在漏斗分析中,從活躍用戶到下單用戶有大幅度下降,轉化率僅有9.26%,這是整個鏈條中需要重點加強的部分,在這方面可以完善推薦系統,例如根據用戶的搜索記錄,推薦相應的目的地團購、優惠、火爆旅行線路等,增加下單率。
  • 總結

    以上是生活随笔為你收集整理的Airbnb(爱彼迎)用户数据分析——tableau可视化和MySQL分析的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 中文字幕一区二区人妻痴汉电车 | 亚洲无在线观看 | 高清福利视频 | 午夜精品免费观看 | 国产精品6666| 你懂的成人 | 欧美成人精品一区二区三区在线观看 | 国产精品v亚洲精品v日韩精品 | 激情文学欧美 | 国产又粗又猛又爽又黄的视频小说 | 亚洲短视频| 亚洲熟女www一区二区三区 | 在线观看欧美日韩 | 综合狠狠开心 | 国产又黄又粗又长 | 亚洲图色av | 国产剧情在线视频 | 亚洲性生活网站 | 成人激情免费视频 | 里番acg★同人里番本子大全 | 亚洲拍拍视频 | 亚洲乱码一区二区三区 | 日日日干 | 国产真实伦对白全集 | 亚洲国产精品一 | 我爱avav色aⅴ爱avav | 久操视频免费观看 | 欧美人性生活视频 | 国产伦精品一区二区三区精品 | 日韩aa视频 | 不卡影院av | 日本在线视频一区 | 日韩三级一区 | 尹人香蕉网 | 亚州春色 | 噜啪啪 | 成人依人 | 中文亚洲av片不卡在线观看 | 日韩视频在线免费 | 亚洲欧美成人一区二区 | 999精品国产| 久久精品第一页 | av性在线| 国产一区二区在线电影 | 日韩欧美一本 | 国产综合一区二区 | 国产综合福利 | 欧美亚洲日本国产 | 精品成人无码久久久久久 | 一区二区三区四区不卡 | 羞羞的软件 | 久久xx | 91最新地址永久入口 | 欧美精品一区二区免费看 | 色亚洲欧美 | 精品欧美乱码久久久久久1区2区 | 国产二页 | 无毒黄色网址 | 国产香蕉一区 | 综合免费视频 | 欧美少妇激情 | 国产一区二区黄 | 中国美女黄色 | xxxx.国产| 免费av网站观看 | 蜜臀久久精品 | 香港三日本8a三级少妇三级99 | 精品视频久久久久 | 亚洲天天 | 久久精品4| 欧美xxxx性 | 亚洲精品国产福利 | 97操| 精品日韩在线视频 | 国产午夜精品免费一区二区三区视频 | 男生和女生差差的视频 | 亚洲一区二区在线免费观看 | 一区在线视频 | 亚洲国产精品成人无久久精品 | 看av在线 | 日日操天天操夜夜操 | 一区二区不卡 | 99久久婷婷国产综合精品电影 | 黄网在线免费观看 | 欧美xxxx黑人又粗又长密月 | 亚洲视频自拍偷拍 | 国产精品福利导航 | 亚洲AV无码一区二区伊人久久 | 中文字幕网伦射乱中文 | 毛茸茸日本熟妇高潮 | 在哪里可以看黄色片 | 另类ts人妖一区二区三区 | 国产一区二区三区精品愉拍 | 91麻豆蜜桃 | 欧美一区二区三区精品 | 国产一区二区三区网站 | 日本高清在线观看 | 91精品久久久久久久久久久 | 日韩精品视频三区 |