网易云课堂解析_使用SQL分析网易云课堂职场提升类课程
前言:
正值畢業(yè)季,職場相關(guān)話題毋庸置疑又再次成為熱門話題,結(jié)束學(xué)校生活并不意味著學(xué)習(xí)的終結(jié),真正走入職場才會發(fā)現(xiàn)學(xué)習(xí)才剛剛開始。許多職場人士為了在激烈的市場競爭中保持競爭力,都會選擇在工作之余學(xué)習(xí)充電。那么什么樣的課程最受職場人士青睞或者說什么樣的課程最有市場?俗話說:知己知彼百戰(zhàn)百勝,弄清楚職場人士都在學(xué)些什么,對于自己跟上職場步伐,以及自我審視與時俱進(jìn)都有積極意義。為了大致了解以上問題,本文選擇國內(nèi)知名互聯(lián)網(wǎng)教育平臺——網(wǎng)易云課堂“職場提升”模塊的全部課程進(jìn)行淺析。
分析思路:
分析思路正文
一、提出問題
1、職場提升模塊課程的用戶規(guī)模如何?
2、最受用戶歡迎的熱門課程是什么?
3、職場提升模塊下各分類課程學(xué)習(xí)人數(shù)分布及占比情況如何?
4、最熱門課程分類下子分類(主題)課程的分布情況及占比如何?
5、哪個課程的客單價最高?哪個課程的用戶付費(fèi)總額最高?熱門課程單價如何?
二、理解數(shù)據(jù)
本文的數(shù)據(jù)來源:
爬取網(wǎng)易云課程官網(wǎng)課程(職場提升模塊)數(shù)據(jù)集,共計(jì)1331條數(shù)據(jù)(獲取時間:2019.6.23日),因課程官網(wǎng)數(shù)據(jù)存在變動,該數(shù)據(jù)僅供參考。
求職準(zhǔn)備?study.163.com爬取職場提升模塊下所有課程數(shù)據(jù)獲取的原數(shù)據(jù)如下:
源數(shù)據(jù)清洗后數(shù)據(jù)集字段特征(具體清洗步驟在本文第三部分):
1、category :課程分類
2、c_link : 課程分類鏈接
3、title:課程子分類
4、t_link:子分類課程鏈接
5、coursename:課程名
6、cn:課程編號
7、score :課程評分
8、price:客單價
9、num_students:學(xué)習(xí)人數(shù)
10、id:編號(主鍵)
三、數(shù)據(jù)清洗
1、導(dǎo)入數(shù)據(jù),修改數(shù)據(jù)類型,字段重命名
字段“score”“price”“mum_students”類型應(yīng)修改為“int”,但由于數(shù)據(jù)尚未清洗,字段中存在有價值文本信息,故類型修改放到下面的環(huán)節(jié)處理,在此僅對字段重命名,把中文字段用英文重命名。英文命名在后期的SQL查詢中不容易報錯,這里涉及字符集編碼問題,本文不作具體說明。
數(shù)據(jù)導(dǎo)入成功,并具體查看前10條數(shù)據(jù)情況:
數(shù)據(jù)導(dǎo)入成功查詢前十條數(shù)據(jù)2、一致化處理
1)提取課程編號(cn)
- 通過觀察字段“l(fā)ink2”找到課程的編號
- 更改字段名稱為“cn”(課程編號)
- 提取課程編號
以上課程編號已提取成功,我們來看下效果:
課程編號提取成功2)提取學(xué)過的人數(shù)
處理方法同上
提取學(xué)過的人數(shù)看下結(jié)果:
提取人數(shù)成功3、刪除重復(fù)項(xiàng)
1)查找重復(fù)值
這里使用課程編號字段,查找重復(fù)值
查找重復(fù)值2)刪除重復(fù)值
查找出重復(fù)值后需要刪除重復(fù)項(xiàng),但需要保留唯一的記錄,這里通過增加主鍵,在此基礎(chǔ)上增加篩選條件達(dá)到保留唯一記錄的結(jié)果。
增加主鍵“id”增加主鍵成功刪除重復(fù)項(xiàng)并保留唯一記錄檢驗(yàn)一下結(jié)果,處理成功,無重復(fù)值:
無重復(fù)值4、缺失值處理
1)查找空值
查找空值由返回結(jié)果可知,無空值,故無需處理。
四、構(gòu)建模型
1、職場提升模塊課程的用戶規(guī)模如何?
由查詢結(jié)果可知,職場提升類課程累計(jì)學(xué)習(xí)人數(shù)5419256,反映了該類課程學(xué)習(xí)人數(shù)較多,用戶規(guī)模較大。
2、最受用戶歡迎的熱門課程是什么?
查詢上課人數(shù)量前十名,按照降序排列得出熱門課程
熱門課程前十名熱門課程排名第一名的是《跟王佩豐學(xué)Excel視頻教程》,累計(jì)學(xué)習(xí)人數(shù)468000,相當(dāng)大的用戶體量,從側(cè)面反應(yīng)Excel課程很受職場人士的追捧。
3、職場提升模塊下各分類課程學(xué)習(xí)人數(shù)分布及占比情況如何?
各主題課程學(xué)習(xí)人數(shù)分布各主題課程學(xué)習(xí)人數(shù)占比由上可知,辦公軟件類課程排名第一,累計(jì)學(xué)習(xí)人數(shù)達(dá)到350多萬,占比65%。當(dāng)之無愧的成為職場提升模塊下最熱門課程分類。
4、最熱門課程分類下子分類(主題)課程的分布情況及占比如何?
子分類課程的分布情況及占比“辦公軟件”作為最熱門的課程分類,其子分類排名前三甲分別是Excel、PPT、Word;從側(cè)面體現(xiàn)了office辦公軟件在職場中具有十分重要的地位,可以說是必備的職場技能。其中,Excel學(xué)習(xí)人數(shù)占比50%,占了整個辦公軟件分類所有課程的一半,說明Excel技能在職場中處于核心必備技能。
5、哪個課程的客單價最高?哪個課程的用戶付費(fèi)總額最高?熱門課程單價如何?
課單價最高的課程課單價最高的課程是《corona渲染器寫實(shí)教程》,該課程屬于專業(yè)類課程,有其特定的職業(yè)屬性,不具備代表性,在此不做進(jìn)一步分析。
總收入排名前10的課程在總收入排名前十的課程中office辦公軟件類課程占了6位,課程單價范圍在169~499元之間,價值親民,性價比較高。同時在營收方面也很可觀,其中《和秋葉一起學(xué)PPT》課程總收入過千萬,而其他幾門課程總收入也均在450萬以上,營收也可以從側(cè)面反映此類課程的市場認(rèn)可度較好,從一定程度上說明office辦公技能在職場中無可撼動的霸主地位。
注:數(shù)據(jù)中課程價格均為原價,不涉及促銷折扣價格。因在上述課程單價中出現(xiàn)破千元單價,影響整體判斷屬于異常值,故《520節(jié)=Excel+PPT+word小白變高手》課程使用官網(wǎng)折扣價格499元。
五、結(jié)論
1、網(wǎng)易云課堂—職場提升類課程累計(jì)學(xué)習(xí)人數(shù)5419256,用戶規(guī)模較大,課程的市場關(guān)注度高。
2、熱門課程排名第一名的是《跟王佩豐學(xué)Excel視頻教程》,累計(jì)學(xué)習(xí)人數(shù)468000,單門課程有如此多的人學(xué)習(xí)可以說是非常成功,從側(cè)面反應(yīng)Excel課程很受職場人士的追捧。
3、辦公軟件類課程排名第一,累計(jì)學(xué)習(xí)人數(shù)達(dá)到350多萬,占比65%,占據(jù)職場提升類課程半壁江山,當(dāng)之無愧的成為職場提升模塊下最熱門課程分類。
4、“辦公軟件”作為最熱門的課程分類,其子分類排名前三甲分別是Excel、PPT、Word;體現(xiàn)了office辦公軟件在職場中具有十分重要的地位,可以說是必備的職場技能。其中,Excel學(xué)習(xí)人數(shù)占比50%,占了整個辦公軟件分類所有課程的一半,說明Excel技能在職場中處于核心必備技能。
5、在總收入排名前十的課程中office辦公軟件類課程占了6位,同時課程主打親民路線,定價在169~499元之間,性價比較高。正是由于該類課程性價比高所以在營收方面表現(xiàn)的也十分可觀,其中《和秋葉一起學(xué)PPT》課程總收入過千萬,而其他幾門課程總收入也均在450萬以上,營收情況也可以從側(cè)面反映此類課程的市場認(rèn)可度較好,從一定程度上說明office辦公技能在職場中無可撼動的霸主地位。
總結(jié)
以上是生活随笔為你收集整理的网易云课堂解析_使用SQL分析网易云课堂职场提升类课程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux两台服务器传输,Linux两台
- 下一篇: redis stream java消息队