Python数据分析之获取数据
生活随笔
收集整理的這篇文章主要介紹了
Python数据分析之获取数据
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
一、獲取數(shù)據(jù)采用數(shù)據(jù)倉(cāng)庫(kù),將所有業(yè)務(wù)數(shù)據(jù)經(jīng)匯總處理,構(gòu)成數(shù)據(jù)倉(cāng)庫(kù)(DW)。數(shù)據(jù)倉(cāng)庫(kù)包括全部事實(shí)的記錄、部分維度與數(shù)據(jù)的整理(數(shù)據(jù)集市-DM)數(shù)據(jù)庫(kù)與倉(cāng)庫(kù)的對(duì)比1.數(shù)據(jù)庫(kù)面向業(yè)務(wù)存儲(chǔ),倉(cāng)庫(kù)面向主題存儲(chǔ)。注:主題是較高層次上對(duì)分析對(duì)象數(shù)據(jù)的一個(gè)完整并且一致的描述2.數(shù)據(jù)庫(kù)針對(duì)應(yīng)用(OLTP),倉(cāng)庫(kù)針對(duì)分析(OLAP)3.數(shù)據(jù)庫(kù)組織規(guī)范,倉(cāng)庫(kù)可能冗余,相對(duì)變化大,數(shù)據(jù)量大 二、獲取數(shù)據(jù)采用監(jiān)測(cè)與抓取1.直接解析網(wǎng)頁(yè)、接口、文件的信息2.python通常采用urllib、urllib2、requests、scrapy抓取數(shù)據(jù)或網(wǎng)站,采用PhantomJS、beautifualSoup、Xpath(lxml)解析路徑三、獲取數(shù)據(jù)--填寫(xiě)、埋點(diǎn)、日志用戶(hù)填寫(xiě)信息;App或網(wǎng)頁(yè)埋點(diǎn)(特定流程的信息記錄點(diǎn));操作日志四、獲取數(shù)據(jù)---計(jì)算通過(guò)已有數(shù)據(jù)計(jì)算生成衍生數(shù)據(jù)
總結(jié)
以上是生活随笔為你收集整理的Python数据分析之获取数据的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 接口测试平台代码实现134: 全局变量-
- 下一篇: python压缩_Python札记 --