日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

把时间还给洞察,且看PPT调研报告自动生成攻略

發布時間:2023/12/16 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 把时间还给洞察,且看PPT调研报告自动生成攻略 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文/JSong @2017.02.28

在數據分析里面有一句話是說,80%的時間要用于數據清洗和整理,而我覺得理想的狀態應該是把更多的把時間花在數據背后的洞察當中。去年11月在簡書占了個坑,說要自己寫一個工具來解決,今天我來填坑了。

1、解決方案概述

  • 工具包:reportgen
  • 項目地址:github,歡迎star 或者folk
  • 軟件依賴:python3(兼容python2,但中文部分需要手動修改一個第三方包的2行代碼)
  • 數據需求:調研數據,包括但不僅限于問卷星原始數據、問卷網原始數據
  • 主要功能1: 自動生成概述性質的報告(ppt格式,針對每道題目給出頻數統計,并繪制ppt圖表)
  • 主要功能2:自動交叉分析,并生成報告(自動卡方檢驗、TGI、CHI指標計算、簡單結論提取等)
  • 2、準備工作

    依賴環境:

  • python科學計算所需的包,建議直接安裝anaconda(強烈推薦使用python3版本)
  • 安裝第三方包python-pptx: 在cmd中輸入:"pip install python-pptx"
  • 安裝report包: 下載report\report.py, 然后放在工作目錄即可(省心點可以直接扔進 C:\Anaconda3\Lib\site-packages 中,這樣在任何地方都能使用該工具包啦)
  • 備注

    py2.7版本的pptx包對中文支持有 bug, 請按照如下方式修改

  • 打開文件 ".\pptx\chart\xmlwriter.py"
  • 將大約1338行和1373行的 "escape(str(name))" 改為"escape(unicode(name))"
  • 3、快速上手

    【不懂或者不想學python3的請看這】

    為了方便更多人使用,我給windows用戶提供了一個很簡單的使用方法,大家下載項目地址中的文件夾reportgen[無python經驗的下載]即可,使用說明也在其中,非常簡單。這里也提供一個百度云盤地址:reportgen簡易使用版本鏈接(密碼: as84): https://pan.baidu.com/s/1dEPT72p

    3.1 三行代碼解決描述統計報告:

    import report as rpt # 數據編碼和導入 # 300_300_0.xls是問卷星的按文本數據,300_300_2.xls是問卷星的按序號數據. # 如果將他們放在“.\\data\\”中,則文件名可以缺省,即:`data,code=rpt.wenjuanxing()` data,code=rpt.wenjuanxing(['300_300_0.xls','300_300_2.xls']) # 描述統計報告生成 rpt.summary_chart(data,code,filename=u'調研報告初稿');

    如上代碼可以在.\out\文件夾下生成兩個文件

  • 調研報告初稿.pptx: 針對每個題目描述統計,支持單選題、多選題、排序題、矩陣單選題等
  • 調研報告初稿.xlsx: 生成每個題目的統計數據,包括頻數和占比
  • 3.2 四行代碼解決交叉統計報告

    import report as rpt # 數據編碼和導入 data,code=rpt.wenjuanxing() # 交叉統計報告生成(假設第一道題Q1是性別選擇題) save_dstyle=['FE','TGI','CHI']#自由選擇需要保存的指標(FE:期望頻數等) rpt.cross_chart(data,code,cross_class='Q1',filename=u'性別差異分析',save_dstyle=save_dstyle);

    如上代碼可以在.\out\文件夾下生成5個文件

  • 性別差異分析.pptx: 考慮每個題目在性別上的差異
  • 性別差異分析_百分比.xlsx:
  • 性別差異分析_FE.xlsx:
  • 性別差異分析_TGI.xlsx:
  • 性別差異分析_CHI.xlsx:
  • 3.3 其他實用函數

    import report as rpt # 文件I/O data=rpt.read_data(filename) code=rpt.read_code(filename) rpt.save_data(data,filename,code) rpt.save_code(code,filename) data,code=rpt.wenjuanxing(filepath)# 編碼問卷星的數據 data,code=rpt.wenjuanwang(filepath)# 編碼問卷網的數據 # 數據統計函數 t,t1=rpt.qtable(data,code,'Q1')# 單變量頻數統計 t,t1=rpt.qtable(data,code,'Q1','Q2')# 雙變量交叉統計 # 數據分析函數 cdata=rpt.contingency(fo)# 列聯表分析 rpt.gof_test(fo,fe)# 擬合優度檢驗 rpt.chi2_test(fo,fe)# 卡方檢驗 rpt.binomial_interval(p,n)# 計算比率的置信區間 # 自動描述統計報告 ''' summary_qlist: 例如['Q1','Q2'],需要分析的問卷題目列表,缺省為code中所有的關鍵詞 template: 例如{'path':'mytemplate.pptx','layouts':[1,2]}, 缺省為pptx自帶的模板''' rpt.summary_chart(data,code,filename=u'描述統計報告', summary_qlist=None,\ max_column_chart=20,template=None)# 自動交叉統計報告 ''' cross_class: 需要交叉分析的題目,如:'Q1' cross_qlist: 例如['Q1','Q2'],需要分析的問卷題目列表,缺省為code中所有的關鍵詞 plt_dstyle: 繪制在ppt上使用的數據格式,缺省為百分比表,可以選擇'TGI'等 save_dstyle: 需要保存的數據,例如:['TGI','FO','TWI','CHI'] template: 例如{'path':'mytemplate.pptx','layouts':[1,2]}, 缺省為pptx自帶的模板''' rpt.cross_chart(data,code,cross_class,filename=u'交叉分析', cross_qlist=None,\ delclass=None,plt_dstyle=None,cross_order=None, significance_test=False, \ reverse_display=False,total_display=True,max_column_chart=20,save_dstyle=None,\ template=None):

    END


    若您覺得感興趣,請點擊“喜歡”;
    若您用的舒服,請分享給其他人;

    轉載于:https://www.cnblogs.com/gasongjian/p/6481422.html

    總結

    以上是生活随笔為你收集整理的把时间还给洞察,且看PPT调研报告自动生成攻略的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。