日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

美国选民喜好#

發(fā)布時(shí)間:2023/12/20 编程问答 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 美国选民喜好# 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1、賽前準(zhǔn)備

1.1 前言

本次賽事由開源學(xué)習(xí)組織Datawhale主辦,主要帶領(lǐng)學(xué)習(xí)者利用Python進(jìn)行數(shù)據(jù)分析以及數(shù)據(jù)可視化,包含數(shù)據(jù)集的處理、數(shù)據(jù)探索與清晰、數(shù)據(jù)分析、數(shù)據(jù)可視化四部分,利用pandas、matplotlib、wordcloud等第三方庫帶大家玩轉(zhuǎn)數(shù)據(jù)分析~還有豐富禮品等你來領(lǐng)取哦~
學(xué)習(xí)賽事地址:https://tianchi.aliyun.com/competition/entrance/531837/introduction

1.2 數(shù)據(jù)集來源介紹

所有候選人信息
該文件為每個(gè)候選人提供一份記錄,并顯示候選人的信息、總收入、從授權(quán)委員會(huì)收到的轉(zhuǎn)賬、付款總額、給授權(quán)委員會(huì)的轉(zhuǎn)賬、庫存現(xiàn)金總額、貸款和債務(wù)以及其他財(cái)務(wù)匯總信息。
數(shù)據(jù)字段描述詳細(xì):https://www.fec.gov/campaign-finance-data/all-candidates-file-description/
關(guān)鍵字段說明

  • CAND_ID 候選人ID
  • CAND_NAME 候選人姓名
  • CAND_PTY_AFFILIATION 候選人黨派

數(shù)據(jù)來源:https://www.fec.gov/files/bulk-downloads/2020/weball20.zip

候選人委員會(huì)鏈接信息
該文件顯示候選人的身份證號碼、候選人的選舉年份、聯(lián)邦選舉委員會(huì)選舉年份、委員會(huì)識別號、委員會(huì)類型、委員會(huì)名稱和鏈接標(biāo)識號。
信息描述詳細(xì):https://www.fec.gov/campaign-finance-data/candidate-committee-linkage-file-description/
關(guān)鍵字段說明

  • CAND_ID 候選人ID
  • CAND_ELECTION_YR 候選人選舉年份
  • CMTE_ID 委員會(huì)ID

數(shù)據(jù)來源:https://www.fec.gov/files/bulk-downloads/2020/ccl20.zip

個(gè)人捐款檔案信息
【注意】由于文件較大,本數(shù)據(jù)集只包含2020.7.22-2020.8.20的相關(guān)數(shù)據(jù),如果需要更全數(shù)據(jù)可以通過數(shù)據(jù)來源中的地址下載。
該文件包含有關(guān)收到捐款的委員會(huì)、披露捐款的報(bào)告、提供捐款的個(gè)人、捐款日期、金額和有關(guān)捐款的其他信息。
信息描述詳細(xì):https://www.fec.gov/campaign-finance-data/contributions-individuals-file-description/
關(guān)鍵字段說明

  • CMTE_ID 委員會(huì)ID
  • NAME 捐款人姓名
  • CITY 捐款人所在市
  • State 捐款人所在州
  • EMPLOYER 捐款人雇主/公司
  • OCCUPATION 捐款人職業(yè)

數(shù)據(jù)來源:https://www.fec.gov/files/bulk-downloads/2020/indiv20.zip

1.3 需要提前安裝的包

# 安裝詞云處理包wordcloud !pip install wordcloud --user Looking in indexes: https://mirrors.aliyun.com/pypi/simple Requirement already satisfied: wordcloud in /data/nas/workspace/envs/python3.6/site-packages (1.8.1) Requirement already satisfied: numpy>=1.6.1 in /opt/conda/lib/python3.6/site-packages (from wordcloud) (1.19.4) Requirement already satisfied: matplotlib in /opt/conda/lib/python3.6/site-packages (from wordcloud) (3.3.3) Requirement already satisfied: pillow in /opt/conda/lib/python3.6/site-packages (from wordcloud) (8.0.1) Requirement already satisfied: python-dateutil>=2.1 in /opt/conda/lib/python3.6/site-packages (from matplotlib->wordcloud) (2.8.1) Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.3 in /opt/conda/lib/python3.6/site-packages (from matplotlib->wordcloud) (2.4.7) Requirement already satisfied: kiwisolver>=1.0.1 in /opt/conda/lib/python3.6/site-packages (from matplotlib->wordcloud) (1.2.0) Requirement already satisfied: cycler>=0.10 in /opt/conda/lib/python3.6/site-packages (from matplotlib->wordcloud) (0.10.0) Requirement already satisfied: six in /opt/conda/lib/python3.6/site-packages (from cycler>=0.10->matplotlib->wordcloud) (1.15.0)

1.4 需要提前下載好數(shù)據(jù)集

【注意】如果你只是在天池技術(shù)圈看到本文,你需要先查看賽事指南。
通過賽事指南提示操作你可以成功Fork賽事論壇的baseline到你的天池實(shí)驗(yàn)室,并點(diǎn)擊編輯按鈕成功跳轉(zhuǎn)到了DSW在線編程。
在進(jìn)行數(shù)據(jù)處理前,你需要點(diǎn)擊DSW左側(cè)天池tab,下載本案例數(shù)據(jù)集2020_US_President_political_contributions,后續(xù)步驟才能正確執(zhí)行。

2、數(shù)據(jù)處理

進(jìn)行數(shù)據(jù)處理前,我們需要知道我們最終想要的數(shù)據(jù)是什么樣的,因?yàn)槲覀兪窍敕治龊蜻x人與捐贈(zèng)人之間的關(guān)系,所以我們想要一張數(shù)據(jù)表中有捐贈(zèng)人與候選人一一對應(yīng)的關(guān)系,所以需要將目前的三張數(shù)據(jù)表進(jìn)行一一關(guān)聯(lián),匯總到需要的數(shù)據(jù)。

2.1 將委員會(huì)和候選人一一對應(yīng),通過CAND_ID關(guān)聯(lián)兩個(gè)表

由于候選人和委員會(huì)的聯(lián)系表中無候選人姓名,只有候選人ID(CAND_ID),所以需要通過CAND_ID從候選人表中獲取到候選人姓名,最終得到候選人與委員會(huì)聯(lián)系表ccl。

# 導(dǎo)入相關(guān)處理包 import pandas as pd # 讀取候選人信息,由于原始數(shù)據(jù)沒有表頭,需要添加表頭 #***txt文本轉(zhuǎn)換成csv candidates = pd.read_csv("weball20.txt", sep = '|',names=['CAND_ID','CAND_NAME','CAND_ICI','PTY_CD','CAND_PTY_AFFILIATION','TTL_RECEIPTS','TRANS_FROM_AUTH','TTL_DISB','TRANS_TO_AUTH','COH_BOP','COH_COP','CAND_CONTRIB','CAND_LOANS','OTHER_LOANS','CAND_LOAN_REPAY','OTHER_LOAN_REPAY','DEBTS_OWED_BY','TTL_INDIV_CONTRIB','CAND_OFFICE_ST','CAND_OFFICE_DISTRICT','SPEC_ELECTION','PRIM_ELECTION','RUN_ELECTION','GEN_ELECTION','GEN_ELECTION_PRECENT','OTHER_POL_CMTE_CONTRIB','POL_PTY_CONTRIB','CVG_END_DT','INDIV_REFUNDS','CMTE_REFUNDS']) # 讀取候選人和委員會(huì)的聯(lián)系信息 ccl = pd.read_csv("ccl.txt", sep = '|',names=['CAND_ID','CAND_ELECTION_YR','FEC_ELECTION_YR','CMTE_ID','CMTE_TP','CMTE_DSGN','LINKAGE_ID']) # 關(guān)聯(lián)兩個(gè)表數(shù)據(jù) ccl = pd.merge(ccl,candidates) # 提取出所需要的列 ccl = pd.DataFrame(ccl, columns=[ 'CMTE_ID','CAND_ID', 'CAND_NAME','CAND_PTY_AFFILIATION'])

數(shù)據(jù)字段說明:

  • CMTE_ID:委員會(huì)ID
  • CAND_ID:候選人ID
  • CAND_NAME:候選人姓名
  • CAND_PTY_AFFILIATION:候選人黨派
# 查看目前ccl數(shù)據(jù)前10行 ccl.head(10) CMTE_IDCAND_IDCAND_NAMECAND_PTY_AFFILIATION0123456789
C00697789H0AL01055CARL, JERRY LEE, JRREP
C00701557H0AL01063LAMBERT, DOUGLAS WESTLEY IIIREP
C00701409H0AL01071PRINGLE, CHRISTOPHER PAULREP
C00703066H0AL01089HIGHTOWER, BILLREP
C00708867H0AL01097AVERHART, JAMESDEM
C00710947H0AL01105GARDNER, KIANI ADEM
C00722512H0AL01121CASTORANI, JOHNREP
C00725069H0AL01139COLLINS, FREDERICK G. RICK'DEM
C00462143H0AL02087ROBY, MARTHAREP
C00493783H0AL02087ROBY, MARTHAREP

2.2 將候選人和捐贈(zèng)人一一對應(yīng),通過CMTE_ID關(guān)聯(lián)兩個(gè)表

核心目的:通過CMTE_ID將目前處理好的候選人和委員會(huì)關(guān)系表與人捐款檔案表進(jìn)行關(guān)聯(lián),得到候選人==捐贈(zèng)人的對應(yīng)聯(lián)系表cil。

# 讀取個(gè)人捐贈(zèng)數(shù)據(jù),由于原始數(shù)據(jù)沒有表頭,需要添加表頭 # 提示:讀取本文件大概需要5-10s itcont = pd.read_csv('itcont_2020_20200722_20200820.txt', sep='|',names=['CMTE_ID','AMNDT_IND','RPT_TP','TRANSACTION_PGI','IMAGE_NUM','TRANSACTION_TP','ENTITY_TP','NAME','CITY','STATE','ZIP_CODE','EMPLOYER','OCCUPATION','TRANSACTION_DT','TRANSACTION_AMT','OTHER_ID','TRAN_ID','FILE_NUM','MEMO_CD','MEMO_TEXT','SUB_ID']) # 將候選人與委員會(huì)關(guān)系表ccl和個(gè)人捐贈(zèng)數(shù)據(jù)表itcont合并,通過 CMTE_ID c_itcont = pd.merge(ccl,itcont)#只能通過 CMTE_ID這項(xiàng)合并?? # 提取需要的數(shù)據(jù)列 c_itcont = pd.DataFrame(c_itcont, columns=[ 'CAND_NAME','NAME', 'STATE','EMPLOYER','OCCUPATION','TRANSACTION_AMT', 'TRANSACTION_DT','CAND_PTY_AFFILIATION'])

數(shù)據(jù)說明

  • CAND_NAME – 接受捐贈(zèng)的候選人姓名
  • NAME – 捐贈(zèng)人姓名
  • STATE – 捐贈(zèng)人所在州
  • EMPLOYER – 捐贈(zèng)人所在公司
  • OCCUPATION – 捐贈(zèng)人職業(yè)
  • TRANSACTION_AMT – 捐贈(zèng)數(shù)額(美元)
  • TRANSACTION_DT – 收到捐款的日期
  • CAND_PTY_AFFILIATION – 候選人黨派
# 查看目前數(shù)據(jù)前10行 c_itcont.head(10) CAND_NAMENAMESTATEEMPLOYEROCCUPATIONTRANSACTION_AMTTRANSACTION_DTCAND_PTY_AFFILIATION0123456789
MORGAN, JOSEPH DAVIDMARTIN, WILLIAM IIAZRETIREDRETIRED1007242020REP
MORGAN, JOSEPH DAVIDRODRIGUEZ, GERARDOAZVA HOSPITALLAB TECH407242020REP
MORGAN, JOSEPH DAVIDRODRIGUEZ, GERARDOAZVA HOSPITALLAB TECH407312020REP
WOOD, DANIELHOPKINS, RICHARDAZPOWERS-LEAVITTINSURANCE AGENT3008102020REP
WOOD, DANIELPENDLETON, DIANEAZUNEMPLOYEDNaN5008072020REP
WOOD, DANIELPREVATT, WILLIAMAZSELF-EMPLOYEDDVM5007312020REP
WOOD, DANIELHARDING, DOUGAZMICROSUREOPERATIONS MANAGER28008102020REP
WOOD, DANIELHARDING, MARIAZNaNNaN14008152020REP
WOOD, DANIELHEDGER, CYNTHIATXNaNNaN2007312020REP
HUANG, PEGGYHUANG - PERSONAL FUNDS, PEGGYCAOFFICE OF THE ATTORNEY GENERALDEPUTY ATTORNEY GENERAL26007252020REP

3、數(shù)據(jù)探索與清洗

進(jìn)過數(shù)據(jù)處理部分,我們獲得了可用的數(shù)據(jù)集,現(xiàn)在我們可以利用調(diào)用shape屬性查看數(shù)據(jù)的規(guī)模,調(diào)用info函數(shù)查看數(shù)據(jù)信息,調(diào)用describe函數(shù)查看數(shù)據(jù)分布。

# 查看數(shù)據(jù)規(guī)模 多少行 多少列 c_itcont.shape (756205, 8) # 查看整體數(shù)據(jù)信息,包括每個(gè)字段的名稱、非空數(shù)量、字段的數(shù)據(jù)類型 c_itcont.info() <class 'pandas.core.frame.DataFrame'> Int64Index: 756205 entries, 0 to 756204 Data columns (total 8 columns):# Column Non-Null Count Dtype --- ------ -------------- ----- 0 CAND_NAME 756205 non-null object1 NAME 756205 non-null object2 STATE 756160 non-null object3 EMPLOYER 737413 non-null object4 OCCUPATION 741294 non-null object5 TRANSACTION_AMT 756205 non-null int64 6 TRANSACTION_DT 756205 non-null int64 7 CAND_PTY_AFFILIATION 756205 non-null object dtypes: int64(2), object(6) memory usage: 51.9+ MB

通過上面的探索我們知道目前數(shù)據(jù)集的一些基本情況,目前數(shù)據(jù)總共有756205行,8列,總占用內(nèi)存51.9+MB,STATE、EMPLOYER、OCCUPATION有缺失值,另外日期列目前為int64類型,需要進(jìn)行轉(zhuǎn)換為str類型。(why???)

#空值處理,統(tǒng)一填充 NOT PROVIDED(未提供).inplace=True將原始數(shù)據(jù)一起改變 c_itcont['STATE'].fillna('NOT PROVIDED',inplace=True) c_itcont['EMPLOYER'].fillna('NOT PROVIDED',inplace=True) c_itcont['OCCUPATION'].fillna('NOT PROVIDED',inplace=True) # 對日期TRANSACTION_DT列進(jìn)行處理 c_itcont['TRANSACTION_DT'] = c_itcont['TRANSACTION_DT'] .astype(str) # 將日期格式改為年月日 7242020 ***** c_itcont['TRANSACTION_DT'] = [i[3:7]+i[0]+i[1:3] for i in c_itcont['TRANSACTION_DT'] ] # 再次查看數(shù)據(jù)信息 c_itcont.info() <class 'pandas.core.frame.DataFrame'> Int64Index: 756205 entries, 0 to 756204 Data columns (total 8 columns):# Column Non-Null Count Dtype --- ------ -------------- ----- 0 CAND_NAME 756205 non-null object1 NAME 756205 non-null object2 STATE 756205 non-null object3 EMPLOYER 756205 non-null object4 OCCUPATION 756205 non-null object5 TRANSACTION_AMT 756205 non-null int64 6 TRANSACTION_DT 756205 non-null object7 CAND_PTY_AFFILIATION 756205 non-null object dtypes: int64(1), object(7) memory usage: 51.9+ MB # 查看數(shù)據(jù)前3行 c_itcont.head(3) CAND_NAMENAMESTATEEMPLOYEROCCUPATIONTRANSACTION_AMTTRANSACTION_DTCAND_PTY_AFFILIATION012
MORGAN, JOSEPH DAVIDMARTIN, WILLIAM IIAZRETIREDRETIRED1002020724REP
MORGAN, JOSEPH DAVIDRODRIGUEZ, GERARDOAZVA HOSPITALLAB TECH402020724REP
MORGAN, JOSEPH DAVIDRODRIGUEZ, GERARDOAZVA HOSPITALLAB TECH402020731REP
# 查看數(shù)據(jù)表中數(shù)據(jù)類型的列的數(shù)據(jù)分布情況 c_itcont.describe()#對列進(jìn)行匯總統(tǒng)計(jì)(可以用數(shù)字直接計(jì)算出來的那列) TRANSACTION_AMTcountmeanstdmin25%50%75%max
7.562050e+05
1.504307e+02
2.320452e+03
-5.600000e+03
2.000000e+01
3.500000e+01
1.000000e+02
1.500000e+06
# 查看單列的數(shù)據(jù)發(fā)布情況 c_itcont['CAND_NAME'].describe()#注意該列并不能用數(shù)字描述:記錄數(shù),唯一值的個(gè)數(shù),出現(xiàn)次數(shù)最多的值,出現(xiàn)最頻繁的值出現(xiàn)了多少次 count 756205 unique 312 top BIDEN, JOSEPH R JR freq 507816 Name: CAND_NAME, dtype: object

4、數(shù)據(jù)分析

# 計(jì)算每個(gè)黨派的所獲得的捐款總額,然后排序,取前十位 c_itcont.groupby("CAND_PTY_AFFILIATION").sum().sort_values("TRANSACTION_AMT",ascending=False).head(10)#升序假 TRANSACTION_AMTCAND_PTY_AFFILIATIONDEMREPINDLIBDFLGRENONUNKCONBDY
75961730
37170653
328802
169202
76825
18607
11256
10195
4117
3250
# 計(jì)算每個(gè)總統(tǒng)候選人所獲得的捐款總額,然后排序,取前十位 c_itcont.groupby("CAND_NAME").sum().sort_values("TRANSACTION_AMT",ascending=False).head(10) TRANSACTION_AMTCAND_NAMEBIDEN, JOSEPH R JRTRUMP, DONALD J.SULLIVAN, DANJACOBS, CHRISTOPHER L.BLOOMBERG, MICHAEL R.MARKEY, EDWARD J. SEN.SHAHEEN, JEANNEKENNEDY, JOSEPH P IIICORNYN, JOHN SENFIGLESTHALER, WILLIAM MATTHEW MD
68111142
16594982
9912465
6939209
3451916
606832
505446
467738
345959
258221

獲得捐贈(zèng)最多的黨派有DEM(民主黨)、REP(共和黨),分別對應(yīng)BIDEN, JOSEPH R JR(拜登)和TRUMP, DONALD J.(特朗普),從我們目前分析的2020.7.22-2020.8.20這一個(gè)月的數(shù)據(jù)來看,在選民的捐贈(zèng)數(shù)據(jù)中拜登代表的民主黨完勝特朗普代表的共和黨,由于完整數(shù)據(jù)量過大,所以沒有對所有數(shù)據(jù)進(jìn)行匯總分析,因此也不能確定11月大選公布結(jié)果就一定是拜登當(dāng)選

# 查看不同職業(yè)的人捐款的總額,然后排序,取前十位 c_itcont.groupby('OCCUPATION').sum().sort_values("TRANSACTION_AMT",ascending=False).head(10) TRANSACTION_AMTOCCUPATIONNOT EMPLOYEDRETIREDNOT PROVIDEDATTORNEYFOUNDERPHYSICIANCONSULTANTLAWYERPROFESSOREXECUTIVE
24436214
18669950
5089355
4443569
3519109
3295595
1647033
1565976
1481260
1467865
# 查看每個(gè)職業(yè)捐款人的數(shù)量!!!人的數(shù)量 c_itcont['OCCUPATION'].value_counts().head(10) NOT EMPLOYED 224109 RETIRED 151834 ATTORNEY 19666 NOT PROVIDED 14912 PHYSICIAN 14033 CONSULTANT 8333 PROFESSOR 8022 TEACHER 8013 ENGINEER 7922 SALES 6435 Name: OCCUPATION, dtype: int64

從捐款人的職業(yè)這個(gè)角度分析,我們會(huì)發(fā)現(xiàn)NOT EMPLOYED(自由職業(yè))的總捐贈(zèng)額是最多,通過查看每個(gè)職業(yè)捐贈(zèng)的人數(shù)來看,我們就會(huì)發(fā)現(xiàn)是因?yàn)镹OT EMPLOYED(自由職業(yè))人數(shù)多的原因,另外退休人員捐款人數(shù)也特別多,所以捐款總數(shù)對應(yīng)的也多,其他比如像:律師、創(chuàng)始人、醫(yī)生、顧問、教授、主管這些高薪人才雖然捐款總?cè)藬?shù)少,但是捐款總金額也占據(jù)了很大比例。

# 每個(gè)州獲捐款的總額,然后排序,取前五位 c_itcont.groupby('STATE').sum().sort_values("TRANSACTION_AMT",ascending=False).head(5) TRANSACTION_AMTSTATECANYFLTXMA
19999115
11468537
8128789
8101871
5187957
# 查看每個(gè)州捐款人的數(shù)量 c_itcont['STATE'].value_counts().head(5) CA 127895 TX 54457 FL 54343 NY 49453 MA 29314 Name: STATE, dtype: int64

最后查看每個(gè)州的捐款總金額,我們會(huì)發(fā)現(xiàn)CA(加利福利亞)、NY(紐約)、FL(弗羅里達(dá))這幾個(gè)州的捐款是最多的,在捐款人數(shù)上也是在Top端,另一方面也凸顯出這些州的經(jīng)濟(jì)水平發(fā)達(dá)。
大家也可以通過數(shù)據(jù)查看下上面列舉的高端職業(yè)在各州的分布情況,進(jìn)行進(jìn)一步的分析探索。

4、數(shù)據(jù)可視化

首先導(dǎo)入相關(guān)Python庫

import matplotlib.pyplot as plt %matplotlib inline# 為了使matplotlib圖形能夠內(nèi)聯(lián)顯示 from wordcloud import WordCloud,ImageColorGenerator# 導(dǎo)入詞云庫

4.1 按州總捐款數(shù)和總捐款人數(shù)柱狀圖

# 各州總捐款數(shù)可視化 st_amt = c_itcont.groupby('STATE').sum().sort_values("TRANSACTION_AMT",ascending=False)[:10]#各州總捐款,逆序,取錢前10-得序列 st_amt=pd.DataFrame(st_amt, columns=['TRANSACTION_AMT'])#序列包裝成數(shù)據(jù)框----奇妙的橫坐標(biāo)標(biāo)簽?zāi)J(rèn) st_amt.plot(kind='bar') <AxesSubplot:xlabel='STATE'>

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-wRAxcXmd-1618065234556)(output_40_1.png)]

4.2 各州捐款總?cè)藬?shù)可視化

# 各州捐款總?cè)藬?shù)可視化,取前10個(gè)州的數(shù)據(jù) st_amt = c_itcont.groupby('STATE').size().sort_values(ascending=False).head(10) st_amt.plot(kind='bar') <AxesSubplot:xlabel='STATE'>

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-VT2J5kfZ-1618065234559)(output_42_1.png)]

4.3 熱門候選人拜登在各州的獲得的捐贈(zèng)占比

# 從所有數(shù)據(jù)中取出支持拜登的數(shù)據(jù) biden = c_itcont[c_itcont['CAND_NAME']=='BIDEN, JOSEPH R JR']#把選了拜登的記錄全單獨(dú)拎出來 # 統(tǒng)計(jì)各州對拜登的捐款總數(shù) biden_state = biden.groupby('STATE').sum().sort_values("TRANSACTION_AMT", ascending=False).head(10) # 餅圖可視化各州捐款數(shù)據(jù)占比 biden_state.plot.pie(figsize=(10, 10),autopct='%0.2f%%',subplots=True)#subplots=True不寫畫不出圖 array([<AxesSubplot:ylabel='TRANSACTION_AMT'>], dtype=object)

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-ZUXnGsek-1618065234564)(output_44_1.png)]

4.3 總捐最多的候選人捐贈(zèng)者詞云圖

通過數(shù)據(jù)分析中獲得捐贈(zèng)總額前三的候選人統(tǒng)計(jì)中可以看出拜登在2020.7.22-2020.8.20這期間獲得捐贈(zèng)的總額是最多的,所以我們以拜登為原模型,制作詞云圖。

# 首先下載圖片模型,這里提供的是已經(jīng)處理好的圖片,有興趣的選手可以自己寫代碼進(jìn)行圖片處理 # 處理結(jié)果:需要將人圖像和背景顏色分離,并純色填充,詞云才會(huì)只顯示在人圖像區(qū)域 # 拜登原圖:https://img.alicdn.com/tfs/TB1pUcwmZVl614jSZKPXXaGjpXa-689-390.jpg # 拜登處理后圖片:https://img.alicdn.com/tfs/TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg # 特朗普原圖:https://img.alicdn.com/tfs/TB1D0l4pBBh1e4jSZFhXXcC9VXa-298-169.jpg # 特朗普處理后圖片:https://img.alicdn.com/tfs/TB1BoowmZVl614jSZKPXXaGjpXa-298-169.jpg # 這里我們先下載處理后的圖片 !wget https://img.alicdn.com/tfs/TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg --2021-04-10 19:18:54-- https://img.alicdn.com/tfs/TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg Resolving img.alicdn.com (img.alicdn.com)... 120.77.195.15, 101.37.183.187 Connecting to img.alicdn.com (img.alicdn.com)|120.77.195.15|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 4236 (4.1K) [image/jpeg] Saving to: ‘TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg’100%[======================================>] 4,236 --.-K/s in 0s 2021-04-10 19:18:54 (24.1 MB/s) - ‘TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg’ saved [4236/4236]

?

# 由于下載圖片文件名過長,我們對文件名進(jìn)行重命名 import os os.rename('TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg', 'biden.jpg') # 如果有興趣,可以在上面下載原圖后進(jìn)行圖片處理 # 拜登原圖:https://img.alicdn.com/tfs/TB1pUcwmZVl614jSZKPXXaGjpXa-689-390.jpg # 拜登處理后圖片:https://img.alicdn.com/tfs/TB10Jx4pBBh1e4jSZFhXXcC9VXa-689-390.jpg ''' 你的圖片處理代碼 ''' '\n你的圖片處理代碼\n' # 在4.2 熱門候選人拜登在各州的獲得的捐贈(zèng)占比 中我們已經(jīng)取出了所有支持拜登的人的數(shù)據(jù),存在變量:biden中 # 將所有捐贈(zèng)者姓名連接成一個(gè)字符串 data = ' '.join(biden["NAME"].tolist()) # 讀取圖片文件 bg = plt.imread("biden.jpg") # 生成 wc = WordCloud(# FFFAE3background_color="white", # 設(shè)置背景為白色,默認(rèn)為黑色width=890, # 設(shè)置圖片的寬度height=600, # 設(shè)置圖片的高度mask=bg, # 畫布margin=10, # 設(shè)置圖片的邊緣max_font_size=100, # 顯示的最大的字體大小random_state=20, # 為每個(gè)單詞返回一個(gè)PIL顏色 ).generate_from_text(data) # 圖片背景 bg_color = ImageColorGenerator(bg) # 開始畫圖 plt.imshow(wc.recolor(color_func=bg_color)) # 為云圖去掉坐標(biāo)軸 plt.axis("off") # 畫云圖,顯示 # 保存云圖 wc.to_file("biden_wordcloud.png") <wordcloud.wordcloud.WordCloud at 0x7f742928ca58>

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-XuVStqlJ-1618065234568)(output_49_1.png)]

# 按州總捐款熱力地圖 ''' 參賽選手自由發(fā)揮、補(bǔ)充 第一個(gè)補(bǔ)充熱力地圖的參賽選手可以獲得天池杯子一個(gè) ''' from mpl_toolkits.mplot3d import axes3d#畫熱力圖時(shí),最好再導(dǎo)一次 import seaborn as sns %matplotlib notebook #未完待續(xù)

總結(jié)

以上是生活随笔為你收集整理的美国选民喜好#的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。