日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取新浪财经个股的历史财报摘要

發布時間:2024/1/18 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取新浪财经个股的历史财报摘要 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

爬取新浪財經個股的歷史財報摘要

網頁的內容為:

想要的內容為:

  • pd.DataFrame數據結構
  • 方便查看數據和繪圖
  • print df.tail() print df.columns print df.index.namefig,(ax1,ax2)=plt.subplots(2,1) # fig.set_figheight(fig.get_figheight()*2) df.ix[:,(0,3)].plot(ax=ax1) df.ix[:,5:7].plot(ax=ax2) ax1.set_ylabel(u'(元)') ax2.set_ylabel(u'(百萬元)')每股凈資產 每股收益 每股現金含量 每股資本公積金 固定資產合計 流動資產合計 \ 南寧糖業(000911)項目:財務摘要 2015-09-30 4.9220 0.1225 -1.8303 4.4944 NaN 3147.74 2015-12-31 4.9146 0.1847 0.5290 4.4944 NaN 3032.40 2016-03-31 4.5619 -0.3527 -3.1519 4.4944 NaN 3868.23 2016-06-30 4.2956 -0.6190 -3.9426 4.4944 NaN 3522.59 2016-09-30 4.1173 -0.7973 -2.4654 4.4944 NaN 3194.63 資產總計 長期負債合計 主營業務收入 財務費用 凈利潤 南寧糖業(000911)項目:財務摘要 2015-09-30 4730.00 695.012 2208.240 104.7310 39.7108 2015-12-31 5669.74 732.949 3138.420 143.6370 59.8534 2016-03-31 6565.34 1105.460 515.594 39.3776 -114.2920 2016-06-30 6086.67 1033.750 920.286 90.8180 -200.6000 2016-09-30 6021.67 1055.570 1624.810 135.9120 -258.3930 Index([u'每股凈資產', u'每股收益', u'每股現金含量', u'每股資本公積金', u'固定資產合計', u'流動資產合計', u'資產總計',u'長期負債合計', u'主營業務收入', u'財務費用', u'凈利潤'],dtype='object') 南寧糖業(000911)項目:財務摘要 Out[403]: <matplotlib.text.Text at 0xdde1670>

    matplotlib繪圖:

    代碼:

    def get_gg_fin_abs(code='000911'):u'''Note------ xpath表達式: 'td[1]' 表示第一個td標簽, 其中的'[n]': 聲明第幾個標簽, 1-based- etree對象操作: html的上層文字的獲取: 用 .text屬性 比 .xpath('text()')[0]方法 簡明得多, 前提是: etree.element要具有text屬性- .find(_path) and .findall(_path) 方法也很好用, 他們分別返回一個etree._Element對象, 或者etree._Element對象的list- <tbody> tag in <table> is usually added by the browser, not actually in the html source. so you can not .find() or .xpath() it. Use it's parent tag which is <table> to work with.Ref------ Get all td content inside tr of tbody in python using lxml - Stack Overflow - http://stackoverflow.com/questions/37080910/get-all-td-content-inside-tbody-of-tr-in-python-using-lxml'''url = 'http://vip.stock.finance.sina.com.cn/corp/go.php/vFD_FinanceSummary/stockid/%s.html'url = url%(code)craw=crawler.Crawler(url)craw.idom()tr_path='//table[@id="FundHoldSharesTable"]//tr'trs = craw.dom.xpath(tr_path)print len(trs)# -------- 提取日期行的注意事項 ---------# etree.tostring()方法可以查看: html文本# print etree.tostring( trs[53].xpath('td')[1])# <td align="left" class="tdr"><strong>2015-09-30</strong></td>&#13;# 得知: 該文本是加粗的文本: 位于<strong>路徑下面: 所以:需要帶上/strong后綴# k_date = tr_nodes[53].xpath('td[1]/strong').text # v_date = tr_nodes[53].xpath('td[2]/strong').text#txt = 'text()'#txts = 'strong/text()'from collections import OrderedDict as Odictfdata= Odict()#for i,tr in enumerate(trs[53:65+20]):# //*[@id="FundHoldSharesTable"]/tbody/tr[1] : # paste this xpath from copy of Chrome F12 of 審查元素# # handle header: ------------------------------#header= trs[0].find('th').textheader=header.strip()# ------ handle body data -------for i,tr in enumerate(trs[1:]): # 從第2個tr的數據行開始if tr.xpath('td[@height="5px"]') != []: # empty row#print 'this is a empty row'continueif tr.find('td[1]').find('strong') is not None: # 截止日期行vdate = tr.find('td[2]/strong').text # 找到第二個td的文本dict2 = Odict() # 創建一個空的字典, for 本季度的財務摘要數據continueelse:k2= tr.find('td[1]').text #============================================================================== # # if tr.find('td[2]/a').text is not None: # 千萬不要帶屬性測試, 因為太貪婪 # if tr.find('td[2]/a') is not None: # v2= tr.find('td[2]/a').text # else: # v2= tr.find('td[2]').text #==============================================================================# 可以更簡明地編寫為:v2= tr.find('td[2]/a').text if tr.find('td[2]/a') is not None else \tr.find('td[2]').text dict2[k2]=v2# print i,k2,v2 # for debug purposeif k2==u'凈利潤': # 本季度的最后一行數據, 需要保存小字典到大字典fdata[vdate] = dict2continuedf=pd.DataFrame(fdata.values(), index=fdata.keys()) df.index.name=header#print df.head().ix[:,:2]#print df #//*[@id="FundHoldSharesTable"]/tbody/tr[870]def mapper_strdatetime10_2_datetime(s):u'''para------ s, str, '1998-12-31'return------ datetime.datetime(1998, 12, 31, 0, 0)'''y= int(s[0:4])m= int(s[5:7])d= int(s[8:10])return datetime(y,m,d)def mapper_html_table_td_2_float(td):if td.strip() is not u'':td = td.strip().replace(u'元','')td = float(td)else: td = np.nanreturn tddef mapper_html_table_td_with_comma_2_float(td):if td.strip() is not u'':td = td.strip().replace(u'元','')if td.find(',')>0:td = td.replace(',','')td = float(td)/1000000.0return tdtd = float(td)/1000000.0return tdelse: td = np.nanreturn tddf.index = map(mapper_strdatetime10_2_datetime, df.index)df.index.name = headerfor i in np.arange(4): #len(df.columns)):df.ix[:,i] = map(mapper_html_table_td_2_float, df.ix[:,i])for i in np.arange(4, len(df.columns)): #len(df.columns)):df.ix[:,i] = map(mapper_html_table_td_with_comma_2_float, df.ix[:,i])# df.ix[:, :2].plot()return df.sort_index()#============================================================================== # print df.tail() # print df.columns # print df.index.name # # fig,(ax1,ax2)=plt.subplots(2,1) # # fig.set_figheight(fig.get_figheight()*2) # df.ix[:,(0,3)].plot(ax=ax1) # df.ix[:,5:7].plot(ax=ax2) # ax1.set_ylabel(u'(元)') # ax2.set_ylabel(u'(百萬元)') #==============================================================================

    轉載于:https://www.cnblogs.com/duan-qs/p/6740525.html

    總結

    以上是生活随笔為你收集整理的爬取新浪财经个股的历史财报摘要的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 精品少妇人妻av一区二区 | av片在线观看网站 | 午夜在线免费观看视频 | 国产精品人成在线观看免费 | 男人的天堂2018 | 亚洲AV永久无码国产精品国产 | 日本亚洲欧美在线 | 中文字幕五区 | 西西人体44www大胆无码 | a级网站在线观看 | 精品久久久视频 | 午夜电影一区二区 | xxx日本少妇 | 91成人久久 | 少妇淫片 | 女上男下动态图 | 无码任你躁久久久久久老妇 | 亚洲av日韩av在线观看 | 亚洲免费成人网 | 性高潮久久久久久 | 国产精品久久久久久久久久久久久久久久久 | 日本黄动漫 | 欧美日韩在线观看一区 | 香蕉福利视频 | 视频一区二区在线 | 精品国产成人 | 久久亚洲一区二区 | 91精品视频免费在线观看 | 男女爱爱网站 | www插插插无码免费视频网站 | 亚洲色图17p | 日韩在线www | 亚洲大尺度视频 | 日免费视频| 欧美一区二区三区视频 | 久久女人网 | 国产精品激情 | 日韩精品观看 | 国产日韩欧美综合 | 亚洲精品污一区二区三区 | 日韩免费黄色 | 亚洲综合久久网 | 视频三区在线 | 日韩天堂一区 | 91精品国产91综合久久蜜臀 | 99免费在线| 免费无遮挡在线观看视频网站 | 影音先锋在线看片资源 | 一本大道久久a久久精二百 琪琪色在线视频 | 欲涩漫入口免费网站 | 一卡二卡国产 | 国产激情综合 | 日韩激情视频一区二区 | 人妻少妇被猛烈进入中文字幕 | 日本色一区 | 玖玖网 | 精品久久网| 久久久久久久久久久国产精品 | 亚洲天堂一区二区在线观看 | 一区二区福利电影 | 亚洲小视频 | 国产精品久久久久久亚洲伦 | 成人动漫av在线 | 亚洲欧美天堂网 | 欧美八区| 香蕉视频性 | 久久96| 琪琪色av | 第四色男人天堂 | 日本久久综合网 | 国产裸体美女永久免费无遮挡 | 国产有码视频 | 人人搞人人 | 日韩少妇激情 | 久草网址 | 伦理久久 | 日本理伦片午夜理伦片 | 一本色道久久综合 | 自拍偷拍免费 | 精品一区二区三区欧美 | 欧美黑人啪啪 | 三级网站 | 精品少妇无码av无码专区 | 中文字幕久久久久 | 毛片com| 插吧插吧综合网 | 蜜臀少妇久久久久久久高潮 | 男人都懂的网站 | 操日本老妇 | 色碰视频| 精久久久久 | 成年人在线网站 | 青青草原成人网 | 少妇久久久久久被弄高潮 | 桃色视频网 | 亚洲第99页| 国产精品99久久久久久宅男 | 日本免费在线观看视频 | 午夜精品免费 |