Flash数据的采集方法-搜房房价走势采集
一般來說flash中的數(shù)據(jù)是不能被現(xiàn)有技術(shù)很容易采集到的,但是也不能談flash色變,要具體問題具體分析,有些flash是可以通過一些分析發(fā)現(xiàn)背后的數(shù)據(jù)。然后采集就變得很容易了。
?
具體案例:搜房房?jī)r(jià)走勢(shì)采集。
先看看房?jī)r(jià)走勢(shì)頁(yè)面:
?
http://baolishangcheng.soufun.com/house/2810932360/fangjia.htm
可以看出,這是個(gè)flash的,還有很多鼠標(biāo)移動(dòng)上去顯示的數(shù)據(jù)。
右鍵點(diǎn)擊,發(fā)現(xiàn)確實(shí)是flash,然后查看源碼,發(fā)現(xiàn)如下信息:
<iframe src="http://pinggus.soufun.com/Estimate/process/makeflashchart.aspx?dis=3&city=%C9%EE%DB%DA&height=218" width="680" height="218" marginwidth="0" marginheight="0" frameborder="0" scrolling="no"></iframe>
?
原來flash是放在iframe中的,好的,打開改iframe對(duì)應(yīng)的網(wǎng)頁(yè)
http://pinggus.soufun.com/Estimate/process/makeflashchart.aspx?dis=3&city=%C9%EE%DB%DA&height=218
?
別激動(dòng),沒看到數(shù)據(jù),還是flash,再查看源碼,發(fā)現(xiàn)一堆腳本:
| swfobject.embedSWF("http://img.soufun.com/secondhouse/image/pinggu/js/open-flash-chart.swf", "mychart", "100%", "218", "9.0.0", "expressInstall.swf", {"data-file":"makechartdata.aspx%3fdis%3d3%26newcode%3d1010035274%26city%3d%25c9%25ee%25db%25da%26district%3d%26commerce%3d%26isprojname%3d"},{allowScriptAccess:'always',wmode:'transparent'} | |
| ? | );? ? |
玄機(jī)就在這里,仔細(xì)觀察該腳本,發(fā)現(xiàn)其使用了一個(gè)叫做open-flash-chart的flash,經(jīng)過google,是個(gè)開源的,打開其官網(wǎng),發(fā)現(xiàn)關(guān)于它如何使用的文檔:
http://teethgrinder.co.uk/open-flash-chart/
再結(jié)合上面的源碼,發(fā)現(xiàn)最關(guān)鍵的地方,數(shù)據(jù)是由:data-file指定的:
"data-file":"makechartdata.aspx%3fdis%3d3%26newcode%3d1010035274%26city%3d%25c9%25ee%25db%25da%26district%3d%26commerce%3d%26isprojname%3d"
在經(jīng)過一些基本常識(shí)即可發(fā)現(xiàn)這是一個(gè)url,手工對(duì)其解碼,得到如下url:
makechartdata.aspx?dis=3&newcode=1010035274&city=%25c9%25ee%25db%25da&district=&commerce=&isprojname=
加上url前半部分,得到完整url:
http://pinggus.soufun.com/Estimate/process/makechartdata.aspx?dis=3&newcode=1010035274&city=%25c9%25ee%25db%25da&district=&commerce=&isprojname=
打開,看到什么了,是不是眼睛被亮瞎了:
這就是你要的數(shù)據(jù),好了,今天就到這里,謝謝大家關(guān)注。
總結(jié)
以上是生活随笔為你收集整理的Flash数据的采集方法-搜房房价走势采集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 承兑汇票是什么意思
- 下一篇: Oracle osw监控工具的使用示例