html 时光网播放视频,mtime时光网电影资料库采集规则
經過分析發現,時光網的這個篩選結果頁面html中,是用
在篩選結果頁面通過抓去HTML代碼發現電影URL的常規方法在這里不管用,當然篩選結果頁的翻頁也不管用,因此需要用抓包工具把篩選結果的內部列表頁URL找出來。如下:http://service.channel.mtime.com/service/search.mcs?Ajax_CallBack=true&Ajax_CallBackType=Mtime.Channel.Pages.SearchService&Ajax_CallBackMethod=SearchMovieByCategory&Ajax_CrossDomain=1&Ajax_RequestUrl=http%3A%2F%2Fmovie.mtime.com%2Fmovie%2Fsearch%2Fsection%2F%3Ftype%3D201%23pageIndex%32%26year%3D2011%26type%3D201&t=201210271753315856&Ajax_CallBackArgument0=&Ajax_CallBackArgument1=0&Ajax_CallBackArgument2=138&Ajax_CallBackArgument3=&Ajax_CallBackArgument4=0&Ajax_CallBackArgument5=0&Ajax_CallBackArgument6=0&Ajax_CallBackArgument7=0&Ajax_CallBackArgument8=&Ajax_CallBackArgument9=&Ajax_CallBackArgument10=&Ajax_CallBackArgument11=0&Ajax_CallBackArgument12=0&Ajax_CallBackArgument13=0&Ajax_CallBackArgument14=1&Ajax_CallBackArgument15=0&Ajax_CallBackArgument16=1&Ajax_CallBackArgument17=4&Ajax_CallBackArgument18=10&Ajax_CallBackArgument19=0
注意以上url中加紅加粗的參數:
Ajax_CallBackArgument2=國家/地區ID
Ajax_CallBackArgument3=類型ID
Ajax_CallBackArgument9=年代ID,如果不過濾就為空
Ajax_CallBackArgument10=年代ID,如果不過濾就為空 (你沒看錯,10和9都是指年代,一樣的id)
Ajax_CallBackArgument18=頁碼,
用火車頭的批量/多頁模式添加采集地址,Ajax_CallBackArgument18=(*),如下圖:
在“采集網址規則”時,選擇手動:
最后注意控制下采集網址的線程和頻率,在你采集了幾十個列表后,mtime時光網會讓你輸入驗證碼,很煩,目前我沒想到用什么方法來避免這個驗證碼。
總結
以上是生活随笔為你收集整理的html 时光网播放视频,mtime时光网电影资料库采集规则的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在Java中实现SFTP协议文件传输的两
- 下一篇: 分治法求全排列