java爬虫post404_请问 这个 文件怎么下载(Java爬虫),是 怎么验证的啊?在等。。...
這個是文件的詳情頁
http://guide.medlive.cn/guidelinesub/3695
這個 是 我 登陸后 下載某個文件,根據 下載鏈接 和 詳情頁、文件名 ? 對比 得出的 ?下載鏈接:
http://webres.medlive.cn/upload/temp/ea/2653764/c207077dfcdf0b72dc2fffd026c7a476/%E3%80%90%E5%8C%BB%E8%84%89%E9%80%9A%E3%80%912016%E5%B9%B4%E6%9B%B4%E6%96%B0%E7%89%88GOLD%2B%E6%85%A2%E6%80%A7%E9%98%BB%E5%A1%9E%E6%80%A7%E8%82%BA%E7%96%BE%E7%97%85%E8%AF%8A%E6%96%AD%E3%80%81%E6%B2%BB%E7%96%97%E5%92%8C%E9%A2%84%E9%98%B2%E7%9A%84%E5%85%A8%E7%90%83%E7%AD%96%E7%95%A5%E7%AE%80%E4%BB%8B.pdf
轉碼 后 :
http://webres.medlive.cn/upload/temp/ea/2653764/c207077dfcdf0b72dc2fffd026c7a476/【醫脈通】2016年更新版GOLD%2B慢性阻塞性肺疾病診斷、治療和預防的全球策略簡介.pdf
很奇怪,
在登錄的情況下 直接 下載文件 沒問題;
使用 程序(HttpClient3) 下載 失敗,把程序 內生成的地址 在瀏覽器 打開,返回 404,但是你等一會,再使用瀏覽器下載,又能下載了,不過 程序 還是不行。
程序 什么時候可以呢,在你 登陸的情況下,瀏覽器下載了一次文件,該文件 就能在程序得到 流了。。。
連接中 的?/temp/ea/2653764/ ? ?的 2653764好像 是 用戶id
怎么破,怎么能 爬蟲 下載下來呢?
總結
以上是生活随笔為你收集整理的java爬虫post404_请问 这个 文件怎么下载(Java爬虫),是 怎么验证的啊?在等。。...的全部內容,希望文章能夠幫你解決所遇到的問題。