日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

AWS的EC2上构建一个爬虫

發布時間:2025/3/19 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 AWS的EC2上构建一个爬虫 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

第一章,創建一個EC2實例

首先需要注冊一個AWS的賬號,在賬號的服務中找到EC2。

可以看到我們的賬號里面目前是沒有實例的。點擊橘黃色按鈕【啟動實例】

第一步,選擇操作系統,本人選擇Amazon Linux。點擊【下一步】

但是這個并不重要,選擇什么操作系統都可以。只要你熟悉相應的操作系統就好。

第二步,選擇操作系統,本人選擇免費的那個,當然,這個配置也很低。土豪隨意。點擊【下一步】

第三四五步保持默認,全部點擊下一步。

到第六步。分配安全組,這里面只有我一個用戶,因此就選現有的安全組就好了。點擊【審核和啟動】。

第七步點擊啟動,會彈出對話框。

這里面如果之前沒有創建過,可以先創建一個。密鑰名稱按照自己的想法輸入一個就好了。然后把密鑰的文件保存好。

成功

第二章,與EC2實例通信

本地的系統與EC2通信是需要SSH的。如果是MAC系統那么可以直接通過命令行來搞就行了。如果是windows建議還是搞個工具,比如MobaXterm。

?

完成安裝后打開。

?

其中DNS如下圖所示。

在然后就會發現,咦,怎么連不上呢???????????

我們去看看安全組的規則,驗證是否有允許流量從您的計算機到端口 22 (SSH) 的規則。

點擊后面的【default

可以看到,這里面的來源需要更改一下,點擊編輯,可以根據自己的需求來設定。比如設置成【我的IP,那就會自動獲取你的IP,然后點擊保存。個人認為設置成【任何位置】也是可以的。

?

然后在去重新連接

第三章,環境部署

首先看一下實例的類型是32位還是64位,

1.安裝Miniconda。

由于本人的工程是python3完成的,因此,選擇如圖所以

將下載好的文件傳入EC2

執行

bash Miniconda3-latest-Linux-x86_64.sh

然后將conda添加到環境變量

export PATH=~/miniconda3/bin:$PATH

輸入

conda list 測試一下是否安裝成功,如果有正常的一堆輸出那就是安裝好了。

2.開始安裝python的相關的環境,此處環境就需要自己配置了,本人用到的幾個常用的包。

conda create -n scrapy python=3.7.5conda install scrapyconda install beautifulsoup4conda install lxmlconda install selenium


先安裝chrom。3.如果用到了webdriver的也要安裝webdriver。

wget https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpmsudo yum install google-chrome-stable_current_x86_64.rpmgoogle-chrome-stable -version

查看version,找到與之對應的webdriver

http://chromedriver.storage.googleapis.com/index.html


將driver也拷貝到ec2中,記得將driver與自己的爬蟲結合起來

4.將工程拷貝到虛擬機的目錄下面。運行就可以了。

?

總結

以上是生活随笔為你收集整理的AWS的EC2上构建一个爬虫的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。