日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

用Python批量下载MOOC资源

發(fā)布時(shí)間:2023/12/10 python 60 豆豆
生活随笔 收集整理的這篇文章主要介紹了 用Python批量下载MOOC资源 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

用Python批量下載MOOC資源

簡(jiǎn)介

這是我編寫的一個(gè)Python腳本,用來批量下載一門MOOC的資源,包括視頻、PDF和課程目錄。

你是否也曾上MOOC學(xué)習(xí)過?有沒有和我一樣遇到這些情況:

  • 在線看MOOC視頻消耗流量好多,或者瀏覽器僅支持的2倍速也無法滿足你飛速的頭腦,所以想要去免費(fèi)網(wǎng)絡(luò)處集中全部下載到電腦里
  • 老師的課件好精美,想要保存到本地,可以隨時(shí)快速查閱
  • 純粹是有收集癖,想把學(xué)習(xí)過的東西都保存到本地
  • 那么,這個(gè)python腳本可能會(huì)幫到你,下面我來詳細(xì)介紹它的使用方法

    使用步驟

    第一步 運(yùn)行腳本

  • (推薦)如果你的計(jì)算機(jī)是Windows系統(tǒng),那么我已經(jīng)為你將py文件變成了一個(gè)exe文件,就是mooc_dload.exe,直接運(yùn)行它即可;
  • 如果你的電腦上已經(jīng)有一個(gè)Python的IDE,或者其他可以運(yùn)行Python腳本的軟件,你也可以將mooc_dload.py放在一個(gè)單獨(dú)的文件夾下通過IDE運(yùn)行。
  • 第二步 輸入MOOC課程編號(hào)

    運(yùn)行后會(huì)彈出一個(gè)黑色的窗口,提示我們輸入課程編號(hào),課程就是你想要下載的MOOC課程,在網(wǎng)頁中打開該課程后,瀏覽器的URL此時(shí)為:https://www.icourse163.org/course/BIT-1001870001 (以《Python網(wǎng)絡(luò)爬蟲與信息提取》這門課為例)它的課程編號(hào)就是BIT-1001870001,我們直接在黑色的窗口中輸入這個(gè)編號(hào)后回車。

    窗口會(huì)不斷更新給出已經(jīng)下載的課程目錄,耐心等待全部下載完成。

    第三步 查看下載結(jié)果

    回到我們最初放置mooc_dload文件的目錄,此時(shí)我們可以看到,文件夾中出現(xiàn)了幾個(gè)新的文件,分別是PDFs、Links.txt、TOC.txt和Rename.bat,下面是它們各自的說明:


    第四步 下載視頻

    你可能發(fā)現(xiàn)腳本并沒有直接下載視頻,而是下載了視頻的下載鏈接。因?yàn)槲铱紤]到直接下載視頻的話會(huì)使腳本運(yùn)行時(shí)間過長(zhǎng),一旦中間不小心關(guān)閉窗口或者因?yàn)榫W(wǎng)絡(luò)不穩(wěn)定等原因使腳本終止,就只能刪掉下載好的部分視頻重新來過;對(duì)于有的MOOC包含的視頻實(shí)在太長(zhǎng)太多,我們可能會(huì)想要分批下載保存;另外,腳本默認(rèn)的下載方式往往不是最快的,我們可以用鏈接+下載器的方式更好實(shí)現(xiàn)我們的下載。

    這里我以迅雷為例

    打開Links.txt,復(fù)制全部?jī)?nèi)容;打開迅雷軟件-新增下載任務(wù),迅雷會(huì)自動(dòng)填入剪貼板中的鏈接,選擇好下載目錄開始下載。(最好新建一個(gè)專門的文件夾集中存放視頻)

    最終下載好的視頻文件是原始名字,一般都是一串看不懂的字符,為了方便找到我們要看的視頻,我們將Rename.bat拷貝到視頻文件的目錄下,雙擊運(yùn)行,所有視頻的名字就被改正過來了。

    寫在最后

  • 到此,MOOC資料就成功保存在本地了,可以隨時(shí)隨地用任意倍速觀看了,這里推薦一個(gè)很好用的播放器:PotPlayer。
  • 我測(cè)試的時(shí)候是下載《Python網(wǎng)絡(luò)爬蟲與信息提取》、后來又測(cè)試《C語言程序設(shè)計(jì)》、《Python機(jī)器學(xué)習(xí)應(yīng)用》也是OK的,但是后來我發(fā)現(xiàn),現(xiàn)在MOOC上的一部分課程后臺(tái)做了修改,這些課程故意隱藏了鏈接,導(dǎo)致我們通過爬蟲無法獲取到視頻的鏈接了,所以對(duì)于這部分課程目前這個(gè)腳本只能獲取除了視頻以外的資源,我相信應(yīng)該是可以通過改進(jìn)代碼獲取到的,但是我目前的水平有限,期待你來補(bǔ)充改進(jìn),把他做完美。
  • 編寫源碼的過程中借鑒了網(wǎng)上的一些代碼,由于太雜,過程中沒有留心記錄,所以這里也沒有辦法標(biāo)明參考目錄,如果有原作看到自己的部分希望聯(lián)系我:comajor@buaa.edu.cn,我會(huì)在文檔中標(biāo)注出處。
  • 源碼已經(jīng)開源在我的Github:https://github.com/comajor/mooc_dload
  • 僅作為學(xué)習(xí)交流,請(qǐng)不要用于商業(yè)用途。
  • 希望這篇文檔能對(duì)你有幫助,比心 ??
  • 總結(jié)

    以上是生活随笔為你收集整理的用Python批量下载MOOC资源的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。