DeepSeek 不太稳定?那就搭建自己的 DeepSeek 服务
概述
DeepSeek-R1 發(fā)布
DeepSeek 在 2025 年給我們送來一份驚喜,1 月 20 號正式發(fā)布第一代推理大模型 DeepSeek-R1。這個模型在數(shù)學(xué)推理、代碼生成和復(fù)雜問題解決等核心能力上和 OpenAI 的最新 o1 模型相當(dāng),相當(dāng)驚喜。
推理模型和指令模型有什么區(qū)別
在 DeepSeek 和 OpenAI 的 o1 模型之前,我們使用的大部分都指令模型(Instruct Model),比如 OpenAI 的 GPT-4o、豆包、智譜清言、DeepSeek V3 等,這一類是用來遵循指令生成內(nèi)容或執(zhí)行任務(wù)的,所以我們在使用這些模型時需要學(xué)習(xí)如何使用指令讓模型更好的理解我們的意圖。
DeepSeek R1 屬于推理模型(Reasoning Model),專注于邏輯推理、問題解決的模型,可以自主的處理需要多步驟分析、因果推斷或復(fù)雜決策任務(wù),所以相比較于之前的指令模型,我們并不需要學(xué)習(xí)指令或者角色扮演,只需要說出你的需求就行了。
OpenAI 的 o1 也是推理模型,只不過需要每個月花 20 美刀成為 plus 會員才能夠使用,并且每周只有 50 次的使用權(quán)限。而截止目前 DeepSeek R1 的推理模型是免費(fèi)的,沒有次數(shù)的限制,堪稱完美。
實際體驗
接下來我們實際體驗一下,問一些簡單的問題
這些回答都挺好,且有可落地的執(zhí)行方案,但是,多問幾次,就“服務(wù)器繁忙,請稍后再試”
哪怕是我重試多少次,都是服務(wù)器繁忙,請稍后再試,真是難受想哭,最終我們還是需要另辟蹊徑,要么本地部署,要么部署在三方云服務(wù)中。
本地部署的話,全量版本太大了,哪怕是你有 4090 顯卡也吃不消,蒸餾的版本和全量版差異太大了(下一篇會講述如何在本地部署蒸餾版),所以我們這次先講如何部署在三方云服務(wù)中
部署自己的 DeepSeek R1 模型
注冊在線賬號
這次我們使用華為云和硅基流動聯(lián)合推出的在線 DeepSeek R1 模型,注冊送 2000 萬 Token,能用挺長時間了
新建 API 密鑰
登錄注冊后,新建 API 密鑰,如下圖所示:
填寫 API 密鑰到 Chat 客戶端
有了密鑰之后,我們只需要有一個 Chat 的客戶端,這里我們選用:chatbox 客戶端,下載完成之后,只需要在設(shè)置中填入上一步驟的 API 密鑰, 選擇模型提供方,選擇模型,點擊保存即可。
接下來就可以體驗了
公眾號【老王以為】,分享學(xué)習(xí),認(rèn)知,人工智能,技術(shù)等相關(guān)知識,歡迎掃碼關(guān)注我的公眾號。
總結(jié)
以上是生活随笔為你收集整理的DeepSeek 不太稳定?那就搭建自己的 DeepSeek 服务的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用 JS 关闭警告框及监听自定义事件(
- 下一篇: Dotfuscator混淆时的配置信息