DeepSeek全面指南:95%的人都不知道的9個技巧(建議收藏)

👉 這是一個或許對你有用的社群
🐱 一對一交流/面試小冊/簡歷最佳化/求職解惑,歡迎加入芋道快速開發平臺知識星球。下面是星球提供的部分資料:
👉這是一個或許對你有用的開源專案
國產 Star 破 10w+ 的開源專案,前端包括管理後臺 + 微信小程式,後端支援單體和微服務架構。
功能涵蓋 RBAC 許可權、SaaS 多租戶、資料許可權、商城、支付、工作流、大屏報表、微信公眾號、ERPCRMAI 大模型等等功能:
  • Boot 多模組架構:https://gitee.com/zhijiantianya/ruoyi-vue-pro
  • Cloud 微服務架構:https://gitee.com/zhijiantianya/yudao-cloud
  • 影片教程:https://doc.iocoder.cn
【國內首批】支援 JDK 17/21 + SpringBoot 3.3、JDK 8/11 + Spring Boot 2.7 雙版本 
DeepSeek yyds!
芋道 24 年 7 月份,就完成了 DeepSeek 的接入:從 V1 => V2 => V3 => R1,真能感受到蛻變!
大家可以嘗試下,我們 Java 開發者,也是可以玩轉大模型的。
開源專案地址:https://github.com/stars/YunaiV/lists/yudao
最近,DeepSeek這款AI工具爆火國內外。
雖然許多人都開始嘗試使用它,但有人吐槽說,沒想象中那麼牛。
其實問題不在工具,很多人的使用姿勢就搞錯了,用大炮打蚊子,白白浪費DeepSeek的強大功能。
接下來,我將為大家分享9個實用技巧,你會發現DeepSeek遠比想象中更強大。

DeepSeek的三種模式

DeepSeek有三大適用模式:基礎模型(V3)、深度思考(R1)、聯網搜尋。
1. 基礎模型(V3)
圖片
基礎模型(V3)是DeepSeek的標配,沒有勾選預設就是基礎模型。V3版自去年12月升級後,效能大幅提升,堪比業內頂尖模型如GPT-4、Claude-3.5等。
它的作用相當簡單,回答日常的百科類問題,幫助使用者快速獲取資訊。
不管是查詢常見知識、處理簡單的文字生成任務,V3都能迅速給出答案。它的優點就是高效、便捷,幾乎沒有什麼門檻,適用於大部分場景。
尤其是在使用者並不要求複雜推理、深度分析的情況下,V3就顯得尤為合適。比如你只想問一個簡單的問題,或者需要一個快速的解答,V3足夠應付。簡單、直接,是它的最大特點。
2. 深度思考(R1)
R1作為DeepSeek的深度推理模型,專門用來解決那些需要複雜推理和深度思考的問題。它處理的任務更具挑戰性,比如數理邏輯推理、程式設計程式碼分析等。
R1模型有660B的引數,並採用了後訓練+RL強化學習方法,擅長從多個角度分析問題,並給出經過嚴密推理後的解答。
R1決定是一位專家,能夠為你提供精確、深刻的推理和分析。因此,如果你的問題涉及到複雜的推理,R1便是不二的選擇。
3. 聯網搜尋
聯網搜尋模式是DeepSeek的AI搜尋功能,基於RAG(檢索增強生成),這一模式讓DeepSeek不僅能依賴它自己的知識庫,還能根據網際網路即時搜尋相關內容來回答問題。
換句話說,聯網搜尋不僅讓模型能夠回答2024年7月以後的問題,還可以利用網路上的最新資訊來補充自己的回答。

如何對標其他模型?

DeepSeek的三個核心模式,能夠與chatGPT對標,為我們提供更清晰的選擇。
1. V3對標GPT-4o
DeepSeek的V3模型堪比GPT-4o,二者的設計理念和應用場景非常相似。V3採用了Moe架構,擁有671B的引數量,能夠在百科知識領域提供快速響應。
2. R1對標o1
R1是DeepSeek的深度推理模型,和OpenAI的o1模型非常類似。二者都在處理推理、深度思考以及複雜邏輯問題時,展現出了非凡的能力。
R1採用了660B的引數,並且在強化學習和後訓練方面表現出色。R1更擅長邏輯推理和複雜問題的解答,在這一點上,R1已經超越了o1模型。

知識庫的更新時間

目前,DeepSeek的預訓練資料已經更新到2024年7月。
但對於之後的新聞或技術動態,DeepSeek的聯網搜尋模式就顯得尤為重要,它能夠根據網路即時獲取最新資訊,彌補知識庫的空白。

告別提示詞

很多AI熟手可能會囤一堆提示詞模板,但是,DeepSeek 完全不用準備提示詞,只要簡單明瞭地描述你的需求,DeepSeek 就能理解並給出精準的答案。
舉個例子,如果你想讓 DeepSeek 幫你寫一段蛇年拜年祝福語,直接告訴它這個需求,它就能立刻生成多個風格的版本。
圖片
與DeepSeek的對話,儘量使用簡單、直白的語言。越是接地氣的表達,DeepSeek就越能發揮其最大潛力。
避免過於正式、結構化的表述,簡單、直白、帶點口語化的語言往往能夠獲得最自然、流暢的答案。
DeepSeek的理解能力非常強,不需要過多的引導,給它一個清晰的問題,它就能提供精準的答覆。

“小學生”溝通技巧

與DeepSeek對話時,有時我們可能覺得AI的回答過於抽象。
這其實源於傳統AI模型過於注重結構化表達,結果都是“八股文”的回答,我們可以藉助DeepSeek的“小學生”溝通技巧。
可以給它一個提示:“我是一名小學生,請用小學生能聽懂的話解釋什麼是大模型。”
圖片

透過持續追問,獲取詳細答案

運用持續追問的技巧,能夠幫你快速搞清楚一個複雜問題,大致步驟如下:
  1. \1. 提出一個概括性的問題
  2. \2. 基於回答內容進行深入追問
  3. \3. 繼續挖掘具體細節
  4. \4. 將對話資訊整理成清單格式
例如,我先問DeepSeek:“如何寫好提示詞?”
圖片
對於如何提供上下文,我還是不明白,我可以繼續追問DeepSeek。
圖片
最後我讓DeepSeek把對話整理成詳細的清單格式。
圖片

活用聯網搜尋

聯網搜尋是DeepSeek的一大亮點,它讓模型在回答時不僅僅依賴預訓練資料,還能即時從網路上檢索最新的資訊。
你可以問到2024年7月以後發生的事件,或者某些新興技術領域的問題,DeepSeek都能透過聯網搜尋為你提供更準確、及時的回答。
例如,你問DeepSeek:“2025年春晚有哪些節目?”它可以在網路上找到最相關的資料,並結合大語言模型的能力生成確的回答。
但是,最近DeepSeek受國外網路攻擊,聯網搜尋暫不可用了,尷尬~
圖片

上傳附件功能

除了聯網搜尋,DeepSeek還支援上傳附件功能,這為使用者提供了更多個性化的體驗。
透過上傳附件,你可以將自己的私密資料、知識庫、甚至是一些需要深度推理的材料直接交給DeepSeek,讓它基於這些專有的檔案進行分析和推理。
圖片
上傳附件最多支援50個檔案,每個檔案最大100MB,資料量較大的檔案,DeepSeek也能處理自如。

R1的三個開放特性

對於深度思考(R1)模型,DeepSeek做到了三個重要的開放特性,讓R1不僅僅是一個“黑盒”模型,它的思維過程、訓練技術和模型引數都是透明開放的。
1. 思維鏈全開放
R1的思維鏈是完全開放的,使用者可以看到模型進行推理時的每一步邏輯。
這不僅是一個回答,而是一個完整的思考過程。透過這種方式,使用者能獲得最終答案,還能夠理解AI是如何得出這個結論的。
圖片
2. 訓練技術全部公開
DeepSeek採用了RL(強化學習)技術,透過極少的標註資料提高了推理能力。
所有的訓練技術,包括模型的後訓練過程和資料增強方法,都是公開的。
這讓廣大網友都能深入理解模型的訓練過程,並且可以根據需要進行調整和最佳化。
3. 開源模型
DeepSeek還將R1的部分模型進行開源。雖然R1模型本身的引數高達660B,通常只有大公司才能使用,但DeepSeek也為社群提供了更小的開源模型,讓更多的開發者和研究者可以使用。
最小的模型只有1.5B引數,適合個人開發者進行實驗和開發。
這格局太頂了,幫助全球的開發者共同推動AI的發展。
以上9個技巧,希望能幫助你更好地使用DeepSeek。歡迎大家在評論區分享你的使用技巧,一起探討、學習。

歡迎加入我的知識星球,全面提升技術能力。
👉 加入方式,長按”或“掃描”下方二維碼噢
星球的內容包括:專案實戰、面試招聘、原始碼解析、學習路線。
文章有幫助的話,在看,轉發吧。
謝謝支援喲 (*^__^*)

相關文章