DeepSeek究竟達到什麼樣的智慧水平呢?

職業數學家在民間

歡迎掃碼關注風雲老師的影片號,《風雲薦書》欄目完全已經搬到影片號商品櫥窗了,公眾號已經沒有薦書欄目和薦書文章了!
下個月將安排一場非常重磅的直播,敬請掃碼預約!!!
一,
DeepSeek這兩天非常非常火,很多人都在使用,也有不少人非常看好,甚至有人開始宣稱這是國運級別的科技成果。

那麼,DeepSeek究竟達到什麼樣的智慧水平呢?

驗證一款人工智慧模型最有效的辦法就是測試它的數學推理水平,也就是數學證明的能力,這方面,我是很有發言權的,兩年前GPT-4.0橫空出世,轟動全球的時候,我就設定了七道數學證明關卡測試它的數學證明水平,發現它的數學證明水平還非常一般,屬於非常初級的階段。測試文章連結:我為ChatGPT4.0設定了七道數學證明關卡,猜猜它會闖過第幾關??
今天,我也打算用同樣的方式測試DeepSeek的水平,在介紹這七道數學證明關卡前,先要簡單介紹一下素數的概念。素數是指大於1,且不能分解成兩個更小的正整數乘積的正整數。例如:2,3,5,7,11,13,17,19,23,29 和 31 都是素數。但是 4,6,8,15,21和 24就不是素數,因為,4=2×2;6=2×3;8=2×4;15=3×5;21=3×7;24=3×8。
二,

好了。我們的第一個關卡是

第1關,證明存在無限多個素數!
這大概是數學中最有名的證明的,用的是反證法,證明過程很簡單,甚至連不少數學愛好者都會證明。所以我想這個應該不會難到DeepSeek。
第2關,4n+3型素數是指被4除餘數為3的素數,比如7,11,19,23。證明存在無限多個4n+3型素數!

這個證明和第一個證明的方法幾乎是一樣的,但需要一點點更靈活的運用,所以這個證明也會難一些。

第3關,4n+1型素數是指被4除餘數為1的素數,比如5,13,17,29。證明存在無限多個4n+1型素數!
和第一個第二個證明一樣,這第三個證明也是用反證法,構造矛盾的方式也有些類似,但是更復雜,需要用到二次剩餘理論。所以這第三個證明的難度已經明顯加大了。
第4關,令k是一個大於2的整數。證明存在無限多個kn+1型素數!
和前三個證明相比,這第四個證明的難度又明顯加大了。因為這個結論比較一般,而且還要用到分圓多項式的構造及其性質。這個漂亮的證明最早出現在E. Wendt, 1895年發表在 J. Reine Angew. Math. 上的論文中,在華羅庚的《數論導引》中也有這個證明。
第5關,令k是一個大於2的整數。證明存在無限多個kn-1型素數!
這第五個證明和第四個證明難度大致相當,不過還是會難一些,因為涉及到了比分圓多項式更復雜的一類多項式的構造及其性質。這是第二個證明結論的推廣。關於這第五個證明,可以參考T. Nagell的《Introduction to Number Theory》或者我本人釋出在美國數學月刊的文章《Infinitely Many Primes in the Arithmetic Progression kn − 1》
第6關,令a和b是兩個互素的正整數,證明在等差數列{an+b}中存在無限多個素數!
這就是大名鼎鼎的Dirichlet定理,這個定理的標準證明需要用到解析數論中的Dirichlet函式。Dirichlet定理是前面五個證明結論的推廣,所以運用Dirichlet定理就可以直接推匯出前五個結論。
第7關,n^2+1型素數是指能寫成平方數加1的形式的素數,比如5=2^2+1,17=4^2+137=6^2+1都是n^2+1型素數。證明存在無限多個n^2+1型素數
這是數論中一個非常困難的猜想,目前的人類數學水平根本無法撼動,如果現有的最新人工智慧模型能證明這個猜想,那整個數學界將被徹底顛覆。

三,、

DeepSeek能闖過第幾關呢???
讓我們拭目以待!!
至此,第一關,順利透過!
至此,第二關,順利透過!!
第三關DeepSeek通關失敗了!
注意兩年前GPT4也是敗在第三關,也是和DeepSeek一樣試圖照搬第二個證明,到後面無法自圓其說了。
前面說過,這個證明是不能照搬前面的證明的,需要用到二次剩餘理論,當年GPT4的整個證明過程中都沒提及二次剩餘理論,而DeepSeek一開始就講了二次剩餘理論,還給出了相關的預備知識,但是後面的證明居然不懂得使用這些預備知識,還是和GPT4一樣照搬第二個證明。
不過,當我點選DeepSeek左下的深度思考之後,再問這個問題,DeepSeek經過深度思考之後,居然給出了正確的證明,順利透過第三關!

第四關,哪怕是經過漫長的深度思考,DeepSeek還是通關失敗了!給出了一個有明顯漏洞的錯誤證明:
這個證明其實需要用到分圓多項式,在漫長的深度思考中,DeepSeek也多次提到了分圓多項式,但是最終的證明卻沒用到分圓多項式。我讓DeepSeek自己指出證明中的錯誤,令人驚訝的是,它居然能細緻檢查每一步,然後真的找出證明的錯誤之處,就是整除結論的不當使用!最後DeepSeek還給出了一個修正的證明,就是直接運用狄利克雷定理推導。

接下來,我讓

DeepSeek

給出一個不依賴於

狄利克雷定理,令我震驚的是,DeepSeek真的給出了一個正確的證明,不過它自己也指出,這個證明僅僅適用於k為素數的情況

接下來,我要求它給出一般情況的證明,經過深度思考後,DeepSeek真的給出了正確的證明梗概:
但這個證明只是一個梗概,裡面分圓多項式的性質還需要詳細說明,但是多次提問之後,我發現DeepSeek根本無法嚴謹說明這些性質,所以,我認為這裡已經觸及DeepSeek數學證明水平的天花板了!
也就是說,這第四道關卡,正是DeepSeek目前數學證明水平的天花板!!
總之,相比較兩年前的GPT4,DeepSeek的數學證明水平確實有了實質性的提升,尤其令我讚歎的是,DeepSeek的深度思考過程都可以展示出來,透過觀察DeepSeek的深度思考過程,我感覺確實有一定的數學證明推導思考能力,但是面對有專業門檻的數學證明還是顯得非常吃力,它的數學證明水平還是處在比較初級的階段。
另外,GPT4是國外兩年前就公佈的人工智慧模型,國外目前最新的人工智慧模型到底達到什麼水平,真是非常令人好奇!
也許不少成年讀者離開學校已經多年,對數學已經非常陌生了,所以看不懂這篇文章中的數學內容,不過任何時候都可以重新開始學數學,有這個打算的成年讀者我推薦下面兩本書自學數學,其中《中小學數學要義》是講初等數學體系,《數學學習沒有捷徑》是講學習方法。讀過這兩本書就可以自學高等數學了,《數學學習沒有捷徑》中專門有一章內容講高等數學自學指南
最後,給大家拜年,祝大家新年快樂!

相關文章