deepseek震撼登場,中國AI顛覆全球算力市場!

春節期間最大的新聞莫過於中國出了一款“逆天”的軟體:深度求索(deepseek)。

這款軟體是我目前見到的最牛的人工智慧軟體,沒有之一。

這個軟體出來後,我立刻就進行了試驗,我首先試驗的就是利用它來寫時政類的文章——就我自己感受來說,那肯定是不可能達到我要求的,但是我完全可以把它作為參考。
簡單的說就是:它不能完全滿足我的需求,但是對我來說具有極大的參考意義。
大家千萬不要小看“參考”的價值,你做任何原創性的東西都要參考各種資料——就像大學論文一樣,你怎麼可能完全不參考別人的?
試驗完時政文後,我想到有很多同學都是小學初中的老師,以前和他們聊天的時候總聽他們說累,備課累、出試題累,然後我就嘗試了下:讓deepseek備課和出試題。
結果讓我震驚了,只要幾分鐘時間就能原創一套試卷,就能完成備課:
然後,我就把這個軟體的功能發給4個小學老師,他們也都被震驚了,甚至有人發出“擔憂”:有了它,還要老師做什麼?
這只是這個軟體的“縮影”之一,我相信還有很多職業都完全可以在deepseek的幫助下,要麼工作量大幅度降低、要麼會直接導致一些職業的消失。
我相信很多人也都在網路上看到這個軟體的眾多“逆天”功能了,但也有一些人根本不知道這個軟體(我發給4個老師的時候,他們還都不知道這個軟體),所以雖有“狗尾續貂”的嫌疑,我還是想再寫點東西,儘量用最容易懂的例子讓大家知道這個軟體。
這個軟體出來後,在極短的時間內就在140多個國家移動應用下載量排行榜上位居榜首。
試問:如果這個軟體沒有逆天的功能,怎麼能在如此短的時間內佔據眾多國家下載量的榜首的?
由於其功能逆天,6天內讓英偉達的股價從142美元跌到116美元,跌幅近20%,市值直接跌掉5500億美元(約4萬億人民幣)——等於兩個貴州茅臺的市值。
為什麼deepseek的出現會讓全球市值排名第二的英偉達市值暴跌呢?
英偉達(NVIDIA)的核心業務之一是透過其硬體和軟體技術為全球提供高效能的算力支援,尤其是在人工智慧(AI)、圖形渲染、科學計算等領域。英偉達GPU佔據全球AI算力市場約80%份額(2023年資料)。
算力有多重要呢?
舉個簡單的例子:算盤計算器都可以用來計算,但是它們的算力是完全不一樣的。普通人拿著算盤肯定是算不過拿著計算器的,尤其是那種超級大資料的計算。
英偉達晶片的算力非常強大。比如,英偉達的A100、H100等資料中心級GPU,單卡可提供每秒數千萬億次。
說到這,肯定有人會問:英偉達晶片的算力可以達到數千萬億次,有什麼東西需要這麼大的算力嗎?
我們絕大多數人都是普通人,當然用不到如此龐大的算力。但是,很多領域需要用到的算力是異常龐大的,龐大到你無法想象的地步。
我以前在油田工作,我就見識過油田在勘探領域需要用到超級計算機——在涉及地震勘探資料處理的時候,處理一次偏移,一個高算力的工作站需要計算幾周,甚至幾個月的時間。
很多人不知道,在以前,除了油田,絕大多數領域的資料處理量都沒有那麼高,所以超級計算機都是首先用於油田的。

比如,1983年中國進口的第一臺超級計算機就是由美國克雷公司(Cray)生產製造的Cray-1超級計算機(運算速度每秒1億次,當時全球頂尖水平)。進口它的最重要的作用之一就是

為了提升在石油勘探等領域的資料處理能力。

我們再舉個簡單的例子:微信圖片。
中國微信使用者數量非常龐大,有10億使用者,每天每時每刻都要處理大量的文字和圖片,1TB的文字需要的計算量就達到10的12次方,千億級別;而百萬圖片的計算量更是達到10的15次方,等於100兆。

微信每秒鐘都有成千上萬的圖片需要傳送,如果這些圖片裡面有黃色圖片,你說微信能在

毫秒級別

的時間內識別出它們並禁止傳送嗎?你說這個算力需要多麼強大?

你在微信發黃圖的時候,絕大多數時候都能成功發出(慎發,犯法),原因可能就是微信不具備那麼強大的算力。
另外,在自動駕駛領域,L4級自動駕駛需在10毫秒內處理8個攝像頭、5個雷達、1個雷射雷達的TB級資料流,算力需求超過500 TOPS(處理器每秒鐘可進行500萬億次操作)。

……

所以,你別看一些晶片的算力非常強大,但在很多時候,它們的這點算力根本是不夠用的——單個晶片的算力不夠,那麼就需要購買無數的晶片組合起來提高算力。
很多公司需要非常龐大的算力,而單個晶片的算力是有限的,所以就需要購買很多英偉達的晶片。
比如,GPT-4等大模型的訓練需要數萬張GPU平行計算數月,單次訓練能耗相當於數百家庭一年的用電量。神經網路引數量從百萬級(早期模型)增長到萬億級(如GPT-4),算力需求每3-4個月翻倍(遠超摩爾定律)。

所以,你別看很多晶片的算力很強大,但在很多領域,這些算力壓根就不夠看的。

算力固然重要,但是演算法有時也很重要。
同樣的一個計算題,採取不同的演算法,需要的算力和時間可能差異非常大。
舉個簡單的例子:1+2+3+4……+99=?
這時就有兩種演算法:
一種就是按順序相加1+2=3,3+3=6,6+4=10……4851+99=4950;還有一種就是(1+99)×49+50=4950。
很明顯,後面的一種演算法需要的算力和時間是非常小的。

deepseek做了一件什麼事呢?

對的,就是演算法的最佳化。
deepseek用很小的算力就能達到別人需要很大算力才能得到的正確答案。

這會導致什麼後果?

原本你需要用兩個計算器才能在規定的時間內計算出正確的結果,但是經過演算法最佳化後,你只需要一個計算器就可以完成了。

雖然英偉達的GPU晶片的算力非常大,但在很多應用背景下,這個算力還是不足的,所以你需要購買很多晶片。但是,透過演算法最佳化後,原本需要100塊英偉達晶片才能完成的任務,現在只需要50塊就能完成了,這樣一來你就可以少買50塊的晶片。
市場對英偉達晶片的需求下降了,英偉達的利潤是不是就少了?股價是不是就下跌了?
除此以外,以前用“算盤”是計算不過來的,但是透過演算法最佳化後,用“算盤”也可以算了,你說美國禁止將“計算器”賣給中國,我們就能被它阻礙前進的步伐了嗎?
deepseek最重要的貢獻之一就是:我們不需要高階晶片也能達到同樣的目標,這讓美國對我們的“禁售”失去意義。

中國出現一款deepseek這樣強大的智慧軟體,你說美國人會幹啥?

對的,很無恥,美國說

deepseek

抄襲、偷盜美國公司的技術,並對deepseek進行制裁。另外,網路上的一些殖人、跪族和“二鬼子”也對deepseek進行各種抹黑……

在這樣的背景下,deepseek做出一個非常舉動:開源。

開源是什麼意思呢?

我們舉個“餃子的配方”,大家就容易懂了。

比如,你家是開餐館的,你有一個祖傳的餃子配方,做出來的餃子非常好吃,但是這個配方被你鎖在保險櫃裡,除了你自己,誰也不知道你這個餃子是如何做出來的。這就叫做“閉源”。

什麼叫“開源”呢?

我把餃子的配方直接公佈出來,所有人都可以按照這個配方來調製餃子皮、菜肉餡、水燒到多少度下餃子、蘸料如何製作……所有的東西全部公開。

deepseek開源以後,所有人都知道“餃子”的配方了——你說我的“餃子”配方是抄襲你、偷盜你的,我把配方都公開出來了,抄沒抄、偷沒偷,是不是一眼就能看出來了?
我的“餃子”就是比你的好吃,我的“餃子配方”就是和你不一樣。
deepseek開源以後對美國的一些企業有什麼打擊呢?
你有一個祖傳的餃子配方,做出來的餃子很好吃,別人家的餃子就是不如你家的好吃,你自然可以賣貴點。但是,我的餃子比你更好吃,而且我把配方公佈出來了,所有餃子店都可以做出比你家更好吃的餃子,你憑什麼還賣那麼貴?
所以,deepseek開源後對美國的一些企業會形成重大打擊。比如,OpenAI採取閉源商業模型,另外還有Anthropic、WS/Azure、Hugging Face等。
以前你要花很多錢才能吃到他家的“餃子”,現在你只要花很少的錢就能自己包出更好吃的餃子。
說到這,肯定有人會發出一個疑問:deepseek把“配方”都公佈出去了,自己豈不是吃虧了?如果deepseek不公佈配方,自己賣“餃子”豈不是能賺很多錢?deepseek為什麼要公佈配方?難道只是為了爭一口氣?
我們也不知道deepseek的高層到底是如何考慮的,但是原因無非三種:
第一,deepseek高層的格局非常大;
好吃的餃子很貴,我們公佈配方後,大家都可以用極低的價格吃到好吃的餃子,這是造福全人類的事情。
第二,我可以損失點,但讓你遭受更大損失才是目的;
根據新聞,deepseek的模型訓練成本僅約558萬美元,僅為GPT-4o的二十分之一。我公開配方後損失很小,但是你的損失就大了。自損100傷敵2000,在中美“敵對”的背景下,這是一件划算的買賣!
第三,免費的往往並不便宜。
依舊以上面的“餃子配方”為例。

deepseek把自己的配方公佈出來後,肯定有很多大廚開始使用這個配方,所有人都使用這個配方,那麼就會有很多的創新——每個國家,甚至不同地區的人口味可能都不盡相同,他們就會在你家配方的基礎上進行創新,最終會形成適合各個國家、地區特有的風味。這會讓deepseek更加的強大。

除此以外,deepseek之所以開源肯定有它的過人之處,有別人做不到的地方,它可以依靠那些方面賺錢。雖然配方公開了,但是高筋麵粉只有我家能生產——我不賣餃子了,但是我可以賣高筋麵粉啊。
還有,我公佈餃子配方以後,大家都能看到這個餃子是怎麼做出來的,你是不是就不擔心裡面有各種對人體有害的新增劑了——你使用美國的閉源軟體,你怎麼知道它沒有安裝“後門”偷窺你的隱私?
試想,如果你僅僅賣比別人更好吃的餃子,這固然能賺到很多錢。但是,如果全世界的餃子都用你的高筋麵粉,你說哪種賺得更多?
有時,免費是為了讓你更多的消費。
第四,deepseek公開的並不是最先進的模型。
我有理由懷疑deepseek有更先進的模型沒有開源,開源的只是次級版本——我有兩種餃子配方,公開的那個很好吃,但更好吃的那個配方我還沒有公開。
deepseek開源的目的到底是哪種呢?
我相信,不同的人或許有不同的傾向,但我認為這四種可能都是原因。
不管deepseek的真實目的是什麼,都值得我們為之驕傲,因為它是中國人開發的智慧軟體。

我相信,要不了多久,那些白皮能做的,我們也都能做到,而且做得比它們更好!

油,deepseek!加油,中國人!
—–全文到此為止。如果您想看到更多的原創文章,請點選下面的公眾號名片,關注即可。


相關文章