DeepSeek的橫空出世,震動全世界,也讓我們去重新去思考創新的模式和路徑。
DeepSeek憑什麼逆襲,挑戰Open AI的霸主地位?
DeepSeek 採用了獨特的創新策略:
在產品上沒有拘泥於行業慣常操作,堅持AGI底層創新,想法設法突圍。
對員工看能力,而不是看經驗;
沒有KPI考核,沒有任務;
讓每個人有自由發揮的空間和試錯的機會,儘可能少的干預和管理。
比起科技大廠層層設計的嚴密組織架構和目標運營,為什麼這樣的模式反而能夠激發創新?
《為什麼偉大不能被計劃》的作者肯尼斯·斯坦利寫到:
“正是在這片位於已知和未知之間的‘蠻荒’邊界地帶,我們應該讓人類最偉大的頭腦進行探索,而不是在最大共識的舒適區‘沉迷享樂’。”
“非目標搜尋的更重要啟示是,它是一位實力強大的尋寶者。
在漫無目標的新奇性搜尋中,你不一定能找到心中想要的寶藏,反而可能發現許多意料之外的寶藏,這將使整個過程充滿驚喜。”
以下是OpenAI前研究員,人工智慧科學家肯尼斯·斯坦利 2023年 7 月的授課內容,重新發布。
我的研究領域是開放性(open-endedness)機器學習。
我們都知道,大多數機器學習演算法,往往預設了一個最佳化目標,達成目標很重要。
它讓機器具有無限的潛力和持續的創造力,可以在沒有明確目標或終止條件的情況下不斷演化和產生新的結果。
舉兩個現實世界中我們能體會的例子,它們非常具有啟發性。
從地球上的第一個單細胞開始,它不斷分化並創造,經歷數億年甚至十多億年,創造出了人類等等生物,進化的腳步永遠不會停止。
人類出現後,你會看到思想和文明的迸發,這個過程是宏大的,不可思議的。
從火種和車輪一直演變到現在的計算機、空間站,文明不斷演化,一直持續到今天。
不斷再造周圍世界的能力,是人類智力的重要組成部分。
我們都是開放性進化的產物,而人類作為產物本身又創造了文明。
我們研究人工智慧的時候,發現了一個人類根本性缺陷。
即“單一的目標導向思維會阻礙創造力和創新”,這對社會而言是一個極其嚴重的問題。
不僅是機器演算法,你會發現人類所做的一切,幾乎都是以目標為導向的。
但目標在我們處理重大事項時,有時反倒是無用的,無法幫我們實現創新。
舉個例子,10多年前我在大學任教時,建立了一個網站Picbreeder。
用一張圖片作為母圖片,可以 " 生出 " 與之類似的許多子圖片。
如果你準備在Picbreeder繁衍圖片,可以先自選一張圖片,這張選中的圖片就是下一代圖片的父母。
你可以轉身去忙別的事兒,Picbreeder不需要任何指令就會繼續繁衍,到最後,出現的圖片可能是一隻蝴蝶,一個頭骨,甚至是木星。
我需要向各位解釋一個非常重要的機制,它被稱為分支(branching)。
如果使用者確實繁衍出一些有趣的東西,並且透過網站儲存這一影像,相當於把影像公開發布。
那麼其他人就可以把這張圖片為起點進行分支演化,也就是用這張圖去繁衍,獲得新圖片。
就像一棵生命樹,這些生命之樹末端的葉子就代表著新的發現,而這些都是以一種看似偶然的方式被發現的。
大家可以看下面這張幻燈片上的圖片,為什麼會繁衍出現這些圖片?
有些人認為,想最終得到一隻熱帶鳥的圖片,只要選擇看起來最像熱帶鳥的斑點,透過繁衍就可以得到想要的結果。
如果你想用Picbreeder生成一張熱帶鳥的圖片,肯定會失敗,這就是以目標為導向的思維方式。
能讓我們繁衍出鳥類圖片的東西,往往看起來並不像鳥。
一些人按照自己的想法去繁衍圖片,最終的結果令他們感到沮喪。
那麼,如果將它們作為目標來搜尋無法成功的話,怎樣做才能成功呢?
首先有一個非常重要的前提,我最初的想法並不是繁衍出一輛車。
當時,我只是看到了是一張像E.T.一樣的外星人臉,覺得繁衍這張圖片一定很有趣,可以得到更多的外星人面孔。
神奇的事情發生了,透過分支出來的圖片,外星人的眼睛開始向下移動,這時我意識到外星人的眼睛正逐漸變成輪子,可能會演化出一輛汽車。
首先,必須有人去完成我永遠不會做的事(比如繁衍出一張外星人圖片,供我選擇);
Picbreeder資料庫記錄了每一張圖片的繁衍過程,記錄了每一張熱門圖片背後的“踏腳石”,我們能夠確切地知道每張圖片是怎麼來的。
Picbreeder網站上的大多數熱門圖片,都有著完全相同的繁衍路徑。
這其中蘊含著一個非常奇怪的寓意,你只有不帶目的的尋找才能實現目的。
這與我們的直覺相違背,也與我們對現實生活的認知相悖。
如果這條理論成立,人們就不能透過對目標的尋找來發現任何東西。
實際上,這條理論並不僅僅存在於Picbreeder之中,整個現實世界都是這樣運作的,所有的複雜空間都有這個性質,這是一個非常重要的發現。
如果我沒有透過外星人的臉發現那輛車,我就永遠不可能意識到這一點,也不可能創造出後來的演算法,也永遠不會寫《為什麼偉大不能被計劃》這本書。
當然,這也是一個可以用來理解“開放性”的例子,因為你永遠不會知道,你走出的每一步會帶來什麼結果。
例如,這張圖片中的蝴蝶和頭骨是由隨機斑點演化而來,各進行了74次、和90次迭代。
但在另一個實驗中,我們把生成這些圖片當作目標,讓15個孩子透過自主選擇來生成這些影像,最後經歷了3萬次演化才得到了目標影像。
我個人認為,這表明人類在人工智慧或機器學習領域的許多基準文化可能已落入歧途。
演算法的強大力量,並不在於當你真正建立一個目標時,它們做事情的能力;
而在於,當你沒有設定目標的時候,它們做事情的能力。
如果你的目標是生成一張蝴蝶、頭骨照片,這個目標會導致你忽略了這些踏腳石,事實上你更應該關注這些踏腳石,我稱之為目標悖論。
目標悖論的含義是,即擁有一個目標,會妨礙你實現目標。
這裡需要澄清一點,目標悖論並不是要你沒有目標,而是說當你沒有目標的時候,更有可能實現創新。
目標只會在簡單的、非欺騙性空間裡生效,解答容易的問題,有一個適度的目標並沒有錯。
當你放棄目標的時候,你可能會做成偉大的事情,但是你不會提前知道這件事情是什麼。
這個世界上,不可能有人在完成一件驚人的事情的同時又有一個目標。
這不僅是Picbreeder的運作結構,也是現實世界的運作結構。
人類總是在適度的目標中成功完成任務,相信並由此推斷這一思維模式對一切都有成效,這是根本錯誤的。
覺得每件事兒都會圍繞目標運作,這是人類文化中產生的一種誤解。
在發現這一理論的時候,我還在研究計算機科學或者人工智慧,對這個發現的興趣完全是在演算法範圍內的。
我和同事喬爾·雷曼在思考,也許我們可以發明一種新的演算法,讓它以非常反直覺的方式工作,不設立任何目標。
我們想訓練一個兩足行走機器人走路,想法是機器人走得越遠越能獲得獎勵。
傳統機器學習觀念認為,必須一小段一小段地走,機器才能學會走路。
我們的訓練理念是讓機器人做一些與此前不同的事情,想法越新奇越好。
這種探索未必是正確的,但只要機器人採用了一種新方法,就能獲得獎勵。
最後實驗證明,新訓練理念的最好結果要遠遠優於傳統版本,這種違反人類直覺的結果令人震驚。
新奇式搜尋演算法催生出了一個新的領域,高質量多樣性演算法。
透過把有趣與高質量目標結合,找到多樣性選項中的最佳結果。
在一個非目標導向的世界裡,人類的本能之一就是想要追隨有趣的事物,因為有趣可以驅動進一步探索。
簡單來理解,要想實現最高目標,必須先願意放棄目標。
只有當我們沒有真正想著這些目標時,或者當別人沒有遵循你所謂的正確的道路以及符合你的利益時,才可能實現目標。
如果人們只做自己認為正確的事,就會忽略掉那些真正能幫你解決問題的“踏腳石”,忽略這些能夠奠定偉大基礎的東西。
就好比,發現一張外星人的面孔,為繁衍出汽車圖片奠定了基礎。
從目標悖論的角度來看,合作可以導致趨同和共識,但是也將消除通向偉大事物的“踏腳石”。
當一群人一起進入一個房間,大家想要達成某種共識,想要找到某種正確的道路——
這樣的搜尋過程沒有目標,只是憑直覺在荒野中漫步,去發現有趣的事物。
有人會認為我在讚美隨機性,並非如此,這一過程還是遵循一定原則的。
舉個例子,人們在Picbreeder上選擇圖片不是出於隨機,而是出於一定的喜好,而你的喜好一定不是隨機的,而是由你的生活經歷決定的。
比如Picbreeder和新奇式搜尋,進化和文明可以看作是一個發散尋寶的過程,它們也沒有最終目標,這才是現實世界的運作方式。
舉個例子,Picbreeder的強大之處在於它執行的時間越長就會出現越多有趣的影像,這意味著我們可以找到更多有趣的事物。
這就是踏腳石,這些圖片不僅可以用來解決具體問題,還能不斷髮散、不斷繁衍,最終繁衍出一個具有很高價值的寶藏。
我想透過《為什麼偉大不能被計劃》這本書,引起整個社會對這一問題的關注和討論。
目標給我們規定了每一步,指引我們每一次行動,這種想法無處不在。
如果人類所做的每一步都是根據生活中的某個目標來進行的、評估的,從出生到退休,那這段時光太令人窒息了。
IT技術的進步符合這種目標導向思維,人類制定效能指標,評估其表現,認為一切事物都必須向前發展。
但如果我們只獎勵目標上的東西,就永遠不會發現有趣的技術。
這種方式會讓一些人不安,但對另一些人而言卻是解放性的。
世界上所有的創新,都是因為人類有對有趣事物產生興趣的本能,它不是隨機的,而是基於人生經驗的。
我們應該傾聽並討論有趣的事情,即使討論的一部分是主觀性的。
需要再次強調的是,目標導向思維,在某種程度上是成立的,比如那種最有抱負的目標,比如你想變得富有。
20世紀40年代產生的ENIAC是第一臺計算機,這臺計算機是怎麼產生的?
在第一臺計算機出現之前,人們已經研究真空管150多年了。
有趣的是,如果人們直接對計算機感興趣而不去研究真空管,人類就不會有真空管和計算機。
研究真空管的人並未將發明計算機當做目標,這再次體現了目標悖論。
二十世紀七八十年代出現了電唱機,盒式磁帶、音箱和各種盒式磁帶播放器,之後是隨身聽、CD隨身聽和iPod。
iPod是蘋果公司釋出的一種革命性的音樂播放器,但蘋果的目標不是作出最好的音樂播放器。
iPod成了一塊通往iphone的踏腳石,最終那個引領性的產品是一部手機。
避免掉入目標悖論,超越狹隘的目標侷限,這一能力對創新來說至關重要。
從我目前的經驗來看,考慮到目標悖論、目標神話以及新奇性搜尋演算法,我會給大家六點建議。
超越的眼光十分重要,我們要超越眼前的路,而不僅僅只關注是否能走得更遠。
世界是具有欺騙性的,驚喜在等待著你,會發生的可能不會發生,而不會發生可能就會發生。
即使看起來是在做正確的事情,結果也會是錯誤的,或者看起來是錯的結果卻是對的。
可能所有人都會覺得你錯了,但事實卻會證明你所專注的事情恰恰是十分正確的。
人們喜歡設定標準,因為它們可以提供安全保障,這是一種評估形式。
我們應該相信有趣的事情,換句話說,你需要相信自己的主觀判斷,憑藉你自己的人生經驗。
每當有任何抓眼球的事物出現時,人人都會隨波逐流,但恰恰是那些不起眼的事物才值得我們率先關注,因為它們可能會創造巨大的價值。
第六,不起眼的事物可能帶領人們去到全新的領域,即使當下我們未能察覺。
追求有趣的事物,並不能保證你一定會做出驚人的成就,你只是有取得成功的可能。
這雖然不會給你帶來偉大的成績,但也能夠讓你取得相對不錯的結果,這只是個人的選擇而已。
無論是否以這種方式成為真正的先驅,這兩種選擇都是完全可接受的。