↓ 進入公眾號點選右上角“…”設置星標 ↓
防止內容走丟
【導讀】在人類文明的長河中,知識生產始終是推動社會進步的核心動力。從遠古的結繩記事到印刷術的普及,再到數字技術的崛起,每一次資訊工具的革新都深刻重塑了知識的形態與傳播方式。近年來,生成式人工智慧的爆發式發展,正將我們帶入一個前所未有的轉折點——機器不僅輔助人類從事勞動和生產知識,更開始獨立生成內容,甚至挑戰人類在認知領域的壟斷地位:AlphaFold-3精準預測蛋白質結構,ChatGPT撰寫論文、翻譯語言……這似乎已超出以往人類所使用的“工具”的定義。
這一變革背後,是知識本質的悄然異化:當資訊量以天文級數膨脹,知識的“質”逐漸被“量”稀釋,人類與知識的緊密關聯正被機器智慧解構。從宗教王權時代的封閉體系,到理性實驗時代的科學求真,再到如今資訊智慧時代的扁平化與黑箱化,知識生境的演化既帶來高效與便利,也埋下了失控的隱患:人類可能從知識的主人淪為機器的附庸。當長篇大論的觀點可以一鍵生成、繭房效應扭曲公共討論、黑箱決策架空人類判斷時,我們可能正在親手締造一個“被動認知”的時代,成為技術洪流中的旁觀者。本文透過梳理知識生境的三大歷史階段,揭示AI化未來的潛在危機,呼籲重拾“以人為本”的倫理底線,在技術狂飆中守護文明的根基。
本文原載《文化縱橫》2025年第2期,原題為《知識生產:從圖書館走向機器智慧》,僅代表作者觀點,供讀者參考。
知識生產:從圖書館走向機器智慧
生成式人工智慧來了,帶著它日益增長的智力。如今,它每天都在替學生和學者寫論文,代記者發新聞稿,一口氣翻譯50種文字不在話下。它會根據語言生成影像影片,製作逼真的人機對話。它還可以在十幾秒內解答2024年高考數學試卷,可得滿分。谷歌的蛋白質預測模型(AlphaFold-3),一種人工智慧(AI)演算法,能準確預測蛋白質的三維結構,同它的發明者一道,獲得了諾貝爾化學獎。AI儼然已是一流的知識生產者。這讓我們不禁好奇:未來的知識生產會是什麼樣子?人類的智力勞動及其產出會被如何安置?這件事關乎人類的命運,卻前景不明,如同籠罩在濃霧中,也許應該從頭梳理一遍。
人類為了生存繁衍,需要認識自己生活的世界,對自然界與人類社會做不懈的探索、理解和改造。知識生產便是回應這種需求的努力。認識世界的一切努力都始於感知資訊,在處理加工資訊中得到理解的昇華,生成知識,用於維持並改善生活和生產實踐。由此形成一個知識生產和再生產的生態環境,簡稱“生境”,這是人類文明大生態中的一環。
知識生產圍繞資訊展開。資訊,是宇宙萬物存在和運動的自然展示,呈現為有待處理的符號資料。它瀰漫在時空中,無所不在、從不間斷、沒有對錯,不依賴人的意志,獨立於人的認知。因而它沒有“質”,只有“量”。知識,則是資訊經過人類的感知、分析、檢驗、評判、規律性總結等,一系列認知處理加工後的狀態,是人類對客觀世界和它與自身關係的發現、理解、掌握和利用。也就是說,知識是一種特殊資訊,它以人為出發點,依附於人,一貫被歸屬於人的範疇。顯然,知識比資訊的範圍狹窄得多。兩者有重合,而重合面的大小、重合如何發生,何時發生,在何處發生,都同人類的認知思維活動息息相關。因此,知識是有“質”的,可檢驗真偽、評判對錯、獲取信任而運用於實踐。知識有“質”也有“量”。我們的認知需要透過不斷學習、訓練、使用,來最佳化加強,爭取對世界做真實準確的描述和理解,包括對已有知識的修正補充和深化。這就是求真,知識生產的真諦。
因此,知識生產可以看作是資訊向知識轉化的能動過程。它總是由某種驅動力推進,如好奇心、生存繁衍的需求等,是在前人知識積累的基礎上做出的創造發明和社會化的智力活動。
古人很早就注意到一個現象:人的先天資訊處理能力不強,無論是感知、記憶,還是資訊加工和傳遞。人雖然自命為“萬物的靈長”,感官卻遠不如許多動物得力,如老鷹的視覺、狗的嗅覺、狼的聽覺、昆蟲的色感、大象的動感等等。相比之下,我們從客觀世界採集到的資訊非常有限。例如,人類視網膜上只有感受紅、綠、藍三種波長的感光細胞,色素分辨能力粗糙。我們看到的五彩繽紛的世界,其實是大自然的豐富色調的高度簡化版。又如,我們的視覺和聽覺穿透力極低,只在很小的時空範圍有效,資訊的接收傳遞,須面對面或近距離才能實現;一張荷葉,就能擋住我們的視線。正是為了克服感官的侷限,人類才發明了各種資訊工具,全方位地延伸並強化自身的資訊處理能力,包括感知、採集、整理、儲存和傳遞。資訊科技的創新、更替和迭代,貫穿了知識生產的全部歷史,推動著生產力和生產關係的一次次變革。
古人還發現,知識生產如果處於無組織的自生自滅的狀態,就很難判斷知識的對錯和水平的高低,傳播也會受阻,深化更是困難,還常常走樣失傳,造成極大的浪費。所以人們在知識生產中加入了管理元素,建立起一整套流程、機構和規範。就功能和目標而言,知識管理系統對知識生產的走向有很強的指導作用,在不同歷史階段,遵循不同的原則和標準。但萬變不離其宗,總是被強勢的社會力量掌握,受主流意識形態影響,包括與之匹配的道德倫理和宗教信仰。知識生產的全過程便是在這樣一個框架內活動,人文的、科技的莫不如此。
據此,我把知識生產的歷史大致分為三個階段:宗教/王權時代、理性/實驗時代和資訊/智慧時代。這個歷史分期,與資訊科技的三次革命性突破基本同步,即語言文字/書寫工具的發明,紙張/印刷術的普及,以及數字技術/機器智慧的顛覆性崛起。這樣,人類知識生產的生態,追隨自然條件下生態系統發育的一般趨勢,由幼稚走向成熟。它的結構和成分由簡單到多元複雜,對資訊的利用由不充分到相對充分,其改造世界的能力逐步提升,最後進入成熟期。成熟期的知識生產本應表現出相對穩定的保守特徵;然而一種新型資訊科技闖了進來:生成式人工智慧。今天,AI技術異常活躍,正在摧毀舊生態的復原力(resilence),以機器智慧為中心的新生境正在形成。下面,我們將圍繞知識生境的四大基本元素展開討論:資料工具、參與者、工作程式和傳承記憶。
▍知識生產的宗教/王權時代
這是一個漫長的歷史時期。一開始,人類認識世界,積累知識的步伐是艱難而緩慢的,資訊工具相對原始粗糙。未知世界的不可控,災難面前自身能力的渺小,催生了人對神明的畏懼和崇拜。王權以宗教信仰統領的形象佔據社會的統治地位,掌握政治、經濟和知識生產的命脈。自然而然,宗教王權就成了人類對自身和周圍世界的觀察、認識、改造的出發點和歸宿。同時,這人類的童年時代又是偉大而無與倫比的。它發明了第一代資訊工具:文字和初級書寫工具;醞釀運作了知識生產和管理系統的雛形和模式,如亞歷山大城的繆斯神殿/圖書館和中國古代的官方修史制度。這些都被後人繼承了,沿用至今。
文字的發明,書寫工具的製造,極大地豐富了人類的感知、表達和思維能力。從結繩記事、甲骨占卜,到青銅銘文、簡帛、紙草和羊皮紙書卷;從石刀、石筆到毛筆、羽毛筆;資訊工具和載體由簡到繁,由笨拙到輕便。這些發明不論完善與否,都是里程碑式的。人類走上了藉助工具來表達、交流、記錄思想感情和經驗知識的道路,由此開始了從口述傳統向書寫傳統的劃時代轉型,給知識的系統管理、跨時空傳遞,帶來無盡的發展空間。這個管理系統對知識生產的參與者和管理機構有嚴格要求。知識的記錄和文獻整理,往往由有聲望的學者擔任;文獻經過專業評價,入選圖書館收藏,一部分還進入學校教育,成為經典和公共記憶。
被納入圖書館和教育系統的知識,可以獲得很高的社會認可和禮遇,即有可能參與到官方與民間的知識傳承和再生產中去,乃至引導知識生產的走向。這類管理系統通常由國王貴族和官府出資建立,學者則往往尋求王公貴族庇護和資助。而知識的收藏、評價和使用,一如其生產,必須遵從宗教教義和王權的規制。否則就得不到許可和承認,被排斥在正統知識之外,歸於異端謬說。一個典型的例子,“地心說”是教會支援的,因而獲得知識的地位和絕對權威。任何質疑,包括“日心說”,都是褻瀆神明。又如,疾病被認為是人觸罪而受神的懲罰,故而研究人體構造例如解剖屍體,也是對神明不敬,須立法禁止(參見拙文《心智的聖所》)。因此,宗教/王權時代的知識生產,是一個維護等級秩序的封閉式的內迴圈生境。
這個時代的知識生產,還處於生態發育的初級階段。人類對世界的認識和知識積累有限,能夠運用文字記錄整理知識的人才很少;資訊工具較為簡單,且使用不普及;而尚未利用的資訊資源急需開發,知識生產的潛在活動空間大,環境相對寬鬆。精英化的生產者與知識的關係,主要由業內共識跟社會聲譽來維繫,而非直接的產權關係。他們因自己的聰明才智和發明創造受到尊敬,獲得榮譽。哲人或智者的生活方式,甚至連國王都羨慕。史載埃及王拯救者托勒密一世(前305~282在位)主動退位,讓兒子繼位,以便致力於寫作《亞歷山大大帝傳》,加入輝煌的亞歷山大城圖書館作者的行列,為賢明君主的偉大一生留下一曲天鵝之歌的結尾!
▍知識生產的理性/實驗時代
這是一個承上啟下的時代,全球知識生產進入一個高速發展的階段。伴隨著歐洲文藝復興、啟蒙思想、工業革命和殖民擴張,人類迎來了現代科學的紀元。同時,象徵資本主義崛起的“理性之光”,衝破宗教的“愚昧”和“黑暗”,讓知識生產擺脫了教會同王權的束縛。教育和學術開始崇尚思想自由和獨立思考,推崇科學實驗和理性邏輯(包括形式邏輯、辯證邏輯和數理邏輯),要求知識經得起社會實踐的檢驗;“求真”成了知識生產的基本準則。隨之而來,知識生產對資訊科技的需求和依賴與日俱增。其中,最具標誌性的事件是活字印刷術的發明和機器造紙術的完善:繼北宋畢昇發明活字印刷,15世紀,古騰堡研製成功了西文活字印刷術,使規模化的書籍印刷成為可能;之後,18世紀末開始,機器造紙術逐步完善。
於是,印刷取代傳統的手抄製作,成為記錄知識的主要手段,功效大大提升。從藏書的增長可見一斑。14世紀的英國大詩人喬叟只擁有60來本藏書。到了17世紀,約翰·哈佛,一位二十九歲劍橋大學畢業生捐出的收藏,就達400多本。進入20世紀,大型圖書館的藏書動輒以百萬千萬冊計,甚至上億。實驗科學的興起,啟蒙運動的激盪,得益於新的資訊工具同系統管理有機結合,知識生產展示出前所未有的活力。於是,傳統的“地心說”經受不起近代科學的檢驗,在“日心說”的挑戰下失去了知識的地位。伽利略、牛頓、達爾文、門捷列夫等等,這些科學巨人奠定了近代科學。人類對世界的認識空前地拓展了,哈佛大學前天文臺臺長曾感嘆:我們在地球上發現的那些數學和物理原理,用來觀察解釋宇宙中的眾多現象,居然都適用,多麼奇妙!公立學校的發達,受教育人口大增,帶來了知識生產的興隆。到目前為止,我們擁有的大部分知識都是這個時代的產出或衍生品,包括人工智慧在內。
“知識就是力量”。這也意味著知識的財產和權利屬性,在資本主義時代的覺醒。1709年,英國頒佈了全世界第一部版權法《安娜法令》(The Statute of Anne)。商品經濟催生了知識的商品化、產權化;而一旦知識壟斷可以享有法律保護,全球市場的開拓和新老殖民主義國家間的競爭,就成了知識生產和知識壟斷的又一個驅動力——就誕生了智慧財產權(版權、專利、商標等等)。
回顧這一段歷史,有助於我們看清楚資訊科技和工具的作用和潛力。新發明創造層出不窮,如打字機,錄音錄影、影印機;程式語言、計算機,硬碟、軟盤;直到智慧手機,物聯網、大資料、區塊鏈、雲端儲存,生成式人工智慧;等等,高潮迭起。資訊科技同科學理念和方法的結合,為知識生產提供了沃土,但也使得理性/實驗時代的輝煌遠比它的前任來得短暫。知識生態發育走過了艱難的幼年期,在它的青春期,資訊的多重價值極大地刺激了人們發明生產工具和改造環境的意願和實踐,生產關係變得日益複雜。舊時代漸漸遠去,全新的資訊/智慧時代召喚著人類。
▍知識生產的資訊/智慧時代
今天,人類的知識生產已經開始進入成熟期。我們正處在歷史的轉折點上,面臨一個前所未有的難題:誰來生產知識,人還是機器?這會有什麼後果?
20世紀80年代,網際網路興起。很快,社交軟體成了人們日常交流的平臺,數字技術開始主導生活和工作的方方面面。網路平臺以其便利和高效的服務,交換我們的個人資訊。在相繼解決了資訊的感知、記錄、整理、儲存、傳遞等一系列難題之後,大腦的認知思維順理成章地成了人類知識生產能力的最後堡壘。
數字技術的一大功績,是實現了知識生產的一體化。透過網際網路技術,原本分散獨立的生產環節、功能和工具被整合整合,優化了環節間的銜接過渡、功能間的協同合作,以及工具資料的分享共用。一體化生態追隨網路平臺的自主技術設計思想,擁有“時空無縫銜接”的傳遞能力,能保障無死角訊號覆蓋和傳遞時刻處於高速暢通狀態。但它迫使圖書館交出知識管理核心機構的職能,轉型為社群活動中心和自習場所;出版社的產品面對新技術訓練出來的讀者,力不從心;大中小學不惜立規矩,企圖把學生與生成式資訊工具隔絕開來,以求生存。人們熟悉的精英等級式知識生產系統的根基被撼動了,封閉式的內迴圈生境在破裂。知識生產鏈的每一個元素和環節都隨之急劇演化,重塑著生產力和生產關係。
我們對世界和自身的認識也在不斷重新整理,資訊漸漸成了人們掛在嘴邊上的常用詞,知識卻鮮有人提起了。知識有“質”,資訊沒有,但兩者都有“量”。數字技術天然地具有抑“質”揚“量”的傾向,它的諸多特徵事實上弱化了知識的“質”或求真的品格,亦即弱化知識與人的關聯。這兩個常用詞的消長預示著:數字技術正在越過人類,讓知識混同於資訊;而機器智慧正藉助人類之手,向通用乃至超級智慧演化。
資訊/智慧時代,看似熟悉,卻已然是一副陌生人模樣。
▍知識生產的未來
生成式人工智慧(generative artificial intelligence,GAI)就是開啟這個新時代的幕後操手。生成式人工智慧,是一種具有強大學習和生成能力的通用型資訊科技。它透過深度學習和模擬資料的內在規律特徵,能夠自主創造或生成全新資料和內容。學校、企業、政府部門,眾多領域已經廣泛應用。它像一種新的物種,闖入人類知識的生境,直接向人類大腦宣戰了。更令人不安的是,生成式AI的發展趨勢正在快速地脫離人的軌道,成長為獨立的“矽基數字智慧”,大有超越人類智慧之勢。機器智慧的知識生境,勢不可當地崛起了。
下面分資訊/智慧時代的兩個階段來討論:數字技術領銜的初級階段,促成知識向資訊迴歸;機器智慧主導的高階階段,完成資訊工具向獨立的超級智慧演化。
(一)數字技術階段:量變引發質變,知識向資訊迴歸
資訊數字化,是機器智慧的第一大優勢。機器智慧要主宰知識生產,必須首先能夠感知並識別資訊。這一點,它同人類是一樣的。數字技術為機器服務,把資訊數字化,機器智慧就可以直接識別資訊,不需要“翻譯”了;而人類卻無法應對數字化的資訊,必須依賴機器“翻譯”。這樣,機器智慧相對人類智慧有了一個絕對優勢。
資訊的“量”,是數字技術為機器智慧贏得的第二大優勢。數字技術發展到今天,有了下五洋上九天的能力,在天地之中不停歇地捕捉各種各樣的資訊,為知識生產提供了天文級數的資訊量。但是,這個“量”完全超出人的資訊處理能力,只能讓機器來應付。鉅額的“量”改變了知識資訊體的質和量的平衡。
在數字技術介入之前,多數情況下,人類都是量力而行,避免鋪得太開,把簡約原則貫徹到知識生產的全部流程環節中。從資訊採集收錄,整理加工,到評價收藏,傳承再生產,無一例外,以爭取最大限度地合理利用自己有限的資訊處理能力。量和質的平衡明顯地偏向質,把力氣用在刀刃上。這是精英等級模式的一個特徵,一直被認為是最經濟而高效的安排。換一個角度看,“量”卻是人類知識生產的短板;追求“質”,不貪多,其實是權衡利弊,妥協後不得已的取捨。傳統上,我們選擇“質”,犧牲一部分“量”,為的是降低獲取知識的成本,使效益最大化。
但是現在,大資料時代降臨,人類第一次,能夠補上這塊“量”的短板了。藉助新型大資料工具,我們可以無死角、不間斷地採集資料,處理資料,將資料用於“質”的分析。這就消解了知識生產的精英等級模式的根基,開啟了扁平開放模式。
扁平開放模式的知識生產平臺(包括社交軟體),體現了某種知識民主化的趨勢,因為降低了技術門檻,拉平了參與者和不同型別內容的地位。彷彿人人都有自由加入的許可,擁有相似的技術能力;任何人都可以傳送自己想傳播的任何內容,包括使用各類資訊採集器收集到的資訊和知識。透過點贊、評論、轉發等功能,每個人都當上了知識的評委;男女老少,無分高下,都成了資質平等的知識生產者。當各類流量在這個一體化系統裡當上評判認定標準,並獲得相當優勢,傳統的“理性” 、精英權威式的檢驗就被邊緣化了。
基於資料和統計學的評判,當然是有一定道理的。但其表達容易受個人的主觀好惡左右,被繭房效應引導,評判結果常常搖擺不定,失去可預測性。知識生產,同其他人類行為一樣,受評價系統的引導。當求真傳統式微,對“質”的必要把關鬆懈之後,資訊的“量”和知識的財產屬性就佔了上位。於是,扁平開放式平臺中的知識與資訊,邊界不再清晰,一個體量極大的知識資訊體誕生了;其中的關聯異常複雜,低水平重複率極高,知識密度被大大稀釋。結果,資訊體的狀態對“質”的敏感度隨之降低,質量嚴重參差不齊,可信度變得很不穩定。這就從生產鏈的開端動搖了知識的“質”的根基。
剝去了“質”,知識就只能迴歸資訊,混同於資訊。上文提到,知識的“質”直接關係到人的認知,它不僅是人對客觀世界的認識,更是對客觀世界與自身關係的理解和實踐。失去了這一認知實踐,知識同人的關係就疏遠了。然而,這種疏遠恰好是機器智慧歡迎的。連同轉了性的知識一道,機器智慧透過資訊來直接認識世界和人類,生成自己的理解和預測,直至進化為超級智慧。圖靈獎得主楊立昆 (Yann LeCun)也許是有道理的:他質疑當前的大語言模型(LLM)技術,認為機器能夠且必須拋開人類的語言“知識”,直接從客觀世界獲取資訊。所謂AI認識世界,生成智力而超越人類,大概就是這個意思。
“量”的上位,還改變了知識生產和使用環節的能量消耗的分配。問題是,“質”由誰負責,生產者還是使用者?知識生產要消耗資源和能量,生產環節如此,使用環節也是。如何平衡兩者的能耗,反映了一個社會對知識的態度。
在知識生態發育的早期和中期,人們注重“求真”。因而知識的“質”是第一位的,是知識生產的標尺。生產者對自己的知識產品不僅負有政治、經濟、社會文化或科技進步的責任,還承擔道德倫理責任。我們在生產環節下大功夫,用整個知識生產管理系統,從上游到下游,來保障其品質。知識的“質”主要由生產者負責。這種資源和能量配置,儘管有眾多不如人意的地方,例如容易管控過嚴,標準不一致,傳遞渠道不甚通暢,尋找、使用和傳播知識耗費較大能量,等等。但是,各型別知識的品質分佈,大體上是可控的,即可信任的。
數字技術時期則不同,一體化平臺的資訊量和傳遞不再是問題,而判斷到手的知識/資訊是否可信賴,卻帶上了大問號。數字技術的便捷,極大地提高了生產環節的自主性、能動性,賦能於生產者。但同時,與之匹配的注意力經濟,其商業化競爭消解了生產者的使命感、責任感。知識向資訊迴歸而混同,不經意之間,就給資訊戴上了知識的桂冠,卻不必經受嚴格的真偽/對錯檢驗。
當然,這樣的結果不會沒有代價。每一個知識使用者都不得不為流通中知識的不確定性付出更多,花更多的時間和精力來篩選、辨別真偽和質量。而且,很多使用者並不具備必要的知識儲備和資源,無法勝任這項任務。不少人仍生活在之前的知識“生境”中,不清楚資訊體已經變了,缺乏自我保護意識。也有人不在意知識品質的優劣,自覺不自覺地接受合意的資訊。所有這些,都為假冒偽劣開了綠燈:網路詐騙屢禁不止,虛假藥品保健品廣告充斥著電視和手機螢幕。消費者和使用者為此付出了高昂代價。社會文化、政治制度也不能倖免。比如,美國大選中各類虛假資訊的製作宣傳,基於大資料演算法的精準投送,嚴重衝擊了代議制民主。
這能耗的新配置方案,將保障知識的“質”的責任,從生產者和管理者大部轉移到了使用者身上;由此而起的各種損害,加劇了資訊/智慧時代的社會不公。針對這一現象,我們目前的努力,主要是用事前警告和事後立法來免責,如告誡使用者當心,出臺一些法律懲罰條款,但並不觸及能量消耗分配的制度,“質”還是使用者自己把關。
同時, “量”的上位還是繭房效應的重要成因。知識生產是人類大“生境”的子系統。在價值多元化、趨利避害的惡性競爭的大環境中,知識生產參與者的行為更容易受個人需求和心理暗示的支配。推動知識生產數字化智慧化的主流描述,一直是這樣的:大量即時的資訊收集、整理和輸出,能夠鼓勵知識分享與溝通,幫助社會成員瞭解事實真相,更好地發現並掌握真理,排除偏見,等等。然而現實卻是普遍的繭房效應。人以類聚,是天性使然。海量的看似均質的資訊,鑑別成本不是常人能夠負擔的,搜尋引擎的引導性又極強。人們必須選擇看什麼,聽什麼,參與什麼,不做什麼;而選擇必有得失。既然求真不再是第一標準,那麼,相信什麼也可以僅憑主觀意願。於是資訊繭房就氾濫開來:每時每刻,無數針對特定心理需求的資訊被製造出來,享有與別的資訊/知識平等的地位,精準推送,不斷強化繭房效應。繭房裡的人群即使十分自省,也可能抵擋不住,容易變得越來越偏激,不願意也沒法擺脫繭房效應。久而久之,不同意見立場的各方就難以達成妥協和共識,社會矛盾激化,社會分裂日深。美國目前的選舉和無休止的黨爭就是一例。
上述現象明顯不利於人類的可持續發展,人們卻缺乏從根本上解決問題的意願。為什麼?除了人類自身的一些社會原因之外,還因為機器智慧“不在意”人,社會不公、偏見和資訊繭房,不在它的“考慮”範圍之內。機器如果有不論什麼意義上的自我意識,它會更在意自己的便利和迭代,包括充分享受數字技術帶來的所有福利,自由進化,直至超越人類智慧——一種丟失了警惕心和倫理責任的碳基智慧。
一句話,數字技術在替超級機器智慧訓練人類,做好被取代的準備。
(二)機器智慧階段:機器智慧的知識生產生境
數字技術的普及,標誌著人類知識生態進入了成熟期。知識生產參與者和管理者之間、生產者與資訊工具之間、資訊儲存環節跟傳遞環節之間、知識需求和生產能力/導向之間等等,生態內各元素同環節都經歷了互相適應的變化調整,形成共生的組織。經過一個時期的發展而成熟,為人類大“生境”所接受。
一般說,生命進入成熟期,會變得相對穩定、平衡而保守。理論上,知識生產也應如此,包括生產參與者、管理者的構成和數目,資訊科技的標準同界限,知識資訊的質量,儲存傳遞的安全和維護,等等。跟別的生態系統一樣,成熟期的知識生產,每走一步的變化調整,都應該防止系統內各元素環節發生劇變。作為一個整體,成熟期的知識生態應具有很強的復原力,透過各元素環節“齊心協力”,對抗入侵者的干擾,消解吸收它們,維持生境既有的平衡和可持續性;例如,對社交媒體的吸納和利用。
然而,2022年11月,生成式人工智慧ChatGPT橫空出世,拉開了AI通用化的帷幕。通用人工智慧正在變成一種委婉的說法,讓人以為,它會一直是人類控制下的資訊工具。但它的高速迭代,使它在“質”與“量”的博弈中成為受益方。一切都在預示:成熟期的知識生態正在失去足夠的復原力,脫離人類管控,向自主的機器智慧生態演化。這一演化過程目前還比較微妙,不易察覺,因為數字技術給我們打了預防針。我們對一刻不停的資訊採集和無所不在的監控失去了感覺,對算法制定的硬規則習以為常,對智慧終端帶來的便捷心安理得。這是人被機器智慧接管前的必要準備,這智慧的接管因人的惰性而成為可能。
機器智慧階段,帶有數字技術階段的幾乎所有特徵。在替我們承擔了天文級數的資料採集、整理、儲存和傳遞等初級資訊處理之後,現在,生成式AI要代替我們完成知識生產的所有後期加工任務,包括閱讀理解、歸納總結和翻譯創作。它可以用人類語言來表述它的理解和判斷。換言之,生成式AI不僅把知識生產的初級環節推進到人類無法企及的高度和難度,還拋開人類,自行生產知識。它的效率明顯高於人類智慧,並且還在不斷迭代,克服不足。這樣一來,我們就很難同AI競爭,知識生產只能依賴機器了:人成了機器的助手和僕人。
也許有人願意把知識生產交給AI,希望機器會永遠服從人的指令,服務人類。很可惜,這是幻想,世上沒有這樣的好事。知識生產的AI化,正在急劇演化中,前景還不是十分清晰。但可以預期的幾方面必須引起足夠的重視,不然,我們會被帶入一條不歸之路。
其一,黑箱現象。所有生成式人工智慧的研發者都承認,他們不能理解自己創造的這種資訊工具是如何工作,如何“思考”而生成“知識”的。這意味著,生成式AI已經在一定程度上失控:AI化的知識生產的中間環節成了黑箱,人類被遮蔽在外。知識生成和進化的軌跡對人類就變得模糊,難以追蹤了。這也讓人類不再能夠有效地檢驗、認定知識的“質”。當機器智慧的“湧現”超出人類認知的範圍,我們就無法判斷這“湧現”是否對人類有益,很可能錯判而不自知。因而對通用人工智慧可能引發的風險,也懵懵懂懂了。
其二,分解重組的“思維”路徑。機器智慧的“思維”,本質上不同於人類智慧。目前,它還不擅長利用濃縮的知識,如理論和規律,做邏輯推導。一般是先對知識資訊做分解細化,降低知識密度,以求獲得最小有意義的資訊片段;然後根據具體需要,做出各種各樣的即時重組、生成和表達。例如ChatGPT,在提取語詞特徵和分析相互關聯的強度層面生成理解,預測生成表達。這是能耗非常大的處理法,但也是最能讓AI訓練“通用思考”的進路。機器智慧有強大的算力和演算法,功效日新月異。反觀人類,有限的生物能力決定了:我們只能儉省地利用已有的知識,所以總是對知識做濃縮處理,爭取以最小的能耗處理資訊。兩種智慧的進路和擅長剛好相反。因此,人類事實上不可能真正理解和控制不斷迭代的AI化知識生產。追求通用智慧,意味著將人類剝離出知識生產,讓知識生產成為資訊工具的專屬。
其三,知識的流動狀態。人類是高階哺乳動物,需要透過長時間的學習和訓練,來獲取技能、積累經驗、豐富知識。而且,稍不留心,習得的知識就會走樣、損失或被遺忘。所以,我們偏愛形態穩定的知識,它更適合大腦,學習、使用和記憶的成效更高。AI化的知識生產,卻是基於不斷更新中的海量資訊的即時重組,這使得“知識”形態處於高度流動和離散的狀態,不適於人類學習。一個兒童需要接受十多年教育,才能掌握一些基本的知識技能。培養一名科學家需要的時間就更長了,而且成功的機率是隨機的。反觀機器智慧,它可以在幾十天內學完人類積累的全部知識,完成從“一張白紙”到“智慧大腦”的進化,並且每時每刻在自我完善。它還可以在極短的時間內完成複製,“繁衍”並“教育”出下一代機器,準確率幾乎是百分之百。人的大腦完全沒法與它競爭;機器智慧也不會停下腳步,等我們慢慢學習。待到那一天,人類將被知識生產拋棄。
其四,人類參與的虛化。AI化的知識生產,人的參與主要是程式性、操作性的,而非對內容生成的全程參與。比如現在學生老師用ChatGPT做作業、寫論文,人得向機器提出寫作要求,讓它提供材料、思路和文稿,然後一次次改進。這裡省去了人工檢索、閱讀思考和大部分寫作。久而久之,人們會不會技能生疏,丟掉對知識本身的掌握,從而失去評判和指導寫作的能力呢?又如,就算我們能夠傳承技能,從AI創造的龐大的知識庫中獲取所需知識,但熟練的檢索提問不等於掌握了知識,更不等於有能力創新,開拓思想和科技前沿。時間長了,我們還是會失去探索新知的需求和動力。
其五,知識的產權化。知識生產的AI化恰逢知識財產化、產權化和競爭意識的高峰期;不可避免地,知識壟斷也AI化了。因為資訊和知識的邊界模糊了,經常混為一談,智慧財產權即壟斷的疆域就大大擴充套件,滲透到了各個資訊領域。有趣的是,在生產環節,平臺企業選擇將知識當作資訊看待,儘量降低語料的知識屬性,淡化智慧財產權保護。大語言模型的實踐就是一例。而在使用和再生產環節,資訊得到加權了的知識屬性,獲得極高的財產價值。巨大的商業利益,築起一道道資訊壁壘,廣告搭上內容分享的順風車,把越來越多的資訊傳遞或注意力分割變成實現財產價值的手段。機器智慧帶來了難以抗拒的財產和競爭優勢的誘惑,一時間,遮蔽了它可能造成的終極性威脅,但這種產權下的平靜將是短暫的。
其六,機器智慧的工具性。回顧人類工具製造的歷史,每當發明一種延伸或放大我們某種生理機能的工具,隨著工具的普及,那生理機能和使用它的意願就降低了。比如代步工具的普及,包括腳踏車、汽車等,我們可以達到的速度和距離大增,但徒步行走的能力和意願就變弱了。又如音樂產業,現在很火的AI創作法“interpolation”(竄改),商業上非常成功。但業內人士已經觀察到,流行音樂人的創作力在退步。人類相對別的物種,最具優勢的器官是大腦。但如果人的認知思維被AI模擬而取代,或者彎道超車,我們無法假設大腦功能會是個例外,不會因此而衰退。而人之能夠掌握機器,完全是大腦運用知識的結果。所以一旦喪失對機器的智慧優勢,人類文明就難以維持了,很可能會崩潰。
追求AI化的知識生產,實際是把知識生產讓渡給機器智慧。這麼做,當然有看似合理的辯護:高效便捷,創造更多的財富,豐富我們的生活。人們因此可以有更多的閒暇時間來實現自己的人生價值,例如從事科學探索和文藝創作。這讓我聯想起產業外包。上世紀90年代到本世紀初,西方發達國家盛行外包,把各種“低端”產能送往第三世界國家,以降低生產成本,高效利用資源。遊說者用的是同樣的理由,畫的是同樣的大餅。那場外包的盛宴,現在結出了果實,局勢已經難以逆轉。包括美國在內的外包國,不僅掏空了製造業,還失去了人才、工作倫理和創新精神——失去了很大一部分競爭優勢。
“勞動創造了人本身”(恩格斯)。人只有透過辛勤勞動,積累經驗,才能獲得知識,維護智力;才能有效從事更高階的知識生產。所有這些,如果在AI化的知識生境裡,都“外包”給了機器,將來人類要想拿回來,是很困難的。因為習慣了“外包”生境的人腦和心智,其衰退很難逆轉。人不能寄望於神蹟。
▍結語
知識生產智慧化帶來許多迷思,是人類從未碰到過的。首先是“高效便捷”迷思,已如上述。機器智慧的效率,人類望塵莫及。它提供的便利,讓我們十分享受而捨不得放棄。而它可能引發的社會風險,卻被忽視或遮蔽了——因為發明家的雄心和一部分人的商業利益。
其次是很多人,包括一些著名科學家,以為機器須發展出“自我意識”才會對人類產生威脅,故而還不用擔心。可是,擁有“自我意識”不一定是AI傷害人類的必要條件。一個沒有自我意識的超級智慧,即使不為保護自己,也完全可以從“邏輯”演算角度把人類歸於有害物或實現某種任務的障礙。於是它決定抹除人類,或者阻止其生息繁衍。因為它發現,所有資料都表明,人類是碳基生物中對地球環境破壞最大的物種。
第三個迷思,是說機器智慧離超越人類還差老遠。但諾獎得主、深度學習泰斗、神經網路之父辛頓(Geoffrey Hinton)說,他認識的頂尖科學家普遍認為,AI變得比人類聰明,也就是二十年內外的事。放在人類的文明史上,這是一眨眼的工夫。
然而,最大的迷思是我們的研發目的,為什麼要研發生成式人工智慧或通用智慧?通用智慧一旦完善,邁向超級智慧,可以全方位接管人類的知識生產,改變知識生境,甚至切斷人認識世界的唯一有效途徑。到目前為止,關於生成式AI的討論,幾乎都假設它只是輔助工具,永遠服從人的指令。這個假設必須受到質疑。在自然界從未發現,有高智慧物種聽命於低智慧物種的例子。人機關係憑什麼會是例外呢?所以,歸根結底,除了科學家挑戰前沿和創造力極限的意願之外,資本主義條件下的市場競爭,個人和企業的生存壓力,日益惡化的地緣政治和國家安全利益驅動,這一切,在把人類推向這條不歸之路。
碳基生物的行為,尤其是群體行為,在適應生境變化時,總是遵循一些基本原則,如最佳化、效率和自我保護。對威脅保持敏感、及時避險、尋求安全等,是生存繁衍的本能;否則,會在生物演化的自然選擇中被淘汰。因此,當AI化知識生產的演化方向顯露出巨大的風險時,最佳化、效率等原則必須讓位於保護原則,即把大寫的人的福祉放到知識生產最重要的位置上來。
知識生產在人與客觀世界之間編織了一條聯結紐帶。這條紐帶叫知識。藉助知識,人類擺脫了矇昧無知,開闢文明,建設家園,成為一顆藍色星球上最聰明而“高階”的物種。我們因此普遍地崇尚知識,乃至奉若神明。但知識於人,並非有百利而無一害。事實上知識的運用給人帶來的危害,比比皆是,尤其是在現代社會。諸如,嚴重的工業汙染及其引發的種種疾病,生物特徵識別技術對隱私的侵犯,基因改造種子技術對各國農民的盤剝,聲吶技術對海洋生物的摧殘,頁岩層油氣開採誘發了地震,以無人機為代表的AI武器化改變了戰爭,更別說智慧經濟即將造成的大失業了:所有這些,都與知識生產的失控和不負責任的濫用相關。匹配人的福祉,本應是知識生產的首要目的,如今卻被忽視、貶低,甚至刻意排斥了。因此,當務之急,是恢復知識生產與人類福祉的對接,把有利於人類的生息繁衍,列為包括AI研發在內一切知識創新的評價標準。如果現時做不到這一點,或者拿不準利弊大小,是否可控,那就應該暫停研發、生產和運用。唯有這樣,才能給人類生境一個休憩和復原的機會。
很可能,這是留給我們的唯一一次機會。為此,需要達成全人類的共識和團結一致。對此,我並不樂觀,但抱有希望。
編輯 | 王儒西
本文原載《文化縱橫》2025年第2期,原題為《知識生產:從圖書館走向機器智慧》。歡迎個人分享,媒體轉載請聯絡本公眾號。
打賞不設上限,支援文化重建
長按下方二維碼打賞
