技術進步不但不會淘汰傳統文化,反而讓傳統文化復活,讓它們誕生新生命。
本篇文章,主要談談筆者一直非常感興趣,看似非常冷門,又很重要的一個話題。
筆者上週參觀了一下國家圖書館的古籍展覽,這是第三次看這個展覽,不過跟逛故宮一樣,每次看都有不同的心得,並不覺得有膩煩。這裡的珍貴典藏有:甲骨文,這是國內甲骨文收藏最多,也是最精品的部分,並且這些甲骨文的來歷都很不一般,我們可以看到王懿榮、羅振玉、郭沫若等人的藏品;戰國、秦漢竹簡,以及蔡邕所刻的《熹平石經》殘片;歷代印刷善本,如宋代印刷的多本儒家經典著作,這是目前儲存下來的僅有的南宋皇家典藏;中國四大收藏的《敦煌遺書》、《趙城金藏》、《永樂大典》和《四庫全書》的最精華部分。






(文津街的國家圖書館古籍館,以及國圖北館向公眾展出的宋代善本、趙城金藏、敦煌經卷、吐魯番文獻)
如果說故宮儲存了全國書畫、珠寶和瓷器的精華,國家博物館儲存了考古精華,國家圖書館古籍館則儲存了歷代書籍、經卷等印刷品的精華,可並列為中華文脈的三個主要組成部分。不過前兩者因地理位置和傳媒的原因,知名度遠遠大於後者。其實讀者有興趣的話,可以來看看,一定可以大飽眼福。
筆者從上大學時就非常愛好蒐集古籍善本,節省的錢很大一部分用來購買古舊書籍,其中不乏稀有資料。後來把最心愛的一部分珍藏,無償捐獻給了某所著名大學圖書館,筆者認為這些資源與大家共享,才能發揮它的最大用處。
筆者在海外遊學時,也特別注重瞭解那裡的漢文古籍典藏。2018年筆者在哈佛訪學,在燕京圖書館熱心館員的幫助下,得以目睹這裡的珍貴古籍,大約一共15萬冊,無論數量上、還是質量上,在西方圖書館中都是冠軍,最珍貴的有:宋刻本《纂圖互注揚子法言》、《六度集經》、《大般若波羅蜜多經》、《漢書》,明刻本《世說新語》和1728年的《古今圖書整合》等,這些放在國內也都是國寶級文物。筆者還曾經在俄羅斯科學院東方學研究所看過這裡的中國古籍典藏,這裡最知名的是西夏的黑水文獻。


(哈佛燕京圖書館)
日本漢文古籍之豐富,質量之高是其他國家難以企及的,整個日本約有91萬部漢文古籍,約等於中國全國藏品的三分之一。去年筆者去日本,特意又參觀了這裡的最重要的幾個漢籍收藏重鎮,分別是:日本內閣文庫、國會圖書館、金澤文庫、東洋文庫和靜嘉堂。
這出於兩方面原因,一方面日本以前就是漢字文化圈,自從唐代開始就從中國大量採購圖書,由於日本戰亂少,這些古籍能夠比較完整儲存下來,比如東京國立博物館有印於唐代的《尚書》、《毛詩》、《世說新語》、《王勃集》等,據我所知,國內已經沒有唐代善本圖書了,在唐宋元戰亂中均被焚燬,但是在日本還可以看得到;在神奈川一個小鎮上,有個建於鎌倉幕府時代的金澤文庫,這裡儲存了35000餘部宋元明清善本,約等於中國國圖蒐集的全國最佳善本的四分之一。

(東京國立博物館的《尚書》,大致印刷於唐太宗年代,是目前世界上現存最早印刷品之一,比敦煌藏經洞的《金剛經》還要早200餘年)
另一方面,日本在近代出於侵略或文化炫耀的需要,從中國購買或搶掠了很多珍貴古籍,比如三菱財團創始人巖崎彌之助非常喜歡中國文化,於是成立靜嘉堂蒐集中國文物,收穫最大的舉措就是打包購買了江南四大藏書樓之一的皕宋樓全品。靜嘉堂收藏的宋元善本之多令人昨舌,其中宋代珍品就有《周禮》殘本2冊、《說文解字》8冊、《漢書》40冊、《唐書》90冊、《李太白文集》12冊等,均被列為日本的“國家重要文化財”。

(靜嘉堂的北宋版《說文解字》)
站在我們今人角度講,古籍相關工作一方面是蒐集和儲存,下一步更重要的就是典校和傳播了,這樣才能成為活文化,否則就是“死文物”。
中國古籍雖然在歷代戰爭中,遭受了巨大損毀,但是儲存下來的數量依然很客觀。據文化部組織的古籍資源普查,全國有清代以前古籍有260萬部、3000多萬冊,僅國家圖書館裡就儲存了15萬部、近300多萬冊。
不過由於之前人力和技術有限,古籍儲存、典校、傳播都做的遠遠抵不上它所具有的文化價值,以至於古籍研究成為小眾又小眾的“冷學問”和“死學問”,大眾既難以接觸古籍,也沒有機會了解古籍,文化遺產的價值得不到發揮。
例如,國家圖書館牽頭國內幾十家圖書館進行的中華古籍資源電子化工程,所整理、出版、電子化的部分目前僅有13萬餘件(其中國圖約2.5萬餘件),只是館藏的冰山一角。這對整個民族來說都是一種損失,比方說,很多古代歷史的密碼都在敦煌文書裡面,但是因為對它的整理遠遠不夠,妨礙了我們對自己文明的研究;再比方說,很多中醫類文獻因為沒有電子化,好多藥方和診斷經驗也就不能為今人所用。
某種程度上來說,哈佛大學和美國國家圖書館在中文古籍資源電子化和共享上的經驗,反而值得國內借鑑。雖然漢籍不是他們的本土文化,發掘整理這些沒有任何民族自尊心和自豪感的需要,但是這兩個部門分別把收藏的5.3萬冊和3.5萬冊中文古籍善本全部電子化,供全球所有上網者免費查閱。


(哈佛大學和美國國會圖書館的中文古籍電子資源共享平臺)
所以,整理、共享這些古籍,是發掘傳統文化中的一個極其重要話題。不過筆者認為AI技術的突飛猛進,為之提供了新的契機。比如,字節跳動從2022年3月起,與北京大學合作設立古籍保護專項基金,利用其強大的數字技術優勢,為古籍點校、電子化和傳播賦能。據筆者瞭解,有以下部分:
1. 利用AI為OCR技術升級,大大加速了加速古籍的自動識別轉化,新的OCR技術、文字版式識別、自動標點、自動命名實體識別、自動翻譯等功能,大大加快了從圖書館庫房到電子資源平臺的轉化速度。
2. 搭建更強大的檢索和查閱平臺,目前該平臺已免費開放16000餘部古籍,包括《永樂大典》、哈佛燕京文獻、《四庫全書》、《明實錄》《清實錄》等受關注度高的古籍。並上線了圖文對照、繁簡轉換、字典釋義、文白對照、實體百科、實體關係圖等功能,使得普通大眾很方便閱讀古籍,大大降低了解古籍的門檻。



(位元組搭建的古籍資源開放平臺“識典古籍”,並聯合國家圖書館將國家文化瑰寶《永樂大典》電子化)
尤其是2024年3月,位元組基於本企業研發的豆包大語言模型,又研發了 “古籍智慧助手”,這是國內大語言模型技術在古籍數字化領域的有益嘗試。
3. 依託依託識典古籍平臺,發動社會參與古籍整理,目前成功舉辦了“我是‘校書官’古籍大眾智慧整理計劃”一期,1萬名學生報名,覆蓋了1210所高校,整理古籍1643 部。3月26日, “我用AI校古籍”在武漢大學啟動,今年的活動有來自22所高校的27個院系。位元組創造的這種發動公眾參與的方式很值得借鑑,讓更多年輕人參與進來,整理的過程也是閱讀和了解的過程,更是激發對文明認知的過程。
4.向北大教育基金會捐贈2500萬元,用於資助北京大學《儒藏》工程,一方面支援儒藏經典的整理,另一方面將相關成果在識典古籍上線。《儒藏》工程是有史以來最大規模的海內外儒學典籍整理工程,涵蓋了中韓日越四國千年來最珍貴的3500餘種儒家著作研究,過去《儒藏》只有一些大學圖書館有收藏,如果實現對這項工程的電子化分享,讓公眾有機會了解,無疑有很重要文明意義,也對逝去的湯一介等工程牽頭人的最好告慰。

(卷帙浩繁的《儒藏》將隨著AI技術的介入而電子化)
所以說很多時候,技術進步不但不會淘汰傳統文化,反而讓傳統文化復活,讓它們誕生了新生命。我們雖然距離線裝書流行的時代越來越遠,但是AI技術的出現,卻又讓當下成為距離完成所有古籍整理最近的時代,我們期待以後有越來越多的科技企業,能有文化公共關懷,利用科技的渠道,讓傳統文明與現代社會連線起來,我們的文化才越來越有活力,中國文明的底蘊才能有更多綻現。
我們也期待隨著我國人工智慧技術的進步,所參與的企業、社會機構越來越多,可以把所有的流落在海外珍藏電子資源電子化,雖然我們不能收回這些實物,但是仍可以有機會汲取這些流散在外的文明精華。