400多名學者,18年,仍未完成的書

12.11‍‍‍‍‍‍‍
知識分子
The Intellectual
《儒藏》整理手稿。
●                  ●                   
400餘名學者,編纂18年,內容近2億字,這是一套近年出版的圖書背後的數字。
而這只是這套書的“精華編”,真正的全本預計約10億字。為此,還需要多少學者,編纂多少年,卻是未知的。
這套書就是《儒藏》。
《儒藏》將收錄自先秦至清末重要儒學文獻,是新中國成立以來最大規模地系統整理海內外儒學典籍的一項基礎性文化建設工程,也是教育部迄今為止支援力度最大的哲學社會科學研究攻關專案。
為了《儒藏》,一代又一代學者投身其中,有的從學生做成專家,有的從中年做到老年,也有的一直做到生命最後一刻。還要做多少年才是盡頭,是很長時間裡大家不敢想象的事情。
但是現在,隨著人工智慧和數字化技術的迅猛發展,以往純手工的編纂工作也有了可以依靠的技術幫助,效率將會大大提升,《儒藏》編纂也因此迎來轉機。
01
編一套10億字的書
提到《儒藏》,不得不提北京大學哲學系教授湯一介。
歷史上,把相關典籍收集在一起的文庫稱作“藏”,“儒釋道”三家中已經有了《佛藏》和《道藏》,在中國歷史和文化中佔據主流地位的儒家卻沒有相關文庫。
2002年,75歲的湯一介提出編纂《儒藏》的建議,得到季羨林等老先生的熱情鼓勵。次年北大成立《儒藏》編纂工作小組,又過了一年北大《儒藏》編纂與研究中心成立,負責組織實施編纂工作,《儒藏》工程正式啟動,湯一介是中心首任主任。

湯一介教授在《儒藏》編纂工作中。
因為儒家典籍實在過多,且儒家影響範圍不僅僅在中國,經過研究決定《儒藏》工程分兩步實施,先選取歷史上較有代表性的典籍編為“精華編”,然後再擴充套件為全本《儒藏》。
第一步將我國曆史上的500餘種儒學文獻,以及將韓、日、越三國150餘種漢文儒學文獻編纂成冊,共計約2.3億字;第二步收書規模將會大增,初步估計收書3000餘種,共計約10億字。
是否有必要編這樣一套書,當時很多人提出過質疑。事實上,雖然儒家典籍整理出版非常豐富,但這些典籍並不是經過系統整理的大文庫,而且多以影印本的形式出版,不僅普通讀者閱讀困難,專家學者查詢資料也頗為費力。
湯一介提到過日本出版的佛藏《大正藏》。雖然中國也有不少佛藏,但大多數使用者都習慣使用《大正藏》。為什麼呢?因為《大正藏》經過現代整理,有斷句(儘管有錯誤),有校勘記,便於使用。
有鑑於此,湯一介認為《儒藏》的整理應採用繁體豎排、現代標點加校勘記的形式,並且要能夠製作成數字化的電子文字,以便於檢索。為了要做到可以永遠流傳下去,錯誤率要低於萬分之一。
這些都讓《儒藏》編纂從一開始就困難重重。
02

似乎沒有盡頭

沙志利是《儒藏》精華編責任編委,現任《儒藏》編纂與研究中心副主任,他2005年從北大中國古典文獻學博士畢業,正趕上《儒藏》中心需要人手,便來此工作,是《儒藏》中心的第三個正式工作人員,也是最年輕的編委之一。
據他介紹,《儒藏》中心與國內25家單位合作,有48位部類主編和專案負責人,組織了全國近50所高校及研究機構的約400位專家,一起承擔“精華編”國內部分的校點工作,交稿後再由《儒藏》中心把關。
編纂初期,來稿質量參差不齊,很大比例的稿件不符合要求。為了保證質量,《儒藏》中心慢慢摸索建立了一套細緻詳實的多達十一個環節的流程,並制定了相應的制度。可即便如此,還是有不少來稿需要反覆退改,甚至更換了校點者。這些都大大拖延了工程進度。
“一開始湯先生定五年編完,後來定十年編完,我們這些剛工作的更是想象不到要多久。”沙志利回憶。
那時他作為畢業生能進入北大工作,滿懷壯志,可是沒想到在《儒藏》中心的工作十分枯燥。多年來,他的工作常態是面前一臺電腦,電腦裡開啟幾個古籍資料庫,成堆的稿子在桌子放不下就放地上,最後幾年竟堆得比人還高。他在那埋頭幹,累了就揉揉眼睛,跑到樓下抽一根菸,再回來繼續幹。
“年輕時候還是有點學術追求的”,但《儒藏》的編纂似乎沒有盡頭。每年報成果“是最失落的時候”,平均每年就發表一篇論文,想來想去報的都是成編纂成果。而古籍整理在現有的科研評價系統中得分很低,早年甚至不算分,編書不如寫論文。他懷疑,“自己是不是要一輩子做這個”?
“精華編”中國部分確定的書目有282冊,但直到2009年只出版了40冊,讓沙志利感覺“想緩口氣都不行”。後來他們開始制定五年計劃,2009年到2014年又出了60冊,總數量到了100冊,而且相關部門也加大了支援力度,才看到盼頭。
2014年6月,“《儒藏》精華編百冊釋出會”在北京大學舉行,這是湯一介最後一次公開露面。他已經病重,遵醫囑不能多講話,但仍然在發言中說:“我想,只要我活著一天,我就願意為這個工程來盡我的力。”
同年9月,湯一介因病去世。
此後的日子裡,《儒藏》中心依然努力進行之前的工作。2022年7月,《儒藏》“精華編”中國部分終於完成出版。
已出版的《儒藏》“精華編”。
書籍出版後收穫了學界的廣泛好評,學界對書的質量普遍給予好評,這讓沙志利感覺到了自己多年工作的價值。不久前,同事向他轉達一個漢學家的致敬,因為這位漢學家看到了《儒藏》裡他署名校點的王艮全集,說整理得很好。
“那個話很難用來評學術成果,但是我很感動,我確實是下了很大的功夫去做這件事情,別人在用的時候會感覺到這個版本比已有的好,這時候作為校點者本人是很幸福的。”
03
將效率大大提升
目前,沙志利依然是《儒藏》中心最年輕的編委之一,老先生們還叫他小沙,可是他已經47歲了。
面對體量更大的全本如何提高編纂效率,內部討論過很多次。一位參與“精華編”的專家表示,全本編纂時一定要使用新技術,“人工點校的方式,一遍一遍地來做校對,費時費力,這些基礎工作都要人手來做的話,那需要多少年?”
《儒藏》“精華編”執行總編纂、北大哲學系教授魏常海在編纂“精華編”時就隱隱覺得,數字化勢在必行。
據他回憶,以前編纂是三方不同時間段的工作,必須是校點人先交稿,《儒藏》中心才能審稿,修改完成才能交給出版社,出版社錄入電腦後還要再發給編委審稿,最後校點者和編委都確認無誤才出版。每一次交接都需要寄送,要等前一步做完了才能開始下一步。他曾設想,如果校點人直接提交電子文稿,就會省去後期再錄入電腦後還有重新檢查一遍的環節。
不僅如此,《儒藏》中心原本有一位研究員楊浩,是學哲學的,近年對運用計算機整理古籍的感興趣,後來去了北大數字人文研究中心,參與開發了“識典古籍”。沙志利開玩笑,楊浩還是以“曲線救國”的方式又回來整理《儒藏》了。
2023年,全本《儒藏》啟動大會上,北大數字人文研究中心主任王軍教授發言,希望結合現有的古文獻資料庫,從智慧編纂平臺、資料庫釋出平臺等方面,推進全本《儒藏》數字化工程。
王軍的信心來自2022年,字節跳動集團與北京大學合作研發的古籍數字化平臺“識典古籍”上線了。
在“識典古籍”上線的《永樂大典高畫質影像資料庫》
“識典古籍”平臺源於字節跳動在古籍保護領域的公益嘗試,結合了字節跳動的人工智慧技術優勢、產品研發能力及北京大學數字人文研究中心的學術能力,是一個免費開放的古籍資源平臺。
除了可以閱讀,“識典古籍”還開放了整理平臺,有古籍整理需求的個人和機構,可以藉助自動古籍文字識別(OCR)、自動標點、自動命名實體識別、自動文言文-白話文翻譯等人工智慧工具,以及配套的協作校對工具更高效地整理古籍。
據“識典古籍”的工作人員介紹,經過兩年多的發展,智慧整理已經更加成熟,《儒藏》數字化整理的很多工作,都可以在人工智慧技術的輔助下被解決和提效。《儒藏》的專家將相關文獻的影像上傳平臺後,人工智慧會進行初步整理,當遇到不確定的情況時會被標註出來,並放上底本供專家檢查。這樣,專家不再需要花太多的精力在機械枯燥的對比異同上,可以把精力更好地集中在一些關鍵的內容部位和環節上,做好更有深度的學術判斷,這將大大減少傳統模式下校點人花費的精力,還能節省時間。
同時,“識典古籍”還開發了協作整理的功能,支援以團隊的形式開展工作,將大大節省因為時空展開而帶來的溝通成本。在“識典古籍”上,參與編纂工作的各方能在同一時間看到對方的進度,完全不需要花費交接時間,而且還能把書打散,以更小的單位進行不同環節的輪流加工,壓縮了不少等待的時間。
04
讓更多人更方便使用《儒藏》
129日下午,《儒藏》數字化專案啟動儀式在北大舉行。

《儒藏》數字化專案啟動儀式
北京字節跳動公益基金會向北大教育基金會捐贈2500萬元,用於資助北京大學《儒藏》工程,並透過識典古籍智慧整理平臺支援《儒藏》整理,相關成果將在“識典古籍”上線。
北京字節跳動公益基金會理事長張羽表示,“未來《儒藏》的相關成果也將陸續在‘識典古籍’閱讀端上線,實現全民共享,讓中國傳統文化、儒家文化,能夠被更多人以更方便的方式去檢索和閱讀。”
這背後是從2021年6月起,字節跳動就透過公益捐贈助力古籍修復,並持續投入技術、平臺資源來開展古籍數字化與活化,讓更多古籍能夠得到更及時的修復,也讓古籍裡的知識能夠被更高效地檢索、利用和傳播。截至目前,“識典古籍”已上線開放一萬餘部古籍。
《儒藏》“精華編”執行總編纂魏常海表示,“我們做《儒藏》的人只有一個想法,就是把它編出來,能夠釋出出去,讓全中國、全世界的人都能看到,都能把它用起來,而這個意願的實現就是靠‘識典古籍’平臺。”
也許這就是幾代人編纂《儒藏》的意義。
正如湯一介生前常對身邊人說的,中華文明之所以沒有中斷,就是因為有經典存世。編纂《儒藏》,關係到中國人的文化自強、文化自信。將中華文化發揚光大,是知識分子應有的對國家、民族的擔當與職責。

親愛的讀者們,不星標《知識分子》公眾號,會錯過每日科學新知!星標《知識分子》,緊跟前沿科學,一起探索科學的奧秘吧!

請戳上圖卡片新增星標

關注《知識分子》影片號
get更多有趣、有料的科普內容

END

相關文章