網站首頁 | 網站地圖

人民論壇網·國家治理網> 人民智庫> 正文

數(shù)字技術讓古籍“觸手可及”

輸入網址、輕點鼠標,儒家經典《論語》可逐頁在線閱覽,飄逸俊秀的漢隸代表作《曹全碑》書法躍然眼前,古籍還能實現(xiàn)繁體字和簡體字轉換等功能,讓讀者能查詢、會閱讀。專家認為,中華古籍浩如煙海,對珍貴古籍進行保護、修復和活用,關乎中華文脈的延續(xù)和傳承。隨著數(shù)字技術不斷成熟,古籍正走出“深閨高閣”,資源會得到更有效利用。

 

從圖書館“搬”到網絡平臺

點擊瀏覽器,進入一個名為“識典古籍”的網站,記者看到《周易》《左傳》《禮記》等典籍陳列在首頁上。隨機點開一本,左側為章節(jié)目錄,右側為正文,排版形式既符合現(xiàn)代人的閱讀習慣,又還原了古籍紙張的閱讀美感。

這是北京大學數(shù)字人文研究中心與字節(jié)跳動合作研發(fā)的一個數(shù)字古籍平臺,自去年10月發(fā)布以來,已上線古籍1200余部,免費供公眾瀏覽。

與一些數(shù)字化平臺僅提供古籍影像不同,點擊該平臺的功能按鈕,還能實現(xiàn)簡繁體轉換、圖文對照、全文檢索、支持移動端等服務。北京大學人工智能研究院副研究員楊浩介紹,該平臺應用了文字識別、自動標點等技術,不僅將影印本上的文字提取整理,還可以標記文本中的人名、地名等信息。“我們利用人工智能技術,將古籍由以前的圖像加工成可檢索的文本與數(shù)據(jù),方便研究者、用戶直接閱讀。”

隨著數(shù)字技術不斷成熟,科技賦能古籍工作取得可喜進展。國家圖書館公布的數(shù)據(jù)顯示,全國已累計在線發(fā)布古籍數(shù)字資源13萬部(件)。打開《永樂大典》高清影像數(shù)據(jù)庫(第一輯),讀者能瀏覽到國家圖書館館藏的《永樂大典》40冊、75卷的高清圖像及相關知識;浙江大學打造的“智慧古籍平臺”可在線查閱數(shù)萬篇古籍,還有著者小傳、人物行跡及社會網絡關系圖等延伸信息。

這些古籍是怎樣從圖書館庫房“搬”到網絡平臺的?楊浩介紹,古籍數(shù)字化過程分為兩步。首先將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;采用的光源是防紫外線的LED燈冷光源,減少對古籍的損害。其次是對圖像做數(shù)據(jù)化處理,利用人工智能技術對文字進行識別,對標點、實體等進行標引,方便讀者閱讀與檢索。

減少人工智能識別錯誤率也很重要。字節(jié)跳動公益古籍項目相關負責人說,具有中文、歷史等專業(yè)知識并對古籍感興趣的員工,自發(fā)成立2600人的志愿者團隊,參與古籍校對工作。

方便讀者獲取資源

“作為再生性保護的重要手段,古籍數(shù)字化及其平臺建設意義重大。”北京大學數(shù)字人文中心主任王軍認為,古籍數(shù)字化可以很好地解決古籍保護與利用之間的矛盾。傳統(tǒng)上,人們要利用古籍,必須直接接觸書籍,這可能導致書籍受到進一步磨損,且只能在特定的圖書館或機構中閱讀。通過數(shù)字化,不僅能減少對古籍的物理損害,還方便讀者隨時隨地獲取這些資源。

近年來,古籍數(shù)字化和平臺建設進展很快。國家圖書館搭建的“中華古籍資源庫”已成為全國古籍資源類型和品種最多、體量最大的綜合性資源共享發(fā)布平臺。中華書局的“中華經典古籍庫”已發(fā)布6000多種、15億字的點校本古籍。一些地方還打造了整理少數(shù)民族古籍的數(shù)字平臺,如“廣西古籍文庫”目前共收錄100多部古壯族文字古籍底本和近千份民族地區(qū)文書等資源。

不過,古籍數(shù)字化工作依然任重道遠。業(yè)內人士指出,中國現(xiàn)存古籍中,只有少部分被拍攝成圖像資料,而大部分未實現(xiàn)文本數(shù)字化。此外,大量古籍分散收藏在各個圖書館或收錄于不同的數(shù)據(jù)庫,難以進行高效檢索、關聯(lián)閱讀和深度挖掘與利用。

如何將這些散落的古籍整合起來?6月初,一個旨在對2.5萬種古籍進行數(shù)字化整理的古籍智慧圖書館項目啟動。該項目到2025年底,將實現(xiàn)國家圖書館等館藏古籍數(shù)字化,并為人們提供公益性閱讀服務。

短視頻再現(xiàn)古籍里的美食

“沒想到古籍這么‘香’。”在看完系列短視頻《食光機·隨園私房菜》后,有網友留言說。該短視頻由南京圖書館歷史文獻研究館研究員史星宇和韓超制作,他們按照清代文學家袁枚寫的《隨園食單》,再現(xiàn)古籍里的美食,吸引不少人觀看。

“為了更好地呈現(xiàn)《隨園食單》中的菜品,我們結合歷史和古代文學等相關學科背景,對原文文本一起推敲斟酌,在烹飪上反復試驗,同時盡量還原書中的烹飪手法,保證菜品的原汁原味。”韓超說。

如何讓數(shù)字化的古籍和人們更親近呢?這考驗著文保機構、科研院校與互聯(lián)網公司等相關從業(yè)者的創(chuàng)新能力。如紀錄片《古籍尋游記》運用交互技術、掃描技術等,讓用戶以更沉浸的方式體驗甲骨文刻字、建造敦煌莫高窟的過程。

王軍認為,在古籍數(shù)字化、活化過程中,人文社科學者要積極介入,并加強與技術人員合作;高校古典文獻學等相關專業(yè)應培養(yǎng)兼具技術與學術能力的復合型人才,部分古籍內容應向著“數(shù)字文創(chuàng)”轉化,讓古籍更好地走進千家萬戶。

原標題:

全國累計在線發(fā)布古籍數(shù)字資源13萬部

數(shù)字技術讓古籍“觸手可及”(網上中國)

責任編輯:張宏莉
標簽: 數(shù)字技術