新聞中心

EEPW首頁(yè) > 國(guó)際視野 > 業(yè)界動(dòng)態(tài) > 俄科學(xué)家用人工智能破譯古代典籍

俄科學(xué)家用人工智能破譯古代典籍

作者:環(huán)球時(shí)報(bào) 時(shí)間:2022-09-20 來(lái)源:新浪網(wǎng) 收藏

【環(huán)球時(shí)報(bào)綜合報(bào)道】科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏有藏文和蒙文古文獻(xiàn)十余萬(wàn)冊(cè),稱得上是古代智慧寶庫(kù),但其中只有一小部分文字被翻譯成俄文。目前,該研究所東方手寫文獻(xiàn)和刻本研究中心的科學(xué)家已開(kāi)始破譯這些古代典籍,他們使用了系統(tǒng)。

本文引用地址:http://www.butianyuan.cn/article/202209/438373.htm

  教系統(tǒng)“閱讀”

  “目前,我們正教系統(tǒng)閱讀藏文”,該研究所所長(zhǎng)巴扎羅夫(Boris Bazarov)院士介紹說(shuō),“為此掃描了500頁(yè)手稿和刻本(木刻板印刷古代書籍),然后通過(guò)使用將藏文轉(zhuǎn)換為拉丁字母的威利(Wylie)系統(tǒng)手動(dòng)輸入拉丁字母?!边@500頁(yè)文獻(xiàn)成為神經(jīng)網(wǎng)絡(luò)“教材”,程序員教神經(jīng)網(wǎng)絡(luò)記住圖像并將其與隨附文本相關(guān)聯(lián)。培訓(xùn)只用了2個(gè)小時(shí),神經(jīng)網(wǎng)絡(luò)就通過(guò)了考試,已能以94%的準(zhǔn)確率識(shí)別藏文。不過(guò),科學(xué)家們并不滿足于此。

  “藏文文字特點(diǎn)在于音節(jié)文字,而非字母”,東方手寫文獻(xiàn)研究中心主任林奇諾夫(Oleg Rinchinov)說(shuō),“刻本與其他文獻(xiàn)的不同之處在于多相性——有的地方刻得比較清晰,有的地方刻得比較模糊。而且,這些文獻(xiàn)還受到歲月蠶食。目前,還沒(méi)有達(dá)到文本識(shí)別的最高準(zhǔn)確率?!笨茖W(xué)家認(rèn)為,可將準(zhǔn)確率提高到99%,但每提高一個(gè)百分點(diǎn)都需要大量細(xì)致的工作,例如要將準(zhǔn)確率提高到95%,需要多用上千個(gè)示例“教”神經(jīng)網(wǎng)絡(luò),準(zhǔn)確率從95%提高到96%則需要用上萬(wàn)個(gè)示例。因此,該項(xiàng)目至少延長(zhǎng)了5年。相比之下,一個(gè)藏學(xué)家翻譯一部作品需要3年到10年。

  古代智慧寶庫(kù)前景廣闊

  “這是世界上首次嘗試解譯藏文”,巴扎羅夫院士介紹說(shuō),“翻譯典章和醫(yī)學(xué)文獻(xiàn)等可以更充分地了解古代知識(shí),而且使大量材料得以通用。盡管該項(xiàng)目延期,但我們的所有努力都是為了提高文本識(shí)別的準(zhǔn)確性。之后,我們借助神經(jīng)網(wǎng)絡(luò)就能輕松地將原始文獻(xiàn)翻譯成其他語(yǔ)言了?!?/p>

  科學(xué)院院長(zhǎng)謝爾蓋耶夫(Alexandr Sergeev)和科學(xué)院西伯利亞分院院長(zhǎng)帕爾蒙(Valentin Parmon)不僅從文化角度,還從實(shí)踐角度對(duì)古代智慧寶庫(kù)的前景予以高度評(píng)價(jià),他們認(rèn)為,醫(yī)學(xué)書籍中的處方可用來(lái)制作生物活性添加劑,還可以制藥,這對(duì)在布里亞特共和國(guó)建立生物醫(yī)學(xué)產(chǎn)業(yè)集群尤其具有現(xiàn)實(shí)意義。

  中國(guó)藥學(xué)家的啟示

  “2015年中國(guó)藥學(xué)家屠呦呦因發(fā)現(xiàn)治療瘧疾的新藥獲得諾貝爾獎(jiǎng)。這種藥是從青蒿中提取的,可以有效降低瘧疾患者的死亡率”,巴扎羅夫舉了一個(gè)現(xiàn)代人使用古代知識(shí)的鮮活例子,“藏族智慧還包含多少造福人類的發(fā)明?我們很快就會(huì)知道。我們發(fā)明這個(gè)算法,實(shí)現(xiàn)系統(tǒng)工作穩(wěn)定后,一定會(huì)開(kāi)始破譯古蒙古文文獻(xiàn)。我相信,我們?cè)谶@方面也會(huì)取得科學(xué)突破?!彼f(shuō)。

  俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏的古代藏文和蒙古文典籍、檔案文件、音頻、照片和視頻屬全球最大規(guī)模之一。這些稀有珍品收集了上百年。藏品中有十多萬(wàn)冊(cè)藏文典籍和7000冊(cè)古蒙古文文獻(xiàn),包括哲學(xué)、醫(yī)學(xué)和宗教文學(xué)。最古老的文獻(xiàn)可以追溯到16世紀(jì)。這些珍品中有約170部獨(dú)立醫(yī)學(xué)著作,涉及冥想方法、針刺療法、外科手術(shù)和藥理學(xué),其中只有10%被譯成了俄語(yǔ)。




關(guān)鍵詞: 俄羅斯 人工智能 考古

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉