科技帶來全新工具
內(nèi)容修訂走出紙面
如何讓這個90歲高齡的《牛津英語詞典》在數(shù)字時代重獲生機,編纂者必須做點什么。
數(shù)字時代給辭典編纂者帶來了壓力,也帶來了新的工具——語料庫語言學(xué)出現(xiàn)了。在過去,傳統(tǒng)的辭典編纂模式通過整理并依據(jù)已知的單詞及其注釋,尋找證據(jù)證實編纂者認(rèn)為的詞義。但如今,以計算機為主導(dǎo)的語料庫語言學(xué)要求編纂者通過數(shù)字技術(shù)批量獲取人們真實使用著的語言,比如社交網(wǎng)絡(luò)用語等,并以此為依據(jù)來編纂辭典。
牛津大學(xué)出版社的一名主管興奮地說,辭典編纂與語料庫語言學(xué)資源結(jié)合,“可以實現(xiàn)一些不一般的事”,這種說法一點也不夸張。目前為辭典提供原材料的語料庫所包含的詞匯遠(yuǎn)遠(yuǎn)超出編纂者最瘋狂的想象。整理包含特定詞語的短語,可以讓編纂者“解開”這個詞不同的涵義,觀察一個詞如何被“誤用”,可以發(fā)現(xiàn)它的詞意重心正在變化。在俚語專家、《牛津英語詞典》顧問喬納森·格林看來,長期以來俚語詞典編纂者追蹤詞匯的不同使用形式的夢想如今終于通過即時交流軟件和語料庫實現(xiàn)了,甚至他們幾乎可以在新詞被創(chuàng)造出來的那一刻就及時跟上進度,將其編入詞典中。
從與技術(shù)“聯(lián)手”發(fā)現(xiàn)新詞起,《牛津英語詞典》的編纂就走上了一條數(shù)字化道路。編纂團隊也逐漸意識到,隨著更多線上詞典競爭對手的出現(xiàn),《牛津英語詞典》的出版也不能再依賴于“慢一步”的紙張印刷,只有借助網(wǎng)絡(luò)才能實現(xiàn)詞典的時時更新。從2000年起,《牛津英語詞典》的全部內(nèi)容修訂走出紙面,開始以在線形式呈現(xiàn),按季度更新,每次更新包含數(shù)千個修訂過的詞條以及數(shù)百個新詞。
但即時在線更新并不意味著所有新詞都會被收錄,仍然希望確保自己權(quán)威地位的《牛津英語詞典》并不愿意被潮流牽著鼻子走,在他們看來,即便在數(shù)字時代收錄一個新詞依然是一件十分嚴(yán)肅的事情。作為規(guī)定,一個新詞依然需要“存活”5年時間才會被收錄進在線版的《牛津英語詞典》,因為一旦它被收錄進了詞典,就不會被刪除。
牛津大學(xué)出版社全球業(yè)務(wù)總裁及詞典部總裁卡斯珀·格萊斯沃爾已經(jīng)在牛津大學(xué)出版社工作超過20年。從紙質(zhì)圖書印刷到現(xiàn)在的在線詞典,他親眼見證了牛津大學(xué)出版社的歷史,也見證了整個科技演變的過程及其對行業(yè)帶來的影響。“我們并不是想要把紙質(zhì)的字典變成電子的詞典,不是一個簡單的重復(fù)過程,而是希望詞典的內(nèi)容和使用,能夠融合在語言學(xué)習(xí)的過程當(dāng)中。”格萊斯沃爾說。團隊也開始與美國硅谷的一些科技公司合作,將團隊搜集到的所有語料交由科技公司轉(zhuǎn)換為智能語言數(shù)據(jù),并開發(fā)成各種應(yīng)用程序,為英語學(xué)習(xí)者提供數(shù)字產(chǎn)品和服務(wù)。
步入數(shù)字時代的《牛津英語詞典》依然沒有放棄印刷版的想法。“我們會完成的。”《牛津英語詞典》現(xiàn)任總編輯邁克爾·普羅菲特堅持道,再版這個大部頭的“高齡”詞典可能要等到2037年。(翟桂葉 玖田)
