
閩南話識別系統(tǒng)界面。一位女士正對著手機(jī)用閩南話進(jìn)行語音輸入。
臺海網(wǎng)3月23日訊 據(jù)廈門日報(bào)報(bào)道,用閩南話對著手機(jī)語音錄入“愛拼才會(huì)贏”,語音輸入后屏幕上立即顯示“愛拼才會(huì)贏”字樣。近期,一款名叫“閩南話識別”的軟件在網(wǎng)絡(luò)上走紅。只要是日常對話的語句,不管你說的閩南話是廈門口音、泉州口音,或是漳州口音,它基本都能識別出來并翻譯成文字,識別準(zhǔn)確率高達(dá)85%
這款軟件是廈大信息科學(xué)與技術(shù)學(xué)院副教授洪青陽、廈大人文學(xué)院中文系助理教授許彬彬帶領(lǐng)的科研團(tuán)隊(duì)合作研發(fā)的。目前,這一軟件已經(jīng)過多階段的內(nèi)部測試,并開放供廣大市民免費(fèi)試用。
記者與幾位同學(xué)分別用廈門口音、泉州口音、漳州口音的閩南話,對著軟件語音輸入:“今天天氣很好。”不到2秒,系統(tǒng)翻譯出了相同的對應(yīng)文字。記者又以略微不同的表達(dá)方式對著軟件語音輸入“今天天氣很好”,系統(tǒng)依舊能準(zhǔn)確識別。
近日,記者采訪了軟件背后的科研團(tuán)隊(duì),為您揭秘軟件開發(fā)過程。
調(diào)查
采集多地語音資料 連國外也不放過
首先,該軟件背后的語音資料庫就很強(qiáng)大,這是基于許彬彬近10年來的研究成果。許彬彬帶領(lǐng)團(tuán)隊(duì)借鑒、整理了大量語音資料——囊括福建省內(nèi)廈、漳、泉多地的閩南方言、文本,甚至收集了國外多處講閩南話的地點(diǎn)的語音材料。
除了廈大的語音資料庫外,每到寒暑假,許彬彬團(tuán)隊(duì)還會(huì)去各地進(jìn)行田野調(diào)查。“省內(nèi)的漳浦、東山等,以及菲律賓北部城市、美國的東部地區(qū),每一個(gè)地點(diǎn)至少要停留5天,盡可能全面地描寫該地區(qū)語音面貌。”她說。
