谷歌宣布其翻譯功能中已添加 110 種語言,其中包括幾種瀕臨滅絕的歐洲語言。
該公司表示,大約四分之一的新語言來自非洲,所有新增語言的使用者超過 6.14 億。
例如,你現在可以用馬恩島語發送工作電子郵件,馬恩島的凱爾特語“隨著 1974 年最後一位母語人士的去世而幾乎滅絕”,該公司在其部落格上的帖子。
來自法國的地方語言,包括布列塔尼語(一種在布列塔尼使用的凱爾特語言)和奧克西唐語(在該國南部使用)也榜上有名。
還加入了西西里語和威尼斯語(分別來自西西里島和威尼斯的兩種義大利方言)以及北薩米語(斯堪的納維亞半島北部使用的語言)。
羅姆語也榜上有名,這種語言有多種方言,歐洲約有 460 萬人口使用該語言。
谷歌在 2022 年表示,其長期目標是「建立一個支援 1000 種最常用語言的人工智慧模型」。
它是如何運作的?
這些語言的翻譯並不像乍看那麼簡單。谷歌使用人工智慧 (AI) 來支援翻譯功能。
人工智慧需要足夠數量的書面數據,例如書籍、文章和網站中的文本,這對於區域語言和稀有語言來說可能是稀缺的。
然後,這些數據會被輸入受人腦神經網路啟發的演算法,使系統能夠分析模式、上下文和語言結構,從而提供聽起來自然的翻譯。
由於可用的訓練資料豐富,人工智慧在英語中往往表現較好。
谷歌並不是唯一一家對稀有語言感興趣的公司。
微軟於2022 年推出了微軟語言庫,強調世界上40% 的語言都處於瀕危狀態,而瀕危語言活語言研究所與音頻公司舒爾合作開展了一項名為“不讓任何聲音掉隊”的活動,以促進偏遠地區語言的保護語言。
史丹佛大學也發起了自己的保護「數位弱勢語言」的倡議。