據聯合國統計,從公元8世紀至今,我們生存的地球上累計出現過2萬多種人類語言,但時至今日留存下來的只剩6000余種。即便如此,當前人類的語言也還在以每年24種的速度不斷消亡,形勢非常嚴峻。按照近日澳大利亞國立大學研究人員的預測,本世紀末可能有1500種語言完全消失。這警醒著我們,未來若不能找到有效緩解語言瀕危的辦法,人們或許將最終步入”無話可說“的境地。
那么,如何拯救和保護瀕危語言呢?人工智能大有可為!近年來,隨著深度學習等技術的不斷發(fā)展,人工智能已然愈發(fā)強大和成熟,通過與物聯網、機器人、5G等技術的融合應用,其正給人們的生產與生活帶來巨大的改變?;诖耍壳搬槍肁I拯救瀕危語言,世界上不少國家和科研群體也在展開探索與嘗試,并且已經找到了三種較為可行的辦法:
其中一種是利用AI技術打造智能教育機器人,通過機器人指導人們學習瀕危語言,從而讓這些語言得以傳承和延續(xù)。比如,IBM的“沃森人工智能”就曾創(chuàng)立過一個能理解并回復用戶信息,用毛利語與人交流的聊天機器人;同時,一組來自ARC語言動力學中心的研究人員,也曾開發(fā)過一種低成本、易于運輸的語言教育機器人……這些智能機器人完全可以勝任語言傳承和傳播者的角色。
另外一種嘗試則是利用人工智能打造語言檔案館,從而起到記錄、保存和傳播瀕危語言的作用。就像世界上為拯救瀕危動物建設的基因檔案館一樣,對于瀕危語言也可以采用這種形式。據了解,此前國外一位叫托馬斯·弗雷的未來學家就提出了“語言檔案館”的計劃,將瀕危語言項目列為建設的重點。他與夏威夷大學合作,利用人工智能將收集到的足夠多的瀕危語言資料進行了翻譯和存儲。
除此以外,還有一種方式是利用AI技術實現“語言復制”。所謂“語言復制”,是通過智能語音技術對一種語言實現完整記錄,包括語言的結構、語音、語義和文本互譯關系等等。一切順利的話,AI將成為所以小眾瀕危語言的載體,即使這一語言已經不在人類中使用,我們仍能從AI處尋到它的原貌。目前,科大訊飛的AI研究院基于深度學習技術,正嘗試在部分瀕危語言和方言上進行語言復制。
當然,雖然AI對于拯救瀕危語言有奇效,但所面臨的困難也不小。有的語言文字口語雖然廣泛使用,但文字往往缺乏正字規(guī)范;有的單純使用口語,文字使用較少;還有甚至沒有文字,語言也只有少數老人在使用......這些情況無不給AI理解、記錄和傳播語言帶來巨大困難。鑒于此,利用AI拯救瀕危語言,除了需要技術突破之外,也少不了廣大熱愛母語的人參與進來,只有兩者結合才能行深致遠。
與此同時,還有一點也不能忽略,那就是對于AI技術應用的強力監(jiān)管。作為一把雙刃劍,用它的人不同,所帶來的效果也可能截然相反。對于瀕危語言來說,人工智能若應用失當,不僅無法起到保護作用,甚至成為進一步加速語言消亡的幫兇。畢竟,現在加載人工智能技術的語音助手越來越普及,如果所有語音助手或者翻譯機器在語言上拋棄了小眾語言,無疑就是在推動小眾語言走向”死亡“。
簡而言之,人工智能產品作為時下能夠引導人類語言使用的潮流趨勢,如果將一些小眾語言給排除或是忽略了,這將加深這些語言沒有用處的印象,從而導致語言瀕危程度進一步加深。從這點來看,AI既是拯救語言的工具,同時也是加速語言消失的幫兇。至于究竟是拯救還是幫兇,關鍵取決于應用的人,這呼喚我們仍需從觀念層面加強對語言保護的重視。