我曾臆斷:人類互聯(lián)網(wǎng)發(fā)展一直延續(xù)著一個母題:回歸“部落”,包括社交網(wǎng)絡(luò),物聯(lián)網(wǎng),開源,云計算,共享經(jīng)濟等熱門詞匯的涌現(xiàn),也許都是“回歸部落”現(xiàn)象的各個支脈,這些技術(shù)讓每個人的每項活動都變成某種合作,從而成為產(chǎn)消者。而倘若宏觀意義上,互聯(lián)網(wǎng)發(fā)展的底層邏輯是將全人類更為透明高效地連接在一起,形成一個巨大“村落”,語言無疑是終將攻克的技術(shù)障礙,而人類對機器翻譯的無限企盼和仰仗,不過是一種順勢而為。
從直覺便知,在一個自由連接,信息與服務(wù)唾手可得的互聯(lián)網(wǎng)時代,機器翻譯可以解除巴別塔魔咒,在教育,社交,跨境商貿(mào)等領(lǐng)域有廣袤應(yīng)用空間,降低人類的溝通成本。正因如此,機器翻譯從來不只屬于科技圈的“自嗨”,早已獲得學(xué)術(shù)界的認可,百度就憑借機器翻譯項目獲得了國家科學(xué)技術(shù)進步獎,作為中國最高級別科技獎項,其往年獲獎?wù)甙?a class="innerlink" href="http://m.ihrv.cn/tags/載人航天" title="載人航天" target="_blank">載人航天和探月工程這樣的重量級項目,足以看出學(xué)術(shù)界對機器翻譯的重視。而如你所知,無論微軟的Skype Translator還是谷歌的Google Translate,也都在致力于發(fā)展機器翻譯,拓展人類語言大同——事實上,從計算機誕生伊始,人們即達成共識:消弭因地理割裂而生的語言障礙,擁有無以復(fù)加的現(xiàn)實意義。
人工智能紅利
作為典型的多學(xué)科交叉技術(shù),機器翻譯涉及計算機,認知科學(xué),語言學(xué),信息論等學(xué)科,很長時間內(nèi)都是人工智能領(lǐng)域最難課題之一——盡管對“人工智能”本身的定義在隨時代的變遷而更替,但人類對機器翻譯的愿景從未磨滅。
事實上,追溯歷史,幾十年之前計算機剛剛誕生,當(dāng)時的從業(yè)者即不滿足將機器僅用來“計算”,開始醉心于對“智能機器”的樂觀描述——1956年便提出了人工智能的概念,并相信短時間內(nèi)可以造出這臺智能機器。當(dāng)然,經(jīng)過幾十年努力,無知導(dǎo)致的樂觀遭遇重挫,人們開始重新回歸對“計算”本身的追尋,于是摩爾定律成為常識,計算機日趨高速和微小,“只要是計算問題機器都能解決”成為今日人類引以為傲的資本。數(shù)據(jù)紅利讓人們對人工智能的幻想暫時落地——某種意義上,至少在現(xiàn)階段,人工智能的本質(zhì)就是將一個領(lǐng)域所有人的“智慧”灌注在機器里,以一種類似“群體智慧”的方式幫助到個體。
與之相伴的是,應(yīng)用的瓶頸被徹底打開。不少業(yè)內(nèi)人士預(yù)測,2016年或者未來五年之內(nèi),人工智能會像基礎(chǔ)設(shè)施一般滲透至各個領(lǐng)域,出現(xiàn)數(shù)萬億美元的巨大市場。就連凱文·凱利也曾表示,將尚未產(chǎn)生人工智能的領(lǐng)域引入一些人工智能,即是從業(yè)者的機遇。“人工智能會是下一個20年顛覆人類社會的技術(shù),它的力量將堪比電與互聯(lián)網(wǎng)……我們將會看見舊有的事情加入人工智能,產(chǎn)生千萬種不同的結(jié)果。”
應(yīng)用落地
機器翻譯的歷史幾乎是人工智能的縮影。上世紀九十年代,機器翻譯完成了從以規(guī)則為基礎(chǔ)的方法到統(tǒng)計方法的蛻變,基于大數(shù)據(jù)加以分析以完善翻譯系統(tǒng),喚起了機器翻譯新紀元。
事實上,早在1954年冷戰(zhàn)時期,當(dāng)科學(xué)家首次公開發(fā)布了一款能翻譯人類語言的機器時,人們就堅信,一旦通用翻譯機器問世,不僅能讓美國在國家安全上領(lǐng)先蘇聯(lián),還能消除語言障礙,促進世界和平——幾十年之后,我們發(fā)現(xiàn),這個良善的判斷愈加接近于正確。
你得承認,當(dāng)“地球村”三個字愈加脫離比喻成為現(xiàn)實,當(dāng)人們覓得彼此,卻聽不懂彼此語言,著實有些尷尬。譬如,據(jù)不完全統(tǒng)計,在全世界浩如煙海的數(shù)萬億網(wǎng)頁之中,80%為非中文網(wǎng)頁(全球語言多達7100種,互聯(lián)網(wǎng)網(wǎng)頁上的語言只占約5%);在出境游前20的國家之中,累積語言高達12種……不夸張地說,人類語言的割裂正成為阻礙經(jīng)濟發(fā)展的一大桎梏,而可以肯定,機器翻譯至少是人類可以掌握的一大利器,對于推動經(jīng)濟發(fā)展,促進文化交流,甚至維護國家安全都有著不俗意義。有業(yè)內(nèi)人士估計,目前全球翻譯市場年規(guī)模已達到370億美元。
隨便說個例子——出境游。
如你所知,伴隨著中國中產(chǎn)階級的崛起以及所謂的“消費升級”,出境游日漸成為休閑常態(tài)。而過多羈絆則讓更多年輕人拒絕跟團游,選擇自由行,但對英語不太好的人來說,身為異鄉(xiāng)客,卻始終隱隱浮現(xiàn)對語言的擔(dān)心,從而耽擱一場說走就走的旅行。其實你大可將翻譯任務(wù)交給機器,問路,點餐,買票都可以通過百度翻譯這個中介尋求幫助,更重要的是,它可以根據(jù)場景的變遷而自由切換,無論是實物翻譯,涂抹翻譯,還是語音翻譯,它都能滿足用戶瞬間的翻譯需求。而Google也在翻譯app中推出了一個功能:用手機相機掃描一段外國文字,就能顯示出翻譯文字。無論百度還是谷歌,這都符合科技記者羅伯特·斯考伯在《即將到來的場景時代》中所言:移動設(shè)備、大數(shù)據(jù)、傳感器、社交網(wǎng)絡(luò)與定位系統(tǒng)這“五力”的組合,將移動時代的爭奪戰(zhàn)場從流量搬至了各種應(yīng)用場景。通過場景打造入口級產(chǎn)品,幾乎稱得上是移動互聯(lián)網(wǎng)時代的新常識。
事實上,但凡涉及多語言應(yīng)用場景,無論在線教育,互聯(lián)網(wǎng)金融,還是傳媒和跨境交易,機器翻譯都可自如嫁接。譬如百度翻譯的研究成果不僅應(yīng)用于國家多個重要部門,并通過開放API支持了包括華為、金山等上萬家第三方翻譯應(yīng)用,實現(xiàn)機器翻譯的大眾化使用,激發(fā)更大商業(yè)價值。而微軟Skype Translator也可將用戶視頻聊天中的語音轉(zhuǎn)換為另一種語言的語音或文字,實現(xiàn)自由互聯(lián),擁有廣闊應(yīng)用前景。
最后,其實我真正想說的是,不知你是否察覺,無論自由市場經(jīng)濟,還是互聯(lián)網(wǎng)和其他通訊工具,人類構(gòu)建的制度和技術(shù),正在讓人們更友好地善待彼此。
在某種意義上,評判一項技術(shù)是否偉大有個標準:它是否增進連接?!坝黾由a(chǎn)力先增進連接”曾在人類歷史上反復(fù)出現(xiàn)。事實上,人類社會闊步向前的核心一直是連接產(chǎn)生的協(xié)作,從采集狩獵,到城市,國家,全球貿(mào)易,再到互聯(lián)網(wǎng)(也許還包括未來的大腦相連),人類正不停地擴展合作邊界,也在不斷通過技術(shù)與其他人產(chǎn)生連接和協(xié)作。從這個角度,像百度這樣的機器翻譯或許也可歸為所謂“連接型技術(shù)”,它能讓人們更好地理解彼此,讓世界平得無以復(fù)加。
也許這才是機器翻譯最偉大的意義,因為我相信,人類始終對那個“無國界”的世界懷有鄉(xiāng)愁。