中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

對話博鰲AI同傳負責(zé)人:為何明知挑戰(zhàn)這么大,騰訊還要堅持

澎湃新聞記者 楊鑫倢
2018-04-17 19:07
來源:澎湃新聞
? 10%公司 >
字號

2018年博鰲亞洲論壇首次采用人工智能同聲傳譯(以下簡稱“AI同傳”),但是這套系統(tǒng)翻譯的表現(xiàn),在網(wǎng)上引起不小的討論。

4月12日,博鰲論壇AI同傳官方合作方、騰訊翻譯君負責(zé)人李學(xué)朝接受澎湃新聞(www.nxos.com.cn)記者電話采訪對質(zhì)疑作出回應(yīng)。李學(xué)朝坦言,AI翻譯在目前還需要不斷完善,現(xiàn)場語種多元、話題專業(yè)性強、噪音干擾多,肯定會遇到各種問題,首次接受國際會議大考,希望各界對AI翻譯有合理的預(yù)期。

在本次博鰲部分論壇上,騰訊提供了同傳雙語內(nèi)容會議現(xiàn)場投屏、翻譯結(jié)果語音收聽的服務(wù),并允許場外觀眾在微信小程序查看同傳內(nèi)容。但騰訊AI同傳被發(fā)現(xiàn)多個翻譯問題,如外國嘉賓將“一帶一路”說反后,AI直接翻譯為了“一路一帶”;嘉賓中英文混著講時,AI同傳出現(xiàn)大面積單詞無意義重復(fù)、大小寫及字符混亂的情況;還有時,AI同傳不翻譯卻連續(xù)吐出十幾個相同字符。

隨后有網(wǎng)絡(luò)傳言稱,“騰訊AI博鰲同傳還是需要人類,緊急招募人工同傳協(xié)助?!?/p>

李學(xué)朝表示這實屬誤會。他解釋道,那天,騰訊新聞團隊為了直播需要,找了人工同傳。騰訊有兩個團隊服務(wù)博鰲,一是負責(zé)現(xiàn)場會議的AI同傳團隊,一是騰訊新聞團隊。

實際上,各方都預(yù)料到之后可能出現(xiàn)的種種問題。

博鰲論壇現(xiàn)場。

博鰲開幕首日,騰訊董事會主席兼首席執(zhí)行官馬化騰在微信朋友圈中表示,“在博鰲的朋友麻煩現(xiàn)場反饋一下同傳效果如何。新嘗試,多包涵?!?/p>

“博鰲主辦方也知道AI同傳的現(xiàn)狀在準(zhǔn)確度方面肯定達不到百分之百,博鰲會議規(guī)格高,翻譯難度大,但依然愿意去做這種嘗試,這種對創(chuàng)新支持的態(tài)度感染了我們?!崩顚W(xué)朝說。

李學(xué)朝不愿談及拿下博鰲項目的具體過程,但關(guān)于合作費用問題,他透露是免費的。

一些自然語言處理專家認為,騰訊敢于做這類會議的同傳“勇氣可嘉”。

“騰訊同傳的表現(xiàn)是在意料之中的?!睈蹱柼m都柏林城市大學(xué)教授劉群向澎湃新聞記者表示,近年來神經(jīng)網(wǎng)絡(luò)技術(shù)的應(yīng)用使得機器翻譯的水平有了大幅度的提高,但最近一段時間以來關(guān)于機器翻譯的宣傳使得大眾對機器翻譯的期待過高。

劉群說,谷歌和微軟的論文都宣稱機器翻譯達到甚至超過了人類翻譯的水平,但這樣的結(jié)論都是在嚴格的限定條件下才成立的。一旦跨出給定的領(lǐng)域,或者領(lǐng)域數(shù)據(jù)不充分,結(jié)論肯定是不成立的。

“當(dāng)然,這次大規(guī)模測試也暴露了騰訊同傳的一些問題?!眲⑷赫f,同傳技術(shù)與一般的機器翻譯不完全一樣,它并不僅僅是語音識別和機器翻譯的簡單組合,而需要有效融合;語音識別在這種高噪音、高多樣性的環(huán)境下如果表現(xiàn)不穩(wěn)定,也會導(dǎo)致后面的機器翻譯無法給出合理的譯文。

東北大學(xué)教授、小牛翻譯負責(zé)人朱靖波告訴澎湃新聞記者,AI翻譯從開始基于規(guī)則的方法,到上世紀(jì)九十年代的統(tǒng)計方法,再到最新的深度學(xué)習(xí)方法,經(jīng)歷了幾個范式,性能得到了巨大提升。但是由于語言的多樣性和復(fù)雜性,通用的AI同傳可能無法在短期達到完美。

李學(xué)朝認為,AI同傳和人工同傳各有優(yōu)勢,兩者適用不同的場景。AI翻譯速度快,人工翻譯質(zhì)量高,可以相互合作。

在接受澎湃新聞記者近一小時電話采訪中,李學(xué)朝還被問及騰訊的AI翻譯戰(zhàn)略、對AI翻譯前景的判斷、與科大訊飛搜狗的競爭、是否會做最近大熱的翻譯機、AI翻譯的內(nèi)部賽馬機制等問題。

騰訊翻譯君負責(zé)人李學(xué)朝

以下是澎湃新聞記者與騰訊翻譯君負責(zé)人李學(xué)朝的對話實錄:

回應(yīng)質(zhì)疑:外界對AI同傳的關(guān)注度超過預(yù)期

澎湃新聞:最近網(wǎng)上關(guān)于博鰲同傳AI的非議很多,你對騰訊AI同傳這次翻譯情況是否滿意?

李學(xué)朝:騰訊同傳能第一次登上國際大會,整體表現(xiàn)還是符合我預(yù)期的,有好例子也有壞的例子冒出。這類跨領(lǐng)域討論型會議的同傳對任何AI系統(tǒng)都有巨大挑戰(zhàn),參與嘉賓是多國的,每一種語言在會上自由討論、自由切換,口音也各不相同,在一些場景下有可能觸發(fā)Bug或者不翻譯的情況,這也是AI系統(tǒng)可以持續(xù)進化的地方。我們預(yù)料到意外情況的發(fā)生,但行業(yè)對AI同傳的關(guān)注熱度超過我們預(yù)期,給了我們多維度的輸入,這也是我們這次收獲最大的地方。

澎湃新聞:有傳言稱,騰訊AI博鰲同傳效果不佳,于是緊急招募人工同傳協(xié)助?

李學(xué)朝:騰訊同傳是百分之百的AI同傳,網(wǎng)上傳言實屬誤會。實際上,騰訊有幾個團隊服務(wù)博鰲,一個是負責(zé)現(xiàn)場會議的AI同傳團隊,還有一個是負責(zé)直播的騰訊新聞團隊。發(fā)生誤會的那天,有一場分論壇的人工同傳線路沒有直播聲音傳過來,所以騰訊新聞團隊為了工作需要,找了人工同傳。而那個會場沒有騰訊AI同傳在支持,不是全部的博鰲論壇都支持騰訊AI同傳。

澎湃新聞:為什么只有幾個論壇支持AI同傳,而不是所有的論壇?

李學(xué)朝:我們?yōu)榱吮WC同傳速度,都是在現(xiàn)場用服務(wù)器直接部署到本地,所以在這種情況下,我們沒有準(zhǔn)備那么多套服務(wù)器能一下子服務(wù)全場的會議。

澎湃新聞:為什么將“一帶一路”的英語錯誤翻譯成了“一路一帶”?

李學(xué)朝:嘉賓在會場上發(fā)言比較口語化,在英文表達的時候把“一帶一路”說反了,說成the road and belt,機器就把它當(dāng)成字面的意思直譯出來了。這就是人跟機器的區(qū)別吧。如果是人工的話,就有很大的容錯,會把它翻譯成“一帶一路”。

澎湃新聞:既然是人工智能系統(tǒng),為什么它沒有反應(yīng)過來是嘉賓說反了?

李學(xué)朝:這是當(dāng)前人工智能翻譯技術(shù)現(xiàn)狀,它無法結(jié)合上下文去校對發(fā)言準(zhǔn)確性,現(xiàn)在技術(shù)上一些學(xué)術(shù)圈內(nèi)開始有這方面的研究,但是還沒有到產(chǎn)品實用的階段。目前,我們已專門針對上面“一帶一路”可能的錯誤表達個例做了強制轉(zhuǎn)化。不過人類語言很豐富,我們沒有辦法窮舉所有可能說錯的情況。

澎湃新聞:有張截圖顯示,AI同傳過程中,出現(xiàn)不翻譯情況,反倒生成了很多for。

李學(xué)朝:出現(xiàn)這個情況主要是包括神經(jīng)網(wǎng)絡(luò)機器翻譯在內(nèi)的深度學(xué)習(xí)算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定概率引發(fā)翻譯偏差。嘉賓重復(fù)說了4個for,剛好這種情況觸發(fā)了系統(tǒng)把它翻譯成更多的for出來,而翻譯引擎不巧放大了這個重復(fù),出現(xiàn)翻譯錯誤,我們在技術(shù)與產(chǎn)品方面會有針對性優(yōu)化。

澎湃新聞:像噪音、語言口音的問題怎么解決呢?

李學(xué)朝:之前大家看到的AI同傳大多是用在單場個人演講中,盡管那已經(jīng)很復(fù)雜了,但相比討論型會議,復(fù)雜度還是低的。博鰲這類國際討論會議中,多國嘉賓同場參與、多種口音、多語自由切換或中英文夾雜,多噪音等特點,復(fù)雜度很高,對AI同傳有極大的挑戰(zhàn)。

硬件方面,可以用更多有指向性的設(shè)備,比如麥克風(fēng)陣列;另一方面,也需要提高語音識別技術(shù)。這些問題需要學(xué)術(shù)圈、企業(yè)、科研機構(gòu)等一起努力來解決的。

中英文混講導(dǎo)致大面積單詞無意義重復(fù)、大小寫及字符混亂。

澎湃新聞:據(jù)現(xiàn)場記者反映,嘉賓如果中英文混著講的話,AI翻譯也會凌亂。

李學(xué)朝:中英混講的情況,確實對系統(tǒng)也很挑戰(zhàn)。目前我們系統(tǒng)的做法會判斷這一句話到底中文多一些還是英文多一些,來決定翻譯為哪種目標(biāo)語言。在中英雙語切換頻繁或一個單句包含的中英文量級差不多時,后臺中、英文識別引擎就會同時開始工作,會導(dǎo)致兩種識別引擎互相“掐架“,翻譯結(jié)果只能選擇一種語言進行輸出,有可能出現(xiàn)句子中的中文也被當(dāng)作英文了,所以這時候就有可能出現(xiàn)翻譯錯誤的情況。

幕后故事:免費向博鰲提供AI同傳服務(wù)

澎湃新聞:為什么明知道博鰲這個會場的情況會特別復(fù)雜,但是騰訊還是要堅持做AI同傳呢?

李學(xué)朝:我們確實預(yù)測到難度比較大,因為這種會場規(guī)格高,難度又很大,但是博鰲作為主辦方,愿意去做這種嘗試,也知道AI同傳的現(xiàn)狀在準(zhǔn)確度方面肯定達不到百分之百,這種對創(chuàng)新支持的態(tài)度感染了我們,也是一個向國際及行業(yè)內(nèi)外展示AI同傳當(dāng)前進展?fàn)顟B(tài)的機會,因此我們認為這是一次很好的歷練。

澎湃新聞:參加博鰲之前,預(yù)期AI同傳準(zhǔn)確率大概達到多少,現(xiàn)在看來實際的準(zhǔn)確率大概是多少?

李學(xué)朝:基本上,語音識別翻譯準(zhǔn)確率在90%以上,目前看來和我們的預(yù)期差不多。但由于比我們之前支持同傳的會議要復(fù)雜,所以最后準(zhǔn)確率的數(shù)據(jù)還需要做進一步統(tǒng)計。

澎湃新聞:騰訊是怎么接到博鰲同傳的項目的?

李學(xué)朝:博鰲亞洲論壇從會議主題到會務(wù)細節(jié)都秉承開放、創(chuàng)新的精神。每一屆都會邀請代表科技前沿的產(chǎn)品進行技術(shù)展示。AI同傳是一個方向,博鰲選擇了騰訊同傳。我們針對博鰲做了非常充分的準(zhǔn)備和技術(shù)升級,把博鰲往屆的視頻拿過來在系統(tǒng)中進行測試,經(jīng)過反復(fù)驗證,最后才把這套系統(tǒng)拿出來。

澎湃新聞:給博鰲提供項目的價格?

李學(xué)朝:這個合作是免費的。

澎湃新聞你認為AI同傳和人工同傳是什么關(guān)系?

李學(xué)朝:AI同傳和人工同傳各有優(yōu)勢,兩者適用不同的場景,可以協(xié)同。很多會議條件不允許,無法為每個語種請一個同傳;一個會議需要多個人工同傳輪流支持,非常耗精力,這時候AI同傳能做協(xié)同。但AI同傳不能百分之百翻譯對,也需要與人工同傳合作。人工同傳在會議之前往往也需要學(xué)習(xí),來補充不同行業(yè)的知識。

談行業(yè):各家重回新的起跑線

澎湃新聞:在AI翻譯方面,前有科大訊飛和百度,為什么騰訊也介入進來了,并加大了投入?

李學(xué)朝:主要兩個因素吧,一是翻譯的用戶場景和需求,二是機器翻譯技術(shù)變革。騰訊翻譯君是在公司鼓勵內(nèi)部創(chuàng)業(yè)的背景下,我們團隊孵化的一個項目。最初是為了幫助出國旅游的用戶解決語言問題,然后看到騰訊許多產(chǎn)品的用戶都有外語使用需求,有很好的結(jié)合場景。騰訊翻譯君是2016年發(fā)布的,在2016年之前的機器翻譯技術(shù)并沒有讓用戶非常滿意,我們觀察到神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)是一個新的機會,一個技術(shù)轉(zhuǎn)折點、并決定走這一新的技術(shù)路線。目前,大家都在用這套新的技術(shù)路線,各家又回到了新的起跑線。實際上,騰訊翻譯君全量部署與使用神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù),反而是業(yè)界最早的一批。

澎湃新聞:這兩年國內(nèi)外公司都在大力投入AI翻譯,你如何判斷AI翻譯市場的前景?

李學(xué)朝:這個市場還是有前景的,技術(shù)的演進讓AI翻譯質(zhì)量有了較大提升,在一些特定的領(lǐng)域或場景已經(jīng)可以輔助人類做更多事情,比如在旅游、會議等場景,多家公司也都推出了翻譯App,但當(dāng)前AI翻譯技術(shù)還在發(fā)展中,還沒有到完美的階段。目前學(xué)術(shù)圈研究熱度與各公司的技術(shù)升級迭代速度都保持的不錯,相信AI翻譯在與現(xiàn)有產(chǎn)品或行業(yè)結(jié)合的落地場景會有挺多機會與新的嘗試。

比如,騰訊翻譯君現(xiàn)在已將AI翻譯的能力以服務(wù)的方式在騰訊云和AI開放平臺開放出來了,包括微信、QQ、QQ瀏覽器、王者榮耀海外版(AOV)、金山詞霸、VIPKID、富途等幾十個產(chǎn)品或不同行業(yè)的客戶在使用。目前,騰訊翻譯君這套服務(wù)每天請求數(shù)量已經(jīng)超過4億次了,騰訊同傳近期也入圍了中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟組織的《中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟人工智能技術(shù)和應(yīng)用案例集》。我們希望騰訊翻譯君賦能合作伙伴,也期望與行業(yè)一起合作讓AI翻譯更強大。

澎湃新聞:科大訊飛和搜狗推出了翻譯機硬件產(chǎn)品,騰訊未來會不會做翻譯機?

李學(xué)朝:我們要看翻譯機是否能更好滿足一些用戶需求或場景。目前也有一些廠商找我們溝通,在未來,我們不排除這種可能性,目前還沒一個確定的結(jié)論。

澎湃新聞:如何理解翻譯機這種產(chǎn)品形態(tài)?我可以用手機翻譯,為什么還要再拿一個翻譯機呢?而且翻譯機的價格還不低,都要一千元以上,相當(dāng)于買一個手機的價格了。

李學(xué)朝:你說的這一點確實很認同,也是我們在考慮的問題。現(xiàn)在看這個市場很火,出貨量各方面在升溫,肯定也是有需求和場景的,我們是抱著一個開放的態(tài)度,持續(xù)去關(guān)注這個事情。

澎湃新聞:騰訊內(nèi)部,有幾個團隊在做AI翻譯?

李學(xué)朝:騰訊內(nèi)部有賽馬機制,騰訊內(nèi)部做同傳也有幾個方案。騰訊同傳是基于騰訊翻譯君和微信智聆研發(fā)的一套方案。2017年底,我們公司年會,有兩套同傳系統(tǒng)同時為年會服務(wù)。公司幾個大老板現(xiàn)場演講,兩套同傳系統(tǒng)在左右兩邊同時輸出PK,這個事件對我們的觸動是非常大的。最后結(jié)果出來以后,讓我們看到AI翻譯在會議同傳方面可以做更多的事情,所以我們這兩個團隊又都做了更多演化,然后在更多的會議應(yīng)用和實踐。

    責(zé)任編輯:孫扶
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司