中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

DeepL發(fā)展史:一家初創(chuàng)公司與機(jī)器翻譯巨頭的抗?fàn)?/h1>
2024-01-25 16:46
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
聽(tīng)全文
字號(hào)

AI翻譯顛覆了我們的溝通方式,也以前所未有的方式打破了語(yǔ)言溝通障礙。預(yù)計(jì)到2026年,該行業(yè)的全球市場(chǎng)規(guī)模將增長(zhǎng)至123億美元,而無(wú)數(shù)參與者都希望能從中分得一杯羹。

而總部位于德國(guó)科隆的DeepL,卻憑借著初創(chuàng)身份與谷歌、微軟等科技巨頭一路競(jìng)逐,不斷提高著機(jī)器翻譯的行業(yè)標(biāo)準(zhǔn)。

這家年輕企業(yè)的首款產(chǎn)品是在線(xiàn)詞典Linguee,自計(jì)算機(jī)科學(xué)家Jarek Kutylowski兼公司CEO于2017年創(chuàng)立以來(lái)始終保持高速發(fā)展。

Kutylowski出生于波蘭,12歲時(shí)移居德國(guó),剛轉(zhuǎn)學(xué)時(shí)甚至一句德語(yǔ)都不會(huì)說(shuō)。這讓年少的他第一次認(rèn)識(shí)到語(yǔ)言的重要性,以及跨語(yǔ)言交流的巨大難度。

時(shí)間快進(jìn)到2017年,他創(chuàng)立DeepL的初衷,是意識(shí)到神經(jīng)網(wǎng)絡(luò)這項(xiàng)突破性技術(shù)有望以前所未有的方式徹底攻克難題。他表示:“我們猜測(cè)機(jī)器翻譯應(yīng)該會(huì)朝著這個(gè)方向發(fā)展,也相信這項(xiàng)技術(shù)將發(fā)揮巨大作用。看準(zhǔn)了這個(gè)機(jī)會(huì),我們鼓起勇氣想要?jiǎng)?chuàng)造一些偉大的成果?!?/p>

神經(jīng)機(jī)器翻譯(NMT)就是基于神經(jīng)網(wǎng)絡(luò)的翻譯技術(shù),已經(jīng)成為迄今為止最為成功的機(jī)器翻譯方法。與之前的版本相比,這項(xiàng)技術(shù)更快、更準(zhǔn)確、資源占用更少也更易于擴(kuò)展。

DeepL使用該技術(shù)提供免費(fèi)的高質(zhì)量翻譯服務(wù),且主要面向B2B市場(chǎng)。自公司成立以來(lái),他們已經(jīng)服務(wù)了10億以上的用戶(hù),目前擁有超過(guò)2萬(wàn)家企業(yè)客戶(hù),其中不乏愛(ài)思唯爾、富士通和Mastodon等知名公司。

Kutylowski解釋道:“翻譯對(duì)企業(yè)來(lái)說(shuō)至關(guān)重要?,F(xiàn)如今,越來(lái)越多的企業(yè)開(kāi)始走向全球以開(kāi)拓海外市場(chǎng),希望能在更廣大的疆土上吸引客戶(hù)、創(chuàng)造價(jià)值?!?/p>

而對(duì)翻譯的主要需求,集中在那些涉及大量許可證的行業(yè),比如法律服務(wù)?!巴ㄟ^(guò)觀(guān)察,我們發(fā)現(xiàn)這也是客群需求最強(qiáng)烈的領(lǐng)域。”

截至目前,DeepL已經(jīng)支持橫跨歐亞大陸的31種語(yǔ)言。2023年,公司推出AI寫(xiě)作助手,也成功躋身獨(dú)角獸行列。盡管融資環(huán)境嚴(yán)峻,該公司還是在1月籌集到一筆數(shù)額不明的資金(估計(jì)為1億美元),目前市場(chǎng)估值達(dá)到10億歐元。

“世界上最好的”機(jī)器翻譯服務(wù)

DeepL自信地宣稱(chēng),能夠提供“世界上最好的”AI翻譯服務(wù)。而且與競(jìng)爭(zhēng)對(duì)手的產(chǎn)品相比,該公司的方案質(zhì)量更高,平均準(zhǔn)確率高達(dá)3倍。

自信滿(mǎn)滿(mǎn)的口號(hào)源自“盲測(cè)”結(jié)果,即由專(zhuān)業(yè)翻譯人員在不知文本來(lái)源的前提下挑選準(zhǔn)確率最高的翻譯結(jié)果。

通過(guò)一系列測(cè)試和實(shí)驗(yàn),我發(fā)現(xiàn)DeepL的表現(xiàn)確實(shí)名列前茅。我首先輸入了加繆《局外人》小說(shuō)中的一段話(huà),并分別用DeepL和谷歌翻譯將其從法語(yǔ)翻譯成英語(yǔ)。

盡管文學(xué)類(lèi)文本并不屬于這些工具的主要設(shè)計(jì)用途,但我還是決定從這個(gè)角度入手,畢竟純文學(xué)對(duì)AI系統(tǒng)來(lái)說(shuō)肯定更有難度。

可以想見(jiàn),文學(xué)翻譯相當(dāng)復(fù)雜,依靠的不止有對(duì)語(yǔ)言的熟悉程度。其中還涉及更高水平的創(chuàng)造力,對(duì)于作者觀(guān)點(diǎn)、文風(fēng)和社會(huì)歷史背景的深刻理解,同時(shí)要能在不同文化間實(shí)現(xiàn)語(yǔ)義轉(zhuǎn)換。

從續(xù)訂來(lái)看,DeepL的表現(xiàn)遠(yuǎn)遠(yuǎn)優(yōu)于谷歌。雖然它還是遺漏了一些隱喻性表達(dá),在某些意指和常識(shí)上也犯了錯(cuò)誤,但最終文本讀起來(lái)確實(shí)更接近原文的表述。

我用自己的一篇文章進(jìn)行了重復(fù)測(cè)試,希望復(fù)查翻譯工具是否確切表達(dá)了我說(shuō)的意思。這一次,任務(wù)是把英語(yǔ)文章翻譯成希臘語(yǔ)。

下面來(lái)看DeepL的翻譯結(jié)果:

再看看谷歌的翻譯結(jié)果:這次DeepL的表現(xiàn)仍然更好。盡管仍在幾處紕漏,但它的希臘語(yǔ)翻譯結(jié)果更細(xì)致、更自然,也更符合原文的含義。我知道很多朋友可能看不懂希臘語(yǔ),所以大家可以隨便找點(diǎn)文字自己測(cè)試一下,看我說(shuō)的對(duì)不對(duì)。

Kutylowski認(rèn)為,在不“閹割”的前提下用目標(biāo)語(yǔ)言表達(dá)正確的含義,首先得在準(zhǔn)確性和流暢性之間找到適當(dāng)?shù)钠胶?。而這在很大程度上要視語(yǔ)境而定。比如說(shuō),技術(shù)文檔對(duì)于準(zhǔn)確性要求更高,而營(yíng)銷(xiāo)文本則更多強(qiáng)調(diào)流暢性。

盡管面臨挑戰(zhàn),但他堅(jiān)信AI有能力掌握哪怕最復(fù)雜的語(yǔ)言。他補(bǔ)充道:“如果突然出現(xiàn)某種需要我們學(xué)習(xí)的外星語(yǔ)言,那么只要有足夠的翻譯材料作為支撐,我們沒(méi)準(zhǔn)同樣能訓(xùn)練出相應(yīng)的翻譯模型?!?/p>

DeepL的優(yōu)勢(shì)是什么?

Kutylowski對(duì)于市場(chǎng)競(jìng)爭(zhēng)似乎毫不擔(dān)心。他強(qiáng)調(diào),“我們一直都在跟大廠(chǎng)競(jìng)爭(zhēng)”,還提到谷歌翻譯仍是DeepL目前最大的競(jìng)爭(zhēng)對(duì)手。

在他看來(lái),這家初創(chuàng)公司的優(yōu)勢(shì)可以歸結(jié)為三大要素的結(jié)合:努力工作、優(yōu)秀團(tuán)隊(duì)還有專(zhuān)心一意。

“專(zhuān)心一意非常非常重要。翻譯并不是谷歌的核心業(yè)務(wù),只能算他們上百種服務(wù)中的一種。同樣的標(biāo)準(zhǔn)放在大語(yǔ)言模型和OpenAI方面也是一樣,翻譯只是他們關(guān)注的一個(gè)方向,他們必須把GPU分散在各種各樣不同的任務(wù)上。但我們只專(zhuān)注單一特定領(lǐng)域?!?/p>

從技術(shù)角度來(lái)看,DeepL的成功則源自其神經(jīng)網(wǎng)絡(luò)架構(gòu)、人類(lèi)編輯的輸入還有訓(xùn)練數(shù)據(jù)。

這家初創(chuàng)公司根據(jù)大量數(shù)據(jù)(主要來(lái)自互聯(lián)網(wǎng))進(jìn)行模型訓(xùn)練,并使用特殊的網(wǎng)絡(luò)爬蟲(chóng)來(lái)自動(dòng)查找翻譯并評(píng)估內(nèi)容質(zhì)量。他們還使用強(qiáng)化學(xué)習(xí)等方法向AI提供積極反饋,引導(dǎo)其不斷提升翻譯水平。

Kutylowski還補(bǔ)充道,另一個(gè)重點(diǎn)是在模型的翻譯能力和用目標(biāo)語(yǔ)言構(gòu)成句子之間尋找適當(dāng)?shù)钠胶??!盀榇耍覀冊(cè)趩握Z(yǔ)數(shù)據(jù)模型訓(xùn)練和目標(biāo)翻譯模型訓(xùn)練方面投入了大量精力,數(shù)學(xué)團(tuán)隊(duì)則負(fù)責(zé)處理大量細(xì)節(jié)?!?/p>

機(jī)器翻譯:新挑戰(zhàn),也是新機(jī)遇

Kutylowski承認(rèn),近期對(duì)于A(yíng)I熱潮的廣泛關(guān)注主要源自大語(yǔ)言模型(LLM),這也讓整體環(huán)境變得更具挑戰(zhàn)、節(jié)奏更快。

DeepL團(tuán)隊(duì)現(xiàn)在必須跟上發(fā)展的腳步:新模型層出不窮,開(kāi)源項(xiàng)目所在多有,學(xué)術(shù)研究和其他公司的成果都需要關(guān)注。

“如今的機(jī)器翻譯已經(jīng)掀起一波競(jìng)賽”,那要靠怎樣的策略才能在這場(chǎng)比賽中勝出?

在Kutylowski看來(lái),一方面當(dāng)然是不斷創(chuàng)新,確保采取正確的步驟來(lái)實(shí)現(xiàn)高質(zhì)量翻譯目標(biāo)。另外就是適當(dāng)投資,確保找到合適的資本和技術(shù)團(tuán)隊(duì)。

但與此同時(shí),人們對(duì)于A(yíng)I的關(guān)注和呈指數(shù)級(jí)增長(zhǎng)的發(fā)展速度也帶來(lái)了新的技術(shù)機(jī)遇?!坝行┦虑槲覀?cè)趦伞⑷昵熬涂紤]過(guò),但當(dāng)時(shí)的技術(shù)還不夠成熟?!?/p>比如說(shuō)貼合企業(yè)風(fēng)格的個(gè)性化翻譯和更具交互性的翻譯體驗(yàn)。DeepL還開(kāi)始研究票據(jù)翻譯,并從頭開(kāi)始訓(xùn)練自己的大語(yǔ)言模型。這在一定程度上要?dú)w功于他們新的超級(jí)計(jì)算機(jī)集群DeepL Mercury。

這些大模型有望進(jìn)一步提高翻譯質(zhì)量,并為用戶(hù)帶來(lái)新的交互工作流程。更多功能和應(yīng)用選項(xiàng)將在2024年內(nèi)陸續(xù)推出。

我們還需要學(xué)外語(yǔ)嗎?

機(jī)器翻譯既幫助更多人克服了跨語(yǔ)種溝通障礙,同時(shí)也提出了新的問(wèn)題:既然AI翻譯這么出色,未來(lái)我們是不是就沒(méi)必要學(xué)習(xí)外語(yǔ)了?

Kutylowski的回答是:“隨著AI的普遍進(jìn)步,我覺(jué)得全人類(lèi)都需要認(rèn)真思考一個(gè)問(wèn)題:我們需要學(xué)什么,我們想要學(xué)什么?”

他認(rèn)為如果單純是為了在異國(guó)他鄉(xiāng)工作和生活,那隨著科技的發(fā)展演進(jìn),學(xué)習(xí)語(yǔ)言的必要性確實(shí)會(huì)逐漸降低,但這并不代表學(xué)習(xí)外語(yǔ)的價(jià)值也將隨之下降。

他以數(shù)學(xué)為例,提到雖然在現(xiàn)實(shí)生活中我們根本用不到在學(xué)校里接觸過(guò)的大部分復(fù)雜方程,但學(xué)習(xí)數(shù)學(xué)的過(guò)程仍然非常重要,甚至可以說(shuō)是培養(yǎng)理性思考能力的根基。

語(yǔ)言學(xué)習(xí)也是如此。在學(xué)習(xí)一門(mén)語(yǔ)言的過(guò)程中,我們實(shí)際也是在學(xué)習(xí)如何形成思維和表達(dá)觀(guān)點(diǎn)——這對(duì)每個(gè)人的發(fā)展都至關(guān)重要。學(xué)習(xí)外語(yǔ)、特別是掌握跨語(yǔ)種思維能力,對(duì)于個(gè)人乃至整個(gè)社會(huì)都有著深遠(yuǎn)的積極意義。

研究表明,學(xué)習(xí)第二語(yǔ)言實(shí)際會(huì)改變大腦結(jié)構(gòu)。具體來(lái)講,它增加了灰質(zhì)密度(對(duì)應(yīng)大腦中的神經(jīng)元數(shù)量)和白質(zhì)完整性(即連接大腦中不同區(qū)域的神經(jīng)纖維系統(tǒng))。也就是說(shuō),學(xué)習(xí)外語(yǔ)不僅可以增強(qiáng)大腦整體功能,還有助于提高記憶力、注意力、集中力和其他關(guān)鍵認(rèn)知能力。

此外,大量研究已經(jīng)把語(yǔ)言學(xué)習(xí)跟良好的考試成績(jī)、就業(yè)能力、創(chuàng)造力、溝通技巧乃至跨文化認(rèn)知聯(lián)系了起來(lái)。

Kutylowski總結(jié)道:“因此,無(wú)論是出于個(gè)人興趣,還是大腦與性格的培養(yǎng)與發(fā)展,都應(yīng)該重視學(xué)習(xí)語(yǔ)言。哪怕手機(jī)上就有最好的翻譯工具,如果要結(jié)交來(lái)自不同國(guó)家的朋友、發(fā)展一段跨國(guó)戀情,至少得能做到直接交流。至少我不希望大家坐在一起,還在各自擺弄手機(jī)。”

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀(guān)點(diǎn),不代表澎湃新聞的觀(guān)點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪(fǎng)問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶(hù)端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司