1. <kbd id="hxllo"></kbd>
        <th id="hxllo"></th>

          首頁(yè)  ?  教育  ?  教育資訊

          “一帶一路”需過(guò)語(yǔ)言關(guān) 網(wǎng)絡(luò)機(jī)器翻譯蓄勢(shì)待發(fā)

          “一帶一路”需過(guò)語(yǔ)言關(guān) 網(wǎng)絡(luò)機(jī)器翻譯蓄勢(shì)待發(fā)

          2015-05-27 10:56:00

          來(lái)源:科技日?qǐng)?bào)

            具有深遠(yuǎn)意義的“一帶一路”戰(zhàn)略構(gòu)想涉及俄羅斯、印度、泰國(guó)等超過(guò)六十個(gè)國(guó)家,近四十億人口,四十多種語(yǔ)言,將極大的促進(jìn)沿線各國(guó)的深度合作和交流。

            提到合作與交流,首先擺在我們面前的便是語(yǔ)言問(wèn)題。如何跨越語(yǔ)言障礙,實(shí)現(xiàn)各國(guó)互聯(lián)互通呢?全球一體化時(shí)代,單靠人力顯然是不能完成這樣的艱巨任務(wù)。好在科技的進(jìn)步給我們提供了解決方案,以機(jī)器取代人,讓機(jī)器扮演翻譯這一重要角色,不僅具有很強(qiáng)的戰(zhàn)略意義,在實(shí)際經(jīng)濟(jì)和文化生活中也舉足輕重。

            顯然,這并不是一項(xiàng)輕松的工作,機(jī)器翻譯需要凝聚計(jì)算機(jī)、認(rèn)知科學(xué)、語(yǔ)言學(xué)、信息論等學(xué)科的知識(shí),是人工智能的終極目標(biāo)之一。國(guó)內(nèi)外的一些行業(yè)巨擘都在這一領(lǐng)域發(fā)力,努力研發(fā)出具備高度可用性的機(jī)器翻譯技術(shù)。百度也是這一領(lǐng)域的佼佼者,聯(lián)合了國(guó)內(nèi)頂級(jí)學(xué)術(shù)機(jī)構(gòu)展開(kāi)研究,中國(guó)科學(xué)院自動(dòng)化研究所、浙江大學(xué)、哈爾濱工業(yè)大學(xué)、中國(guó)科學(xué)院計(jì)算技術(shù)研究所和清華大學(xué)等悉數(shù)在列。

            爆發(fā)式增長(zhǎng)的數(shù)據(jù)規(guī)模給機(jī)器翻譯帶來(lái)新的想象空間,百度依托得天獨(dú)厚的大數(shù)據(jù)優(yōu)勢(shì),取得了機(jī)器翻譯核心技術(shù)的多項(xiàng)突破。

            先進(jìn)的機(jī)器翻譯背后蘊(yùn)含著怎樣的高科技呢?下面我們一探究竟。

            互聯(lián)網(wǎng)學(xué)霸:

            高質(zhì)量翻譯知識(shí)獲取技術(shù)

            蹣跚學(xué)步是新生兒必須經(jīng)歷的過(guò)程,當(dāng)一個(gè)人接觸到翻譯這個(gè)工作的時(shí)候, 熟悉和掌握大量的雙語(yǔ)詞句就是這個(gè)學(xué)步的過(guò)程。只有了解了大量語(yǔ)句的常用翻譯方法,才可以舉一反三,融會(huì)貫通。我們可以將這個(gè)過(guò)程理解為“背誦例句”的過(guò)程。作為個(gè)人,要背誦成百上千的例句就頗為不易,挑燈夜戰(zhàn),痛苦不堪,往往還需要反復(fù)背誦以加深記憶。

            百度機(jī)器翻譯同樣有著這樣“背誦例句”的過(guò)程,所不同的是,它的背誦能力超出了大多數(shù)人的想象。

            百度研發(fā)了基于互聯(lián)網(wǎng)大數(shù)據(jù)的高質(zhì)量翻譯知識(shí)獲取技術(shù),突破了傳統(tǒng)翻譯知識(shí)獲取規(guī)模小、成本高的瓶頸?;ヂ?lián)網(wǎng)就是百度機(jī)器翻譯的語(yǔ)料庫(kù)的來(lái)源,而基于網(wǎng)頁(yè)自主拓?fù)浣Y(jié)構(gòu)和內(nèi)容互譯計(jì)算的語(yǔ)料獲取方法,也解決了互聯(lián)網(wǎng)翻譯知識(shí)質(zhì)量控制的難題。

            百度機(jī)器翻譯“背誦例句”的規(guī)模有多大,通過(guò)一個(gè)數(shù)據(jù)可以窺豹一斑:“例句”的數(shù)量如果按照字?jǐn)?shù)換算成《大英百科全書》,翻譯系統(tǒng)在一周內(nèi)學(xué)習(xí)的內(nèi)容相當(dāng)于千萬(wàn)部《大英百科全書》。

            即便是最強(qiáng)悍的人類學(xué)霸,在這種規(guī)模的語(yǔ)料學(xué)習(xí)前也將一敗涂地。

            翻譯方法的突破:

            基于互聯(lián)網(wǎng)大數(shù)據(jù)的翻譯方法

            如果將互聯(lián)網(wǎng)大數(shù)據(jù)比喻為浩瀚的大海,傳統(tǒng)方法猶如一葉扁舟,難以應(yīng)對(duì)互聯(lián)網(wǎng)大數(shù)據(jù)帶來(lái)的沖擊。要想顯著的提高翻譯質(zhì)量,必須打破傳統(tǒng)方法的束縛,打造能夠乘風(fēng)破浪的翻譯航空母艦。

            百度翻譯提出了基于互聯(lián)網(wǎng)大數(shù)據(jù)的機(jī)器翻譯模型,融合了多種翻譯策略,并實(shí)現(xiàn)了機(jī)器翻譯云平臺(tái)與算法的充分優(yōu)化與融合。一天之內(nèi)即可完成全網(wǎng)超過(guò)2000億網(wǎng)頁(yè)雙語(yǔ)資源的模型訓(xùn)練,穩(wěn)定響應(yīng)每天近億次的翻譯請(qǐng)求。

            舉一反三 融會(huì)貫通:

            樞軸語(yǔ)言機(jī)器翻譯技術(shù)

            盡管互聯(lián)網(wǎng)帶來(lái)了數(shù)據(jù)量的激增,但是數(shù)據(jù)量是不均衡的。對(duì)于很多小語(yǔ)種而言,互聯(lián)網(wǎng)上的數(shù)據(jù)仍然非常匱乏,比如哈薩克語(yǔ)、斯洛文尼亞語(yǔ)、泰語(yǔ)等。俗話說(shuō)“巧婦難為無(wú)米之炊“,如何開(kāi)發(fā)高質(zhì)量的小語(yǔ)種翻譯系統(tǒng),是一個(gè)世界級(jí)難題。

            百度提出了樞軸語(yǔ)言機(jī)器翻譯技術(shù),攻克了機(jī)器翻譯語(yǔ)種覆蓋度受限的難題,使得資源稀缺的小語(yǔ)種翻譯成為可能。以樞軸語(yǔ)言為橋梁,充分挖掘“源語(yǔ)言-樞軸語(yǔ)言”以及“樞軸語(yǔ)言-目標(biāo)語(yǔ)言”之間潛在的對(duì)應(yīng)關(guān)系,構(gòu)建大規(guī)模高質(zhì)量翻譯模型。例如,開(kāi)發(fā)高質(zhì)量的“中-泰”翻譯系統(tǒng),可以以英語(yǔ)作為樞軸語(yǔ)言,通過(guò)“中-英”“英-泰“的豐富資源建立”中-泰“翻譯模型。

            通過(guò)以上技術(shù),在小語(yǔ)種資源匱乏的情況下,降低了新語(yǔ)種資源獲取和新翻譯方向開(kāi)發(fā)的成本,平均11天部署1個(gè)新語(yǔ)種。而如果是讓人類從零開(kāi)始掌握一門語(yǔ)言,11天無(wú)疑是天方夜譚,即便是對(duì)于傳統(tǒng)的機(jī)器翻譯技術(shù)來(lái)說(shuō),新語(yǔ)言部署周期動(dòng)輒需要數(shù)月或數(shù)年的時(shí)間。

            百度翻譯助力一帶一路騰飛

            機(jī)器翻譯一直被公認(rèn)為是人工智能領(lǐng)域最難的課題之一。讓機(jī)器理解語(yǔ)言,進(jìn)而實(shí)現(xiàn)不同語(yǔ)言之間的翻譯,是人類一直以來(lái)的夢(mèng)想。

            互聯(lián)網(wǎng)大數(shù)據(jù)給機(jī)器翻譯研究帶來(lái)新的機(jī)遇和挑戰(zhàn),使得海量翻譯知識(shí)的自動(dòng)獲取和實(shí)時(shí)更新成為可能,百度翻譯在機(jī)器翻譯系統(tǒng)框架、翻譯模型與算法、多語(yǔ)種翻譯技術(shù)等方面取得重大突破,自主研發(fā)了基于互聯(lián)網(wǎng)大數(shù)據(jù)的機(jī)器翻譯系統(tǒng),使我國(guó)掌握了使我國(guó)掌握了互聯(lián)網(wǎng)機(jī)器翻譯的核心技術(shù),占據(jù)了該領(lǐng)域的技術(shù)制高點(diǎn)。

            目前,百度翻譯覆蓋了全球超過(guò)5億用戶,每日響應(yīng)近億次的翻譯請(qǐng)求,百度翻譯開(kāi)放平臺(tái)為上萬(wàn)個(gè)第三方應(yīng)用提供免費(fèi)服務(wù),即幫助普通用戶跨語(yǔ)言獲取信息和服務(wù),自由溝通和交流,也促進(jìn)了國(guó)際貿(mào)易、跨境經(jīng)濟(jì)文化合作。

            習(xí)近平主席對(duì)一帶一路有一個(gè)形象的比喻:如果將“一帶一路”比喻為亞洲騰飛的兩只翅膀,那么互聯(lián)互通就是兩只翅膀的血脈經(jīng)絡(luò)。而我們相信,百度翻譯將給這對(duì)翅膀提供飛翔的動(dòng)力。

            □ 本報(bào)記者 向 陽(yáng)

          • 相關(guān)閱讀
          免責(zé)聲明:本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無(wú)法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。
          国产精品久久影视,国产中文字幕在线,色综合久久88色综合天天免费,国产成人精品免费av 国产精品白浆无码流出嗯啊豆 国产精品一区精品国产自在

          1. <kbd id="hxllo"></kbd>
              <th id="hxllo"></th>