吳華博士印象
初見吳華博士,你會為她溫柔舒雅的風范吸引。略帶南方口音纖軟的聲調,親切隨性的笑容,讓人感覺容易接近的同時,也不禁疑惑,這樣一個纖纖女子,如何帶領團隊攻克機器翻譯這一公認的世界性難題,打造出廣受用戶喜愛的百度翻譯產品?
訪談的話題從吳華博士從事的自然語言處理技術切入,纖纖女子變身女科學家,高端精深的技術術語以溫軟的女聲娓娓道來,百度翻譯的技術藍圖,從技術推動產品到技術與產品完美結合,百度翻譯這款體現(xiàn)百度使命的技術型產品漸漸變得清晰生動,象牙塔里的機器翻譯技術也漸漸變得熟悉易懂。吳華博士侃侃而談,思路流暢而活躍,眼睛里閃著睿智的光。
女科學家和百度翻譯
作為百度翻譯技術負責人和團隊的創(chuàng)始人之一,吳華博士在機器翻譯及自然語言處理領域浸潤多年,負責過多項機器翻譯的研究與開發(fā)工作,開發(fā)了多款自然語言處理(NLP)產品,申請專利20余件、發(fā)表論文30余篇。豐碩的研究成果得到國際學術界的廣泛認可。2011年吳華受邀擔任NLP領域重要國際會議IJCNLP的機器翻譯領域主席(Area Chair),2012年擔任NLP領域最好的國際學術會議ACL的機器翻譯領域主席。去年,她又被遴選為ACL 2014年的程序主席(Program Chair),在國際會議中,程序主席承擔著最重要的學術職責,也代表著世界級的學術地位和影響力。對技術的深刻理解和宏觀把握,也讓她在百度得到認可,榮任百度主任研究員,自然語言處理部技術負責人。她積累多年的研究經(jīng)驗,在百度的三年間開花,結果,并且漸成枝葉繁茂之勢。
這三年間,吳華博士負責的百度翻譯項目從無到有,依托百度作為最大中文搜索引擎所擁有的海量的雙語資源,從開發(fā)基本翻譯系統(tǒng)到攻克技術難題,從上線單一的web自動翻譯到布局多語言、多形式、多入口的產品形態(tài),不僅使百度翻譯逐步成長為一款廣受喜愛的互聯(lián)網(wǎng)產品,也彰顯了百度技術實力,提升了百度技術影響力。
這一切的背后,是這位女科學家以自己在機器翻譯和自然語言處理領域的深厚積累和對新技術新方法的敏銳感知,制定了綜合利用各種機器翻譯技術和資源的、面向互聯(lián)網(wǎng)應用的技術策略。實現(xiàn)這一策略的是依托百度人才成長機制、吳華博士參與組建并精心培養(yǎng)起來的百度翻譯團隊。
當今互聯(lián)網(wǎng)用戶的翻譯需求錯綜復雜,有跨語言聊天的需求,有利用翻譯進行跨語言貿易的需求,有利用翻譯產品多語言資源學習外語的需求,有瀏覽外語網(wǎng)頁,獲取更多資訊的需求,不一而足。吳華博士介紹說,與業(yè)界同類產品相比,百度翻譯擁有卓越的機器翻譯核心技術、領先的語料挖掘和過濾技術以及高效的海量計算技術。百度翻譯通過高效的數(shù)據(jù)挖掘技術從網(wǎng)頁庫中自動發(fā)現(xiàn)和獲取雙語資源,采用機器學習的方法更有效地平衡雙語語料的覆蓋率和準確率,在此基礎上研發(fā)的混合翻譯系統(tǒng),結合自動聚類,主題模型等先進技術,能夠靈活應對各種翻譯需求,使各個領域的翻譯更加精準。
在解釋復雜的技術策略時,女科學家舉了互聯(lián)網(wǎng)上調侃型翻譯的例子,生動有趣。如翻譯“how old are you”時,就會被互聯(lián)網(wǎng)中大量存在的調侃型翻譯“怎么老是你”干擾,而百度翻譯能夠智能甄別和過濾,并給出正確的翻譯結果。
除了攻克各種技術難題,竭力為用戶提供高質量翻譯結果,吳華博士和百度翻譯團隊想用戶之所想,開發(fā)了多種產品形態(tài),涵蓋web在線翻譯、詞典例句查詢、論文輔助寫作、跨語言檢索、移動翻譯APP等,多方位,更便捷地滿足用戶的翻譯需求。Web在線翻譯截止目前為止,已支持7種語言18個方向的翻譯,且翻譯質量業(yè)內領先。值得一提的百度翻譯移動APP,是吳華博士帶領團隊順應時代形勢,滿足移動用戶跨語言交流的需求而精心打造的產品。利用APP的語音翻譯、情景例句以及離線翻譯等功能,用戶真正體驗了隨時隨地、無障礙跨語言交流。