人民網(wǎng)北京9月30日電 (記者夏曉倫)隨著人工智能技術(shù)的飛速發(fā)展,數(shù)字人產(chǎn)業(yè)逐漸成為科技領(lǐng)域的新興熱點。近年來,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術(shù)的不斷融合,為數(shù)字人的誕生和發(fā)展提供了堅實的技術(shù)基礎(chǔ)。
近日,2024(首屆)中國數(shù)字人大會在北京中關(guān)村舉行。大會由中國互聯(lián)網(wǎng)協(xié)會主辦,以“數(shù)字人應(yīng)用與未來”為核心議題。本次大會上,由中國互聯(lián)網(wǎng)協(xié)會牽頭撰寫的《中國數(shù)字人發(fā)展報告(2024)》正式發(fā)布,解讀了數(shù)字人技術(shù)革新、應(yīng)用現(xiàn)狀與產(chǎn)業(yè)前景,為行業(yè)發(fā)展提供了洞見與指導(dǎo)。
同時,社會對智能化、個性化服務(wù)的需求日益增長,也促使數(shù)字人產(chǎn)業(yè)不斷探索新的應(yīng)用場景和商業(yè)模式。從虛擬客服到智能主播,從數(shù)字助手到虛擬偶像,數(shù)字人在各個領(lǐng)域逐漸嶄露頭角,受到了廣泛的關(guān)注。
大會舉辦期間,眾多前沿數(shù)字人產(chǎn)品成果亮相。以智譜數(shù)字人團隊打造的AI主持人為例,其采用2.5D真人形象復(fù)刻技術(shù)及超高清圖像采集處理技術(shù),打造的高仿真、可控虛擬數(shù)字人。其特點在于解決了口型匹配難題,通過深度學(xué)習(xí)匹配音頻信號,生成自然口型動畫,讓數(shù)字人發(fā)聲栩栩如生。
據(jù)了解,相較于真人驅(qū)動,該技術(shù)成本低、仿真度高、可控性強,能按需生成視頻,激發(fā)創(chuàng)作者創(chuàng)意,呈現(xiàn)多元的視聽效果。這一案例也入選了《中國數(shù)字人發(fā)展報告(2024)》典型案例集。
該團隊負責(zé)人杜冀中表示,智譜專注于通過人工智能技術(shù)賦能數(shù)字人,支持市面上主流的2D、3D兩種數(shù)字人方向,技術(shù)層面聚焦于數(shù)字人的口型表情、肢體動作以及基于GLM大模型的智能對話。目前,落地場景已覆蓋PC端、移動端、大屏等幾乎所有的屏幕場景。
業(yè)內(nèi)人士分析認為,參展企業(yè)不僅展示了其在數(shù)字人領(lǐng)域的最新成果與前瞻布局,更與業(yè)界同仁建立了更加緊密的合作關(guān)系。相關(guān)企業(yè)要持續(xù)深化技術(shù)創(chuàng)新與應(yīng)用探索,與行業(yè)伙伴共同推動數(shù)字人產(chǎn)業(yè)的高質(zhì)量發(fā)展。