10月18日,捷通華聲宣布正式推出靈云離線式語音識別(ASR)技術(shù),該技術(shù)能力已在靈云智能人機(jī)交互能力開放平臺(簡稱靈云平臺)正式上線,用戶可以到靈云平臺(.hcicloud)下載、體驗、使用最新靈云離線式語音識別技術(shù)。
靈云離線式語音識別技術(shù)將包括詞表識別、語法識別、“自由說”識別三個部分,由于采用了最新算法、引擎設(shè)計,識別率取得突破性提升,其中詞表識別和語法識別離線語音識別率已提高到97%以上。同時,在實時率、加載時間和資源占用率等技術(shù)性能均得到大幅優(yōu)化,能夠很好滿足目前各種移動終端的應(yīng)用需求。靈云離線式語音識別技術(shù)主要應(yīng)用于各種移動終端,保證用戶在無網(wǎng)絡(luò)環(huán)境下依然可以應(yīng)用語音識別技術(shù),應(yīng)用語音流暢地與各種數(shù)字設(shè)備進(jìn)行溝通交流。
語音識別技術(shù)由于運(yùn)算量大,目前應(yīng)用語音識別技術(shù)各種智能移動終端與應(yīng)用多采用“云“端語音識別技術(shù)服務(wù)。由于現(xiàn)實生活工作中,網(wǎng)絡(luò)并不能覆蓋所有環(huán)境,同時很多用戶也擔(dān)心流量增加導(dǎo)致使用費(fèi)用的增長,因此完全依賴“云”端語音識別技術(shù)造成了用戶的很大的不便。靈云離線式語音識別技術(shù),是靈云平臺“云”端語音識別技術(shù)的延伸,該項技術(shù)的推出,將有效幫助用戶擺脫應(yīng)用語音識別對“云”端的完全依賴,滿足用戶在沒有網(wǎng)絡(luò)的環(huán)境下,仍然能夠方便使用語音識別技術(shù)能力。全新的靈云離線語音識別通過在智能移動終端中加載離線語音識別引擎、離線語音包,對語音進(jìn)行本地化聲學(xué)模型、語言模型的處理,從而使各種智能移動設(shè)備實現(xiàn)本地化應(yīng)用和語音識別技術(shù)的需求。此次采用全新引擎的靈云離線式語音識別技術(shù),具有識別率高、識別速度快、低運(yùn)算資源占用、低內(nèi)存消耗的特性,能夠滿足更多終端設(shè)備的使用,保證用戶更好的在無網(wǎng)絡(luò)狀態(tài)下應(yīng)用語音識別技術(shù)的體驗與感受。
靈云——全方位智能人機(jī)交互(HCI)能力開放平臺是捷通華聲全力打造的HCI技術(shù)云服務(wù)平臺。靈云是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機(jī)、計算機(jī)等數(shù)字設(shè)備的網(wǎng)絡(luò)云服務(wù),其目標(biāo)是讓人機(jī)交互像人與人溝通一樣的簡單自然。靈云目前以“云 + 端”方式,為用戶提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學(xué)字符識別(OCR)和自然語言理解(NLU)五項核心技術(shù)能力,是目前中國、乃至世界第一個也是最大最全的HCI技術(shù)云服務(wù)平臺。靈云平臺致力于面向中國,未來能夠向國際市場提供一個全方位HCI技術(shù)能力提供、HCI技術(shù)服務(wù)、HCI產(chǎn)業(yè)交流的平臺。
面對移動互聯(lián)網(wǎng)產(chǎn)業(yè)的高速發(fā)展,為全面滿足用戶需求,捷通華聲靈云平臺面向開發(fā)者提供包含“云 + 端”語音識別與“云 + 端”語音合成一體化智能語音解決方案,不僅能夠全面系統(tǒng)地滿足企業(yè)與設(shè)備開發(fā)商的需求,也同時能夠更好地為用戶提供個性化的服務(wù),滿足用戶使用不同設(shè)備、在不同應(yīng)用場景下,享受智能語音交互技術(shù)帶來的方便與快捷。
目前,包含靈云離線式語音識別在內(nèi)的靈云智能語音解決方案,已經(jīng)為百度地圖、導(dǎo)航犬、搜狗語音助手、嘀嘀打車、搖搖招車、快說語音助手等深受億萬大眾歡迎的眾多應(yīng)用提供智能語音能力支持服務(wù)。為更廣泛應(yīng)用智能語音技術(shù),靈云平臺同時為智能家電、車聯(lián)網(wǎng)、可穿戴式設(shè)備等領(lǐng)域的用戶提供定制智能解決方案。相信此次靈云離線式語音識別技術(shù)的推出,必將更進(jìn)一步為企業(yè)、社會大眾提供更為豐富、更為全面的智能語音技術(shù)服務(wù)。