更強(qiáng)大的語音識別
采用國際前沿的端到端語音語義一體化建模算法,將語音快速準(zhǔn)確識別為文字,支持一句話識別、語音
內(nèi)容分析、機(jī)器人對話、智能質(zhì)檢等多個(gè)場景
端到端識別
魯棒性好,準(zhǔn)確率高,統(tǒng)一實(shí)時(shí)與非實(shí)時(shí)應(yīng)用場景模型
話音降噪
智能對過檢音頻進(jìn)行降噪處理,有效提高語音識別效果
專屬模型
自定義聲學(xué)以及語言模型優(yōu)化
更準(zhǔn)確的識別服務(wù)
場景化識別
基于transformer結(jié)構(gòu)+self-attention機(jī)制的端到端語音識別模型,采用數(shù)萬小時(shí)行業(yè)精標(biāo)數(shù)據(jù),結(jié)合知識庫、FAQ等信息,重現(xiàn)對話情景,自動讓機(jī)器人在場景化領(lǐng)域做識別
多樣化信息
定制化場景豐富的識別結(jié)果輸出,不僅能夠輸出one-best結(jié)果,同時(shí)輸出n-best多候選以及音素,為自然語言理解提供豐富多樣化信息
可讀易懂
采用大規(guī)??头υ挃?shù)據(jù),基于深度學(xué)習(xí)的方法,對語音內(nèi)容理解并進(jìn)行智能斷句,讓結(jié)果更可讀與可懂
準(zhǔn)確率領(lǐng)先
基于上下文語義,采用大數(shù)據(jù)分析,對內(nèi)容實(shí)時(shí)動態(tài)糾錯(cuò),自動過濾敏感詞等;提供自定義聲學(xué)以及語言模型優(yōu)化