從ASR技術(shù)層面上來說,智能客服不智能的原因在哪里?
文章摘要:“我要找人工客服!”“對不起,小智聽不懂你的問題,您是想要咨詢訂單進(jìn)度嗎?”“我要找人工客服??!”“對不起,小智聽不懂你的問題,您是想要咨詢訂單進(jìn)度嗎?”“。。我買的衣服沒剪吊牌,但是不小心...
本文目錄
“我要找人工客服!”
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進(jìn)度嗎?”
“我要找人工客服?。 ?/p>
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進(jìn)度嗎?”
“。。我買的衣服沒剪吊牌,但是不小心劃了一下,沒破,有個印子,還能退貨嗎?”
“關(guān)于退貨問題,您只需要在訂單也點擊退貨選項即可,我家支持7天無理由退貨哦~”
“那衣服被劃了一道,還能退嗎?”
“關(guān)于退貨問題,您只需要在訂單也點擊退貨選項即可,我家支持7天無理由退貨哦~”
“。。你不是小智,你是個小智障吧”
“對不起,小智聽不懂你的問題,您是想要咨詢訂單進(jìn)度嗎?”
這個場景是不是似曾相識?是不是你說啥,智能客服都聽不懂,回答的驢唇不對馬嘴。然后想找人工客服,死活找不到入口,最后浪費半小時,除了把自己氣的半死外,啥問題都沒解決。
不僅這一個問題讓人抓狂,智能客服想找到對應(yīng)問題解答區(qū)間同樣十分費勁,因為這需要客戶一直按照提示音,點點點。這浪費了大量時間,等找到問題解決辦法了,黃花菜都涼了。到底是人性的毀滅還是道德的淪喪,讓這樣的事情頻頻發(fā)生在我們身上,智能客服為啥就變成了智障客服呢?問題到底出在哪?
要想知道這個原因,首先我們需要搞清楚人工智能客服的商業(yè)模式。目前市場上主要的商業(yè)模式分為兩種:一種是定制化模式,智能客服供應(yīng)商根據(jù)企業(yè)自身業(yè)務(wù)需求進(jìn)行靈活、定制化開發(fā),可以更加精準(zhǔn)地解決用戶在咨詢過程的問題。當(dāng)然價格也相應(yīng)更高,一套定制化智能客服系統(tǒng)的價格在幾十萬到上百萬之間,可以買的起的企業(yè)自然都是資金流充足的大型企業(yè);第二種是智能客服供應(yīng)商在云端給企業(yè)開通智能客服賬戶,公用一套通用模版,定制化程度低,一個賬戶的年費用在千元至萬元不等。像一些中小型企業(yè)受限于資金問題,會選擇這個模式,這也就導(dǎo)致了識別不精確,步驟繁瑣等問題頻出。
智能客服核心應(yīng)用技術(shù)之ASR
但“智能客服不智能”這個問題不能光歸咎于企業(yè)沒錢買不起貴系統(tǒng)上,其中也存在一些技術(shù)層面上的問題,比如在ASR( Automatic Speech Recognition),即語音識別技術(shù)上存在的問題。
語音識別的一般流程為根據(jù)輸入的語音,提取語音特征,通過解碼器融合訓(xùn)練好的語言模型和聲學(xué)模型,得到最終的詞序列結(jié)果。字典的作用根據(jù)聲學(xué)模型識別出來的音素(漢語中一般為聲韻母),來找到對應(yīng)的漢字(詞)或者單詞,用來在聲學(xué)模型和語言模型建立橋梁,將兩者聯(lián)系起來。其中各類模型具體作用分別是:
1、?聲學(xué)模型:描述在給定詞的情況下,對應(yīng)聲學(xué)信號的概率。
2、語言模型:描述語言序列關(guān)系的模型,關(guān)注序列產(chǎn)生的概率。
3、解碼器:根據(jù)聲學(xué)模型和語言模型,搜索出最有可能的詞序列,其本質(zhì)是一個動態(tài)規(guī)劃算法。
在語音識別過程中,總會遇到各種問題,在你咨詢智能客服,其回答“抱歉,我聽不懂您在說什么”或者“不好意思,請您再重復(fù)一遍”時,就表示對話失敗,ASR沒有成功識別。
而導(dǎo)致ASR識別失敗的原因大多出于以下三點:
1、噪音問題
在實際應(yīng)用中,用戶在與語音機(jī)器人溝通的過程中,所處的空間是具備多樣性的。比如顧客在地鐵上、超市中等戶外場景咨詢時,周邊人聲噪音就會對語音識別造成影響,又比如外賣員、快遞員在送貨的過程中,風(fēng)聲、喇叭聲、行駛聲等,一樣會對語音識別造成影響。
2、口音問題
口音問題則包含方言以及口音不準(zhǔn)的問題,正所謂“十里不同音,百里不同俗”。我國幅員遼闊,擁有五大語系,共有80種以上細(xì)分語言。各方言區(qū)內(nèi),又分布著若干次方言和許多種土語,語言隔閡難以解除,口音也很難糾正。語言識別無疑是十分困難的事情。
3、實體識別
通俗來說,語音識別模型就是一個概率模型,當(dāng)語音傳入語音識別模型中,輸出為日常生活中常用到的詞語與句子的概率是高于其他稀疏詞的。而人名、地名、機(jī)構(gòu)名、專有名詞、藥名等均屬于稀疏詞,企業(yè)不常用到,所以在對特定詞語的識別上就會十分困難。
目前應(yīng)用的前沿技術(shù)是什么?(以沃豐科技相關(guān)技術(shù)為例)
1、垂直領(lǐng)域數(shù)據(jù)訓(xùn)練
相較于通用數(shù)據(jù),沃豐科技專注于客服領(lǐng)域,已經(jīng)為超過60家世界500強、200家中國500強客戶提供服務(wù),沉淀了大量可用于模型訓(xùn)練的客服數(shù)據(jù),能夠支撐沃豐科技對模型進(jìn)行深度的優(yōu)化。
2、端到端技術(shù)方案
與BAT企業(yè)相比,沃豐科技率先完成了從pipeline到端到端到技術(shù)改進(jìn),能將輸入語音直接進(jìn)行轉(zhuǎn)化,而傳統(tǒng)pipeline串聯(lián)過程中會有信息的遺失,信息轉(zhuǎn)化,轉(zhuǎn)化鏈路長。端到端的技術(shù)則轉(zhuǎn)化鏈路短、速度快,目前沃豐科技在這一過程中也實現(xiàn)了模型深度優(yōu)化。
3、語言與聲學(xué)模型結(jié)合
熱詞優(yōu)化方面,行業(yè)內(nèi)對詞語進(jìn)行少量優(yōu)化的情況下,都會用熱詞的方案,比如優(yōu)化姓名、地址、藥名等無實際意義且不常見的詞,但這種詞用傳統(tǒng)的語言模型的方式或者熱詞方式是無法解決的。而沃豐科技通過語言模型與聲學(xué)模型結(jié)合的方式解決了這種問題,大幅提升了準(zhǔn)確率。
通過上述方式,沃豐科技GaussMind語音識別技術(shù)達(dá)到了行業(yè)中較好的水平,識別率可達(dá)95%,同時能夠?qū)崿F(xiàn)語音實時轉(zhuǎn)寫,邊接收語音,邊返回文字;識別效果優(yōu)化,個性化準(zhǔn)確率提升。
客戶實踐案例
96123 是北京地鐵服務(wù)熱線,于2021年3月31日上線試運行,業(yè)務(wù)范圍覆蓋北京城市軌道交通全路網(wǎng)范圍內(nèi)的運營、票務(wù)和站內(nèi)服務(wù)等相關(guān)信息咨詢等服務(wù),如乘車線路,票價查詢等日常乘坐軌道交通伴隨的問題。
痛點問題
1.日常咨詢量較大,人工處理工單量大、工單流轉(zhuǎn)效率有待提升
2.環(huán)境噪音、背景噪音及高地鐵站名稱相似度,數(shù)字與漢字并存,給語音識別帶來挑戰(zhàn)
3.北京作為首都,人員范圍廣,五湖四海的人群口音給語音識別帶來難度
4.用戶表達(dá)多樣性高,路線信息語義識別困難
解決方案
全面定制化:沃豐科技基于自研的GaussMind“原心引擎”進(jìn)行全面定制化操作,快速、高效地打造96123智能語音機(jī)器人。
ASR(自動語音識別):“聽清”用戶說的“是什么”,準(zhǔn)確識別來自五湖四海的口音
NLP(自然語言處理):“聽懂”用戶說的是“什么意思”,準(zhǔn)確理解出發(fā)地、目的地
對接業(yè)務(wù)系統(tǒng):為用戶快速提供查詢結(jié)果信息,讓北京地鐵出行查詢更加智能、便捷。
更多關(guān)于ASR技術(shù)資訊以及相關(guān)案例可點擊下圖咨詢~
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://m.gototw.com.cn/ucm/report/23322
ASRASR語音識別智能客服智能語音識別語音識別語音識別技術(shù)
