外呼機(jī)器人是一種..的人工智能產(chǎn)品形態(tài),而之前的外呼系統(tǒng)面臨著語音識(shí)別技術(shù)、多輪對(duì)話、人類的對(duì)話行為模型非常復(fù)雜等多種挑戰(zhàn),那么對(duì)于現(xiàn)在而言,外呼機(jī)器人的市場(chǎng)也越來越大,除了它已經(jīng)通過了各種挑戰(zhàn),還有什么其他的原因呢?下面,沈陽外呼機(jī)器人公司的小編就為大家簡(jiǎn)單介紹一下。
外呼機(jī)器人具有哪些挑戰(zhàn)和風(fēng)險(xiǎn)呢?
語音識(shí)別技術(shù)的挑戰(zhàn),前面說到實(shí)驗(yàn)室環(huán)境下語音識(shí)別準(zhǔn)確率已經(jīng)從2013年的87%提高到了2017年的97%,而在實(shí)際環(huán)境中,這個(gè)數(shù)字會(huì)降低到85%左右,因?yàn)閷?shí)際環(huán)境中有大量的噪音、口音、聲源遠(yuǎn)近等問題。
在外呼機(jī)器人這個(gè)領(lǐng)域,短語音識(shí)別是一個(gè)難點(diǎn),因?yàn)樵谌鄙俑嗌舷挛男畔⒌臅r(shí)候,語音識(shí)別很難確定你發(fā)的音和對(duì)應(yīng)的字之間的關(guān)系,中文更是如此,因?yàn)橹形氖且粋€(gè)同音不同字的語言,還有音調(diào)的變化。
來自于技術(shù)方面的第二個(gè)挑戰(zhàn)是多輪對(duì)話,人的自然語言從來都是含糊不清的,特別依賴上下文關(guān)系。比如說“我想訂一個(gè)房間”, “什么位置?”, “中關(guān)村附近”,“什么時(shí)間?”,“周六”… …這個(gè)例子里面,關(guān)于訂房間的信息是散落在多輪對(duì)話之間的。如何綜合全面考慮上下文信息一直是學(xué)術(shù)界的一項(xiàng)挑戰(zhàn)。
第三,人類的對(duì)話行為模型非常復(fù)雜。因?yàn)樵谕夂魴C(jī)器人場(chǎng)景下,人們期待的是和另一個(gè)人之間的交流而不是一臺(tái)機(jī)器。研究顯示,人們?cè)诤蜋C(jī)器人對(duì)話的時(shí)候,會(huì)自然的放慢語速,發(fā)音會(huì)更清晰,也會(huì)用更加配合機(jī)器人的句式來交互。
但是在和人溝通的場(chǎng)景中,人們的發(fā)音或更含糊,會(huì)在句子中省略很多字詞,也會(huì)在句子中突然修改前面的對(duì)話信息,這些都給語音識(shí)別,語義理解造成了極大的困難。
.后,我們目前的外呼機(jī)器人大部分都還是播放提前錄音,為了實(shí)現(xiàn)真正的人機(jī)語音對(duì)話系統(tǒng),我們需要讓機(jī)器能發(fā)出人的聲音,這就是語音合成技術(shù)。
但是要合成出人自然對(duì)話中的抑揚(yáng)頓挫,并且騙過人是一件非常困難的事情,人的耳朵對(duì)于音頻的敏感程度遠(yuǎn)超過人眼對(duì)圖像的敏感程度,這也讓語音合成這件事情的難度更高。