如今大家對于機器人都是很熟悉的, 簡單一點來說機器人就是自動執(zhí)行工作的機器裝置。它既可以接受人類指揮,又可以運行預先編排的程序的。而大家對于沈陽外呼機器人都是否熟悉呢?其具有哪些挑戰(zhàn)和風險呢?
首先是語音識別技術的挑戰(zhàn),前面說到實驗室環(huán)境下語音識別準確率已經(jīng)從2013年的87%提高到了2017年的97%,而在實際環(huán)境中,這個數(shù)字會降低到85%左右,因為實際環(huán)境中有大量的噪音、口音、聲源遠近等問題。在外呼機器人這個領域,短語音識別是一個難點,因為在缺少更多上下文信息的時候,語音識別很難確定你發(fā)的音和對應的字之間的關系,中文更是如此,因為中文是一個同音不同字的語言,還有音調的變化,比如我發(fā)一個音“l(fā)ao shi” ,這在不同的語境下,可能代表這是一個教書育人的職業(yè),在另外的語境下,可能代表這個人的性格很老實。
來自于技術方面的第二個挑戰(zhàn)是多輪對話,人的自然語言從來都是含糊不清的,特別依賴上下文關系。比如說“我想訂一個房間”, “什么位置?”, “中關村附近”,“什么時間?”,“周六”… …這個例子里面,關于訂房間的信息是散落在多輪對話之間的。如何綜合全面考慮上下文信息一直是學術界的一項挑戰(zhàn)。
第三,人類的對話行為模型非常復雜。因為在外呼機器人場景下,人們期待的是和另一個人之間的交流而不是一臺機器。研究顯示,人們在和機器人對話的時候,會自然的放慢語速,發(fā)音會更清晰,也會用更加配合機器人的句式來交互。但是在和人溝通的場景中,人們的發(fā)音或更含糊,會在句子中省略很多字詞,也會在句子中突然修改前面的對話信息,這些都給語音識別,語義理解造成了極大的困難。
.后,我們目前的外呼機器人大部分都還是播放提前錄音,為了實現(xiàn)真正的人機語音對話系統(tǒng),我們需要讓機器能發(fā)出人的聲音,這就是語音合成技術。但是要合成出人自然對話中的抑揚頓挫,并且騙過人是一件非常困難的事情,人的耳朵對于音頻的敏感程度遠超過人眼對圖像的敏感程度,這也讓語音合成這件事情的難度更高。
以上這些有關沈陽外呼機器人所具有的挑戰(zhàn)和風險總結介紹,不知大家在看完之后都學到了多少知識呢。其實這些知識對于很多不熟悉的人們來說都是有很大幫助的,所以大家對于以上這些知識都看看吧。