MRCP:媒體資源控制協(xié)議,是一種計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用層通訊協(xié)議,用于語音服務(wù)器向客戶端提供各種語音服務(wù)(如:語音識(shí)別,語音合成,錄音服務(wù)等)。
我們提供的服務(wù)有:成都做網(wǎng)站、網(wǎng)站設(shè)計(jì)、外貿(mào)營(yíng)銷網(wǎng)站建設(shè)、微信公眾號(hào)開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、維西ssl等。為近1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的維西網(wǎng)站制作公司
MRCP請(qǐng)求方式:類似于HTTP,MRCP使用請(qǐng)求-響應(yīng)模式,響應(yīng)可以是簡(jiǎn)單的確認(rèn)請(qǐng)求,或者回復(fù)關(guān)于處理的信息。例如語音識(shí)別:MRCP客戶端向服務(wù)端請(qǐng)求發(fā)送一些音頻數(shù)據(jù),服務(wù)端可以響應(yīng)識(shí)別結(jié)果。
MRCP并未定義音頻數(shù)據(jù)的傳輸,數(shù)據(jù)傳輸必須依賴其他的協(xié)議,比如RTP、FTP來進(jìn)行。因此MRCP傳輸可以是流式或者非流式傳輸。
一句話識(shí)別:實(shí)時(shí)短語音識(shí)別,可用于語音輸入法、智能客服等領(lǐng)域??芍С至魇?和 非流式返回方式。
流式:用戶一邊說話,一邊返回識(shí)別結(jié)果
非流式:用戶整句話說完后返回識(shí)別結(jié)果
訊飛的語音識(shí)別的場(chǎng)景一般分為2種,如下:
支持格式:
針對(duì)上述兩種場(chǎng)景,背后的識(shí)別引擎的處理算法也有差異,具體分為兩種引起:
AI平臺(tái)語音識(shí)別引擎現(xiàn)采用訊飛的“轉(zhuǎn)寫”非流式引擎,但是在調(diào)用引擎之前,先把語音文件進(jìn)行切割處理,分成多個(gè)小文件,再將一個(gè)個(gè)的小文件通過引擎識(shí)別,最后將識(shí)別結(jié)果合并起來,使得看上去類似于流式引擎。
自己做機(jī)器人外呼系統(tǒng)線路和組裝的方法分別是:
1、線路:由于機(jī)器人外呼系統(tǒng)線路難以自己研制只能選擇運(yùn)營(yíng)商線路。提供方包括三大運(yùn)營(yíng)商、集成線路商。這是我們打電話出去要交電話費(fèi),必須涉及的供應(yīng)商。
saas服務(wù)平臺(tái)。即用戶可以注冊(cè)、登錄、繳費(fèi)、上傳呼叫列表、發(fā)起外呼任務(wù)、外呼結(jié)果查看的網(wǎng)站。這個(gè)是終端用戶唯一可以看得到的前端界面。
2、組裝:以呼叫中心技術(shù)系統(tǒng)為基礎(chǔ),將計(jì)算機(jī)的信息處理功能、數(shù)字程控交換機(jī)的電話接入和智能分配、自動(dòng)語音處理技術(shù)、 Internet技術(shù)、網(wǎng)絡(luò)通信技術(shù)。
商業(yè)智能技術(shù)與業(yè)務(wù)系統(tǒng)緊密結(jié)合在一起,將公司的通信系統(tǒng)、計(jì)算機(jī)處理系統(tǒng)、人工業(yè)務(wù)代表、信息等資源整合成統(tǒng)一、高效的服務(wù)工作平臺(tái) 。
機(jī)器人外呼系統(tǒng)的AI能力對(duì)接是:
在具體落地中,這個(gè)領(lǐng)域的常規(guī)參與者通常具備呼叫中心能力或者AI能力其中一種,而主要的對(duì)接點(diǎn)也就在于AI能力與呼叫中心設(shè)備去對(duì)接,而ASR/TTS與呼叫中心設(shè)備對(duì)接的常規(guī)協(xié)議主要是mrcp/sip。
媒體資源控制協(xié)議(Media Resource Control Protocol, MRCP)是一種通訊協(xié)議,用于語音服務(wù)器向客戶端提供各種語音服務(wù)(如語音識(shí)別和語音合成)。有兩個(gè)版本的MRCP協(xié)議,版本2使用SIP作為控制協(xié)議,版本1使用RTSP。
實(shí)際對(duì)接的時(shí)候,會(huì)遇到不少技術(shù)問題,有的呼叫中心廠商會(huì)要求ASR/TTS引擎做私有云部署,這樣避免了內(nèi)外網(wǎng)穿透時(shí)防火墻的諸多設(shè)置和語音流的時(shí)延。這對(duì)基于語義起家(并購買語音能力)的公司是一個(gè)小小的難題。
MRCP是引擎之間的一種通信的協(xié)議。HTTP協(xié)議,即超文本傳輸協(xié)議。
MRCP是PBX與ASR和TTS引擎之間的一種通信的協(xié)議。在MRCP規(guī)范1.0版本中,用RTSP發(fā)起會(huì)話,用RTP傳輸媒體流。在2.0版本中,會(huì)話控制協(xié)議由SIP替換(RTP仍然用于媒體流)。HTTP協(xié)議,即超文本傳輸協(xié)議(Hypertexttransferprotocol)。是一種詳細(xì)規(guī)定了瀏覽器和萬維網(wǎng)(WWW=WorldWideWeb)服務(wù)器之間互相通信的規(guī)則,通過因特網(wǎng)傳送萬維網(wǎng)文檔的數(shù)據(jù)傳送協(xié)議。
序言
隨著人工智能命題的提出,近年來涌現(xiàn)出一大批基于人工智能的呼叫中心業(yè)務(wù)服務(wù)商和集成商,僅智能外呼這一模塊兒就將近百家公司在推廣和運(yùn)營(yíng)??梢哉f整個(gè)基于人工智能技術(shù)的市場(chǎng)開始蓬勃的發(fā)展起來了。
簡(jiǎn)單介紹一下什么叫做智能語音交互平臺(tái)。其實(shí)大實(shí)話就是在呼叫中心基礎(chǔ)上,集成 ASR、 TTS、的呼叫服務(wù)平臺(tái)。
那么如何我們自己去搭建智能語音系統(tǒng)呢?
我們先列出搭建智能外呼系統(tǒng)的搭建需要那些技術(shù)和服務(wù):
個(gè)人認(rèn)為:
[if !supportLists]·????????[endif] 首先最重要的是交換機(jī):
[if !supportLists]1.??? [endif]PBX也就是交換機(jī),商用設(shè)備原廠包括像華為、Avaya、思科、東匯等這些生產(chǎn)硬件交換機(jī),
[if !supportLists]2.??? [endif]還有就是目前FreeSitch、asterrisk、OpenPBX這些軟件交換機(jī)。
[if !supportLists]·????????[endif] 其次是AI技術(shù): 及包含語音識(shí)別、語義理解、語音合成這三種技術(shù)是核心組成部分。語音識(shí)別相當(dāng)于人的“耳朵”,接進(jìn)電話后,對(duì)人的話語進(jìn)行處理轉(zhuǎn)義成系統(tǒng)能夠識(shí)別的數(shù)據(jù)交由系統(tǒng)處理去識(shí)別。在進(jìn)一步的話,可以轉(zhuǎn)義為文字。語義理解相當(dāng)于人的"大腦",根據(jù)話語識(shí)別人的意圖。語音合成,相當(dāng)于人的”嘴巴“,識(shí)別人的意圖之后,依照特定的回答方式,去回復(fù)和引導(dǎo)對(duì)話。
[if !supportLists]·????????[endif] 再者是前端服務(wù)平臺(tái):即用戶登錄、配置呼叫流程,建立呼叫任務(wù)、統(tǒng)計(jì)呼叫數(shù)據(jù)、導(dǎo)出呼叫報(bào)表的網(wǎng)站,這個(gè)是終端用戶唯一可以看到并且操作的界面。
[if !supportLists]·????????[endif] 最后是外呼線路:其中包括三大運(yùn)營(yíng)商以及其他小型的集成線路供應(yīng)商,主要目的是外呼電話或者是接入電話。
也有人可能有疑問:”智能語音交互系統(tǒng)最重要的不是人工智能么,和交換機(jī)有啥關(guān)系?”為什么說最重要的是交換機(jī)呢,原因是不管我們是外呼還是接入電話、都需要前端服務(wù)平臺(tái)把外呼請(qǐng)求發(fā)送給交換機(jī),通過外呼線路而撥出去。換句話說交換機(jī)是控制整體的外呼情況。硬件的交換機(jī),比如說像華為的交換機(jī),價(jià)格在大約幾萬到幾百萬不等的價(jià)格。對(duì)于想要建立自己的智能語音交互系統(tǒng)來說,價(jià)格對(duì)于一些小型公司來說承受不起,而FreeSitch這種軟交換則大大方便了小型公司建立自己的智能語音交互系統(tǒng)。
什么是FreeSwitch?
FreeSitch是一個(gè)電話的軟交換解決方案,包括一個(gè)軟電話和軟交換機(jī)用以提供語音和聊天的產(chǎn)品驅(qū)動(dòng)。FreeSitch 可以用作交換機(jī)引擎、PBX、多媒體網(wǎng)關(guān)以及多媒體服務(wù)器等。支持多種通訊技術(shù)標(biāo)準(zhǔn),包括 SIP, H.323, IAX2 以及 GoogleTalk ,同時(shí)也可以方便的與其他開源的PBX系統(tǒng)進(jìn)行對(duì)接。而且具有很強(qiáng)的伸縮性。旨在為音頻、視頻、文字或任何其他形式的媒體,提供路由和互連 通信協(xié)議 。
FreeSwitch 的典型功能
[if !supportLists]·????????[endif]在線計(jì)費(fèi)、預(yù)付費(fèi)功能。?
[if !supportLists]·????????[endif]電話路由服務(wù)器。?
[if !supportLists]·????????[endif]語音轉(zhuǎn)碼服務(wù)器。?
[if !supportLists]·????????[endif]支持資源優(yōu)先權(quán)和QoS的服務(wù)器。?
[if !supportLists]·????????[endif]多點(diǎn)會(huì)議服務(wù)器。?
[if !supportLists]·????????[endif]IVR、語音通知服務(wù)器。?
[if !supportLists]·????????[endif]VoiceMail服務(wù)器。?
[if !supportLists]·????????[endif]PBX應(yīng)用和軟交換。?
[if !supportLists]·????????[endif]應(yīng)用層網(wǎng)關(guān)。?
[if !supportLists]·????????[endif]防火墻/NAT穿越應(yīng)用。?
[if !supportLists]·????????[endif]私有服務(wù)器。?
[if !supportLists]·????????[endif]SIP網(wǎng)間互聯(lián)網(wǎng)關(guān)。?
[if !supportLists]·????????[endif]SBC及安全網(wǎng)關(guān)。?
FreeSwitch最典型的功能是作為一個(gè)服務(wù)器,并用電話客戶端軟件連接到它。雖然FreeSwitch支持眾多的通信協(xié)議,但其最主要的協(xié)議還是SIP,通過SIP中繼發(fā)起會(huì)話協(xié)議。
使用FreeSwitch這種軟交換的好處在于,你只需要一臺(tái)服務(wù)器就可以隨時(shí)搭建自己的外呼中心,而且FreeSwitch支持跨平臺(tái)運(yùn)行。能夠原生運(yùn)行Windows、Linux、BSD等諸多32/64位平臺(tái)。
FreeSwitch內(nèi)部使用線程模型來處理并發(fā)請(qǐng)求,每個(gè)連接都在單獨(dú)的線程中進(jìn)行處理,不同的線程間通過Mutex互斥訪問共享資源,并通過消息和異步事件等方式進(jìn)行通信。FreeSwitch本身是比較穩(wěn)定的,它是比較優(yōu)秀的開源軟件。另一方面來講,F(xiàn)reeSwitch又是比較激進(jìn)的,它的開發(fā)分支里會(huì)有大量的新特性加入,因此在測(cè)試不全面的情況下,很容易出現(xiàn)不穩(wěn)定的情況。而在用于生產(chǎn)環(huán)境的情況下,系統(tǒng)的穩(wěn)定性是系統(tǒng)能否正常被使用的關(guān)鍵。之前我們?cè)谧鲰?xiàng)目的過程中,就遇到一些FreeSwitch不穩(wěn)定的情況,導(dǎo)致外呼情況不理想。舉一個(gè)例子:我們?cè)谶M(jìn)行測(cè)試外呼的時(shí)候,語音通話斷斷續(xù)續(xù),雖然前端服務(wù)平臺(tái)可以很好的接受到數(shù)據(jù)的傳輸,但是,真正在與人工進(jìn)行溝通的時(shí)候,會(huì)出現(xiàn)各種各樣的溝通障礙,為了解決這一個(gè)問題,我們花費(fèi)了幾個(gè)月的時(shí)間,去研究FreeSwitch的結(jié)構(gòu)特性。終于把這個(gè)問題解決掉。我們的項(xiàng)目才得以繼續(xù)推動(dòng),最終得以真正落地部署實(shí)施。
也有人可能有疑問:”FreeSwitch軟交換雖然重要,但是既然是智能語音交互系統(tǒng)人工智能不重要嗎?”,重要,當(dāng)然重要!容我慢慢道來~
AI 技術(shù)
1. 通信原理
先簡(jiǎn)單解釋一下正常打電話這個(gè)流程
流程:A→PSTN→B
解釋:PSTN是Public
Switched Telephone Network,意思為公共交換電話網(wǎng)絡(luò),也就是我們的運(yùn)營(yíng)商的網(wǎng)絡(luò)電話,
那我們平時(shí)如何給呼叫中心比如打電話是如何打的?:個(gè)人A打電話給呼叫中心1***6 打電話,撥通后聽到錄音,您好,撥打人工臺(tái),請(qǐng)按0鍵,按鍵之后,出現(xiàn)盲音,真正接通之后,客服接通了電話。
流程:A→PSTN→PBX→IVR→客服
解釋:PBX也叫交換機(jī)、相當(dāng)于整個(gè)呼叫中心的出入口
IVR也叫互動(dòng)/交互式語音應(yīng)答,語音導(dǎo)航,也就是相當(dāng)于咨詢業(yè)務(wù)請(qǐng)按鍵,這一環(huán)節(jié),根據(jù)業(yè)務(wù)去分流到客服。
智能語音交互平臺(tái)(智能機(jī)器人)落實(shí)到具體具體業(yè)務(wù)場(chǎng)景是如何實(shí)現(xiàn)的:
如:”個(gè)人A要在某一個(gè)大型酒店預(yù)訂位子“,
A撥通后先聽到了聲音,“您好,我是機(jī)器人小岳,需要我?guī)湍單蛔邮菃幔?/p>
個(gè)人A說,“我不要和機(jī)器人說話,找個(gè)真人來”。
然后聽到錄音,“為您轉(zhuǎn)接很貴的真人客服,排隊(duì)中,請(qǐng)稍后”。
幾分鐘后接通,真人客服接了電話。
流程:A→PSTN→PBX→IVR(TTS→ASR→NLP→TTS)→ACD→客服
解釋:在IVR部分:不再需要提示按鍵,而是直接問來電方需要辦理什么業(yè)務(wù),然后識(shí)別語音、理解意圖后,根據(jù)用戶的需求,回答后轉(zhuǎn)入對(duì)應(yīng)的業(yè)務(wù)隊(duì)列排隊(duì)。
上邊是接通的流程,呼出的流程與之相反,就不在贅述了。
2. 現(xiàn)在市場(chǎng)上的AI技術(shù)的運(yùn)用
目前市場(chǎng)上的不管是ASR、TTS、NLP都被阿里百度科大訊飛等巨頭公司所占據(jù),這些技術(shù)在國(guó)內(nèi)基本已經(jīng)成為定局。像ASR這類引擎市場(chǎng)上大部分都是用的阿里云和訊飛云的,要不就是百度云。阿里云和訊飛云的識(shí)別率高一些,可以達(dá)到97%左右、百度的差一些,識(shí)別率在80%左右,我們當(dāng)初在做項(xiàng)目的時(shí)候選擇ASR做過測(cè)試,事實(shí)證明阿里云識(shí)別率更高同時(shí)也可以識(shí)別方言。因此,我們?cè)谧鲰?xiàng)目的時(shí)候,當(dāng)仁不讓的選擇了阿里云的
TTS我們選擇的是訊飛的,選擇的理由很簡(jiǎn)單,畢竟科大訊飛是人工智能領(lǐng)域巨頭級(jí)的公司,質(zhì)量當(dāng)然有的保證。
3. AI 能力對(duì)接
在具體落地中,這個(gè)領(lǐng)域的常規(guī)參與者通常具備呼叫中心能力或者AI能力其中一種,而主要的對(duì)接點(diǎn)也就在于AI能力與呼叫中心設(shè)備去對(duì)接,而ASR/TTS與呼叫中心設(shè)備對(duì)接的常規(guī)協(xié)議主要是mrcp/sip。
媒體資源控制協(xié)議(Media Resource Control
Protocol, MRCP)是一種通訊協(xié)議,用于語音服務(wù)器向客戶端提供各種語音服務(wù)(如語音識(shí)別和語音合成)。有兩個(gè)版本的MRCP協(xié)議,版本2使用SIP作為控制協(xié)議,版本1使用RTSP。
實(shí)際對(duì)接的時(shí)候,會(huì)遇到不少技術(shù)問題,當(dāng)我們ASR/TTS引擎做私有云部署,為了避免了內(nèi)外網(wǎng)穿透時(shí)防火墻的諸多設(shè)置和語音流的時(shí)延。這在我們當(dāng)時(shí)對(duì)接的時(shí)候也花費(fèi)了好大一番功夫。
前端服務(wù)平臺(tái):
其中最重要的就是配置呼叫流程這一塊兒了,
這一塊兒很容易被忽視,但是這反而是可以出成績(jī)的地方。一般來說一套最佳話術(shù)模板,可以以一敵萬。心理學(xué)基礎(chǔ)必須要有,一句話怎么說能讓接電話的人最大概率的順著自己的思路走,達(dá)成目的,從而形成特定細(xì)分領(lǐng)域機(jī)器人話術(shù)模板,得到最佳的外呼效果(接通率、通話時(shí)長(zhǎng)、電銷意愿、催收意愿)或者是接通效果(滿意度)
其余的基本就是web端的東西了,具體功能點(diǎn)呢,即用戶登錄、配置呼叫流程,建立呼叫任務(wù)、統(tǒng)計(jì)呼叫數(shù)據(jù)、導(dǎo)出呼叫報(bào)表,這些功能點(diǎn)基本實(shí)現(xiàn)就可以,因?yàn)檎驹诋a(chǎn)品角度,產(chǎn)品最重要的價(jià)值就是可以呼通或者接通用戶的電話,并且能夠準(zhǔn)確的識(shí)別用戶的意圖,并且準(zhǔn)確的回答用戶。這就是智能語音交互系統(tǒng)的最終目標(biāo),也一直是我們的最終目標(biāo)。
外呼線路廠商:
一般如果是購買系統(tǒng)的話,是給提供線路的,只需交一些線路費(fèi)用。如果是自己做項(xiàng)目的話,網(wǎng)上、淘寶上一大堆,費(fèi)用可以談,也給提供線路對(duì)接的接口。
結(jié)語
雖然現(xiàn)在市場(chǎng)上做智能語音交互系統(tǒng)的比較多,但一般只限于各個(gè)行業(yè)的電話銷售,真正意義上的智能語音交互還是很少的。原因很簡(jiǎn)單,雖然原理不是很難但是真正落地實(shí)施的時(shí)候,遇到的困難非常的多,幾乎是一步一個(gè)坑。好在現(xiàn)在已經(jīng)真正的落地實(shí)施了,方方面面的效果都還是很不錯(cuò)的。一年多的辛苦沒有白費(fèi)。哈哈~
寫這篇文章嘗試給大家簡(jiǎn)單介紹一下智能語音交互系統(tǒng),然才疏學(xué)淺,疏漏和不當(dāng)之處在所難免,權(quán)當(dāng)給大家拋磚引玉。
諸多細(xì)節(jié)限于主題和篇幅的要求不做詳細(xì)記述,如有問題,歡迎隨時(shí)交流。
本文題目:mrcp協(xié)議go語言 mrcp 協(xié)議
標(biāo)題來源:http://m.rwnh.cn/article18/dosgogp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化、自適應(yīng)網(wǎng)站、網(wǎng)頁設(shè)計(jì)公司、企業(yè)建站、全網(wǎng)營(yíng)銷推廣、
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)