人工智能語(yǔ)音語(yǔ)言行業(yè)市場(chǎng)規(guī)模分析及技術(shù)趨勢(shì)預(yù)測(cè)
1、人工智能語(yǔ)音語(yǔ)言行業(yè)應(yīng)用及市場(chǎng)規(guī)模分析
人工智能語(yǔ)音語(yǔ)言技術(shù)即實(shí)現(xiàn)人與機(jī)器以語(yǔ)言為紐帶的信息處理技術(shù),人機(jī)對(duì)話通過對(duì)聲音信號(hào)的音頻采集與信號(hào)處理將語(yǔ)音轉(zhuǎn)化為文字供機(jī)器處理,在機(jī)器進(jìn)行語(yǔ)音識(shí)別與語(yǔ)義理解后、再進(jìn)行對(duì)話管理、自然語(yǔ)言生成并通過語(yǔ)音合成技術(shù)將文本語(yǔ)言轉(zhuǎn)化為聲音進(jìn)行輸出,最終形成完整的人機(jī)語(yǔ)音語(yǔ)言交互。
人工智能語(yǔ)音語(yǔ)言市場(chǎng)的產(chǎn)業(yè)鏈可依據(jù)關(guān)鍵技術(shù)拆分為六大環(huán)節(jié),各個(gè)環(huán)節(jié)又可以進(jìn)一步歸集為聲學(xué)、語(yǔ)音感知、語(yǔ)言認(rèn)知三大模塊。
人工智能語(yǔ)音語(yǔ)言行業(yè)內(nèi)的大部分公司只專注于產(chǎn)業(yè)鏈的單個(gè)或部分環(huán)節(jié),少有公司能擁有覆蓋產(chǎn)業(yè)鏈各環(huán)節(jié)的技術(shù)、產(chǎn)品與服務(wù),當(dāng)前國(guó)內(nèi)人工智能語(yǔ)音語(yǔ)言行業(yè)的公司大約有 400 余家,僅有極少數(shù)可以實(shí)現(xiàn)全產(chǎn)業(yè)鏈覆蓋。
在疫情的催化下,各行業(yè)智能化應(yīng)用迎來(lái)需求拐點(diǎn),進(jìn)入需求爆發(fā)期。預(yù)計(jì) 2030 年消費(fèi)級(jí)應(yīng)用場(chǎng)景總的發(fā)展空間將超過 700 億元。智能家居、智慧駕駛、智能辦公等企業(yè)級(jí)場(chǎng)景在疫情的催化下加速發(fā)展,市場(chǎng)需求不斷擴(kuò)大,發(fā)展空間預(yù)計(jì)即將達(dá)到千億規(guī)模。
智能語(yǔ)音語(yǔ)言技術(shù)使得人類的生產(chǎn)及生活方式逐步改變,基于智能語(yǔ)音語(yǔ)言技術(shù)的人機(jī)交互產(chǎn)品在接收用戶的聲音等信息后,能將用戶意圖轉(zhuǎn)換為機(jī)器可以理解和進(jìn)一步處理的內(nèi)容,從而幫助用戶解決問題或完成特定任務(wù)。其中,對(duì)話式機(jī)器人可以降低人力成本,減輕人工工作量,提高工作效率,解決用戶客服、營(yíng)銷、質(zhì)檢、呼入、呼出等需求;搭載人機(jī)對(duì)話交互功能的消費(fèi)級(jí)智能硬件,例如智能家電、智能車載、智能可穿戴設(shè)備等,能夠通過語(yǔ)音語(yǔ)言交互的方式,提供更豐富的設(shè)備交互功能,提升設(shè)備操控便捷性。
2021年我國(guó)對(duì)話式人機(jī)交互核心產(chǎn)品的市場(chǎng)規(guī)模達(dá)到91.50億元,帶動(dòng)相關(guān)產(chǎn)業(yè)經(jīng)濟(jì)規(guī)模達(dá)742.6億元,預(yù)計(jì) 2025 年核心產(chǎn)品規(guī)模達(dá)到 237 億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模達(dá)到1,525 億元。
2019-2026年中國(guó)人機(jī)交互核心產(chǎn)品及帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模

人工智能與實(shí)體經(jīng)濟(jì)的結(jié)合越來(lái)越多,與應(yīng)用場(chǎng)景的深度結(jié)合將產(chǎn)生更大的商業(yè)價(jià)值,近幾年,人工智能語(yǔ)音語(yǔ)言技術(shù)在各行業(yè)的應(yīng)用已十分廣泛,下游領(lǐng)域包括家電、汽車、消費(fèi)電子、金融、物流、房產(chǎn)、政務(wù)、醫(yī)療等。2020 年智能語(yǔ)音語(yǔ)言技術(shù)在各垂直行業(yè)應(yīng)用的核心產(chǎn)品規(guī)模達(dá)到 57.70 億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模達(dá) 317.70 億元,預(yù)計(jì) 2025 年核心產(chǎn)品規(guī)模達(dá)到 159.10 億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模達(dá)到 875.10 億元。
2、智能語(yǔ)音語(yǔ)言行業(yè)技術(shù)趨勢(shì)
近年來(lái),行業(yè)內(nèi)智能語(yǔ)音語(yǔ)言算法不斷更新迭代,基礎(chǔ)性能持續(xù)增強(qiáng),通用識(shí)別準(zhǔn)確率等已不再是智能語(yǔ)音語(yǔ)言行業(yè)發(fā)展的核心挑戰(zhàn),語(yǔ)音語(yǔ)言技術(shù)逐步由以語(yǔ)音感知為主,向綜合感知、認(rèn)知、知識(shí)計(jì)算的全鏈路對(duì)話系統(tǒng)方向拓展。
關(guān)鍵基礎(chǔ)算法層面,在可控環(huán)境和簡(jiǎn)單結(jié)構(gòu)化知識(shí)源條件下,語(yǔ)音及語(yǔ)言處理技術(shù)的性能已經(jīng)表現(xiàn)良好,達(dá)到產(chǎn)業(yè)化水平,但在復(fù)雜真實(shí)環(huán)境和自然非結(jié)構(gòu)化語(yǔ)言及知識(shí)處理方面,與產(chǎn)業(yè)需求仍然有不小差距。在感知技術(shù)方面,業(yè)內(nèi)研究逐步轉(zhuǎn)向聚焦突破高噪聲、多干擾、端側(cè)低資源等真實(shí)復(fù)雜自然場(chǎng)景;在認(rèn)知及知識(shí)計(jì)算方面,聚焦理解式的知識(shí)問答、對(duì)話理解及管理技術(shù),以及專業(yè)領(lǐng)域的深度知識(shí)結(jié)構(gòu)化,進(jìn)一步增強(qiáng)面向垂直領(lǐng)域信息智能化的知識(shí)圖譜、對(duì)話問答、閱讀理解、翻譯等能力。另一方面,個(gè)性化、場(chǎng)景定制化、私有化部署等需求已經(jīng)成為傳統(tǒng)產(chǎn)業(yè)進(jìn)行智能化改造和數(shù)字化升級(jí)的普遍需求,比如個(gè)性化的聲音復(fù)刻、新語(yǔ)義領(lǐng)域的問答對(duì)話、為保護(hù)隱私的私有化識(shí)別部署等。支撐這一需求的小數(shù)據(jù)遷移學(xué)習(xí)和自主學(xué)習(xí)算法及其在語(yǔ)音語(yǔ)言處理各個(gè)領(lǐng)域的結(jié)合,也是智能語(yǔ)音及語(yǔ)言行業(yè)算法技術(shù)發(fā)展的趨勢(shì)。
(1)全雙工語(yǔ)音出現(xiàn),人機(jī)交互朝著更自然、更順暢的方向發(fā)展
全雙工是通信學(xué)科中的一個(gè)術(shù)語(yǔ),意為允許數(shù)據(jù)在兩個(gè)方向上同時(shí)傳輸,應(yīng)用在智能語(yǔ)音語(yǔ)言行業(yè),即為實(shí)時(shí)的、雙向的語(yǔ)音信息的交互,這是人們進(jìn)行即興自由交互情境下的對(duì)話模式。區(qū)別于單輪交互與多輪交互,全雙工可以做到“邊聽、邊想、邊說”,在接收語(yǔ)音信息的同時(shí)進(jìn)行思考,并實(shí)現(xiàn)動(dòng)態(tài)的預(yù)估,進(jìn)而以更快的速度進(jìn)行回答,使人機(jī)交互更自然、更流暢;同時(shí),全雙工語(yǔ)音還可做到節(jié)奏控制,根據(jù)用戶回答內(nèi)容的重要性,決定打斷還是繼續(xù)傾聽,是先完成上一個(gè)問題還是先回答用戶的追加問題;此外,全雙工語(yǔ)音還能進(jìn)行場(chǎng)景理解,識(shí)別用戶當(dāng)前是否在與 AI進(jìn)行對(duì)話,并根據(jù)不同對(duì)象、不同場(chǎng)景進(jìn)行音量、語(yǔ)氣等方面的調(diào)節(jié)。未來(lái),智能語(yǔ)音語(yǔ)言的應(yīng)用場(chǎng)景越發(fā)多樣化,應(yīng)對(duì)的環(huán)境狀況越發(fā)復(fù)雜,全雙工語(yǔ)音的優(yōu)勢(shì)將會(huì)越發(fā)凸顯,并成為智能語(yǔ)音語(yǔ)言行業(yè)的主流交互方式。
(2)優(yōu)化人機(jī)交互體驗(yàn),多模態(tài)交互成為必然趨勢(shì)
人類在交互過程中并非孤立地依據(jù)聲音、表情及動(dòng)作中的單項(xiàng)進(jìn)行溝通與交流,而是綜合視覺、聽覺、觸覺甚至嗅覺來(lái)進(jìn)行有效的溝通。同理,要使機(jī)器做到更加逼真的“擬人化”,就需要通過語(yǔ)音、視覺、文本等信息結(jié)合的方式來(lái)推動(dòng)人機(jī)交互的優(yōu)化與升級(jí)。應(yīng)對(duì)人機(jī)交互場(chǎng)景化應(yīng)用不斷拓展的市場(chǎng)需求,多模態(tài)、智能化的完整解決方案可以更好地應(yīng)對(duì)不同場(chǎng)景的復(fù)雜變化,多模態(tài)交互成為行業(yè)發(fā)展的必然趨勢(shì)。
(3)以對(duì)話交互為核心的認(rèn)知和知識(shí)計(jì)算成為智能信息服務(wù)的重要技術(shù)趨勢(shì)
在各類智能信息軟硬件爆發(fā)式增長(zhǎng)的大背景下,對(duì)話式語(yǔ)言認(rèn)知智能,尤其是對(duì)話理解和管理技術(shù),將成為感知與認(rèn)知系統(tǒng)級(jí)融合的關(guān)鍵技術(shù),極大影響用戶體驗(yàn)。另一方面,針對(duì)垂直領(lǐng)域的復(fù)雜結(jié)構(gòu)化數(shù)據(jù)庫(kù)、各類知識(shí)文檔等多種形態(tài)的原始知識(shí)源,進(jìn)行知識(shí)結(jié)構(gòu)化和知識(shí)圖譜構(gòu)建,形成可控人機(jī)理解式交互的知識(shí)源,支撐知識(shí)問答和對(duì)話,支持人類決策,將是面向信息服務(wù)智能化的知識(shí)計(jì)算的發(fā)展方向。
(4)芯片研發(fā)日益關(guān)鍵,端側(cè)智能與云側(cè)智能雙輪驅(qū)動(dòng) AI 深度應(yīng)用
目前基于深度學(xué)習(xí)的智能算法通常運(yùn)行于具有強(qiáng)大計(jì)算能力的云計(jì)算中心,而相比于云計(jì)算,邊緣計(jì)算將資源和服務(wù)下沉到網(wǎng)絡(luò)邊緣端,從而帶來(lái)更低的帶寬占用、更低的時(shí)延、更高的能效和更好的隱私保護(hù)。專用芯片往往是場(chǎng)景化或針對(duì)特定功能的,成本和效率大大優(yōu)于通用芯片,可以進(jìn)一步提高產(chǎn)品端側(cè)的計(jì)算效率,并提升針對(duì)特定應(yīng)用場(chǎng)景的優(yōu)化適應(yīng)能力。未來(lái),人工智能語(yǔ)音芯片的發(fā)展將進(jìn)一步推動(dòng)智能語(yǔ)音語(yǔ)言產(chǎn)品在各垂直行業(yè)領(lǐng)域商業(yè)化落地。 |