3月23日,實(shí)時(shí)互動(dòng)云服務(wù)商聲網(wǎng)在北京舉辦“鳳鳴AI引擎”發(fā)布會(huì),正式發(fā)布了囊括AI降噪、AI回聲消除、空間音頻、最佳音效在內(nèi)的聲網(wǎng)新一代音頻技術(shù)智能引擎。開發(fā)者與企業(yè)可以如搭積木般靈活調(diào)用對(duì)應(yīng)組件,并廣泛應(yīng)用在語聊社交、在線K歌、線上會(huì)議、游戲競(jìng)技、虛擬活動(dòng)等諸多場(chǎng)景,為用戶帶來更純凈、更動(dòng)聽、更沉浸的語音互動(dòng)體驗(yàn),探索更多營收增長空間。
RTE場(chǎng)景不斷豐富,高音質(zhì)互動(dòng)需求急需滿足
(資料圖)
實(shí)時(shí)音視頻技術(shù)的發(fā)展帶出大量的創(chuàng)新場(chǎng)景,從狼人殺、直播連麥到直播電商、在線K歌、互動(dòng)播客、元宇宙,伴隨著場(chǎng)景的不斷擴(kuò)展,用戶對(duì)實(shí)時(shí)音視頻體驗(yàn)的訴求也越來越高。
傳統(tǒng)的RTC概念,從信息傳遞的角度出發(fā),音頻功能僅提供簡單的語音溝通,滿足單一的場(chǎng)景和通話標(biāo)準(zhǔn),對(duì)于音質(zhì)并無太高的需求,也就是所謂的“能夠溝通”。伴隨著實(shí)時(shí)互動(dòng)創(chuàng)新場(chǎng)景的涌現(xiàn),用戶對(duì)于音頻體驗(yàn)的需求也產(chǎn)生了從量變到質(zhì)變的進(jìn)化,比如在線K歌、線上會(huì)議等場(chǎng)景,用戶的需求早已從能夠溝通到希望“脫離現(xiàn)實(shí)”,屏蔽外界干擾,實(shí)現(xiàn)純凈溝通;對(duì)于元宇宙、虛擬活動(dòng)、游戲競(jìng)技等場(chǎng)景,用戶則是希望從簡單溝通實(shí)現(xiàn)“極致擬真”的沉浸式體驗(yàn)。
同時(shí),音頻體驗(yàn)的提升能夠增強(qiáng)平臺(tái)用戶的核心體驗(yàn)。比如,對(duì)噪音的抑制能夠提升語聊房用戶活躍度和留存,以及游戲開黑場(chǎng)景的通話時(shí)長;回聲消除能顯著提升用戶的在線K歌體驗(yàn);而立體、具備空間感的音頻體驗(yàn)則能提升元宇宙社交、游戲競(jìng)技、線上會(huì)議、虛擬活動(dòng)等場(chǎng)景中用戶的臨場(chǎng)感和沉浸感。
聲網(wǎng)針對(duì)以上痛點(diǎn)和需求,聲網(wǎng)鳳鳴AI引擎應(yīng)勢(shì)而生。
3大音頻能力+最佳音效實(shí)踐 回歸互動(dòng)本真
通過AI驅(qū)動(dòng)的方式,聲網(wǎng)打通了音頻采集、前后處理、云端傳輸、編解碼等鏈路,旨在為用戶打造更純凈、更動(dòng)聽、更沉浸的語音體驗(yàn),在現(xiàn)有實(shí)時(shí)互動(dòng)玩法的基礎(chǔ)上錦上添花,賦能行業(yè)開發(fā)者和企業(yè)。
1.AI降噪強(qiáng)力抑制100+突發(fā)噪聲,兼顧語音無損傷與混響抑制
想要在“脫離現(xiàn)實(shí)”的環(huán)境中辦公、娛樂,屏蔽外界干擾是基礎(chǔ)。相比于傳統(tǒng)的降噪算法,鳳鳴·AI降噪的效果有顯著提升,可以一次性解決100+種突發(fā)性噪聲,比如辦公場(chǎng)景經(jīng)常遇到的敲鍵盤、鼠標(biāo)點(diǎn)擊、電話鈴聲;家庭環(huán)境中遇到的小孩哭叫、裝修、廚房做飯聲;戶外環(huán)境中的風(fēng)聲、雨聲、汽車噪聲等。
鳳鳴·AI降噪在強(qiáng)降噪的同時(shí)還能兼顧高保真,即使在人聲密集場(chǎng)景下,也能實(shí)現(xiàn)純凈通話體驗(yàn),甚至還實(shí)現(xiàn)了在不增加額外運(yùn)算量的前提下,對(duì)遠(yuǎn)場(chǎng)語音具有明顯的混響抑制能力。如果用戶在一個(gè)房間中距離麥克風(fēng)較遠(yuǎn),這時(shí)候?qū)Ψ铰牭降穆曇羰悄:?,若使用了聲網(wǎng)的AI降噪算法,對(duì)端也能清晰地聽到該用戶的聲音。
此外,聲網(wǎng)自研的AI推理引擎還可以使得AI降噪算法在Android、iOS、Mac、Windows、Web等主流平臺(tái)以低精度損傷、高性能、低功耗方式運(yùn)行,使用戶的設(shè)備不卡不燙。經(jīng)數(shù)據(jù)測(cè)算,僅開啟鳳鳴·AI降噪功能,相應(yīng)設(shè)備CPU消耗增幅平均值
3.空間音頻極致擬真,打造“聲臨其境”互動(dòng)玩法
鳳鳴·空間音頻通過純軟件算法方案,模擬頭部球面區(qū)域立體聲場(chǎng),利用范圍音頻、人聲模糊、空氣衰減模擬等能力,完美模擬現(xiàn)實(shí)聽覺感受。當(dāng)用戶操作相應(yīng)角色在虛擬場(chǎng)景里移動(dòng),可以實(shí)現(xiàn)根據(jù)虛擬人物的面部朝向、音源朝向、遠(yuǎn)近距離與上下高度,呈現(xiàn)不同聲音效果。
空間音頻是元宇宙和游戲這類具備3D場(chǎng)景玩法的最佳搭檔,如狼人殺、虛擬演唱會(huì)、虛擬活動(dòng)等場(chǎng)景,可以有效的增強(qiáng)用戶在線上的互動(dòng)、聽覺體驗(yàn),重構(gòu)用戶在虛擬世界的沉浸感與臨場(chǎng)感。同時(shí),開發(fā)者不必?fù)?dān)心空間音頻功能對(duì)于用戶設(shè)備的影響,據(jù)數(shù)據(jù)測(cè)算,開啟鳳鳴·空間音頻功能后,相應(yīng)設(shè)備CPU消耗增幅平均值
多年來,聲網(wǎng)匯總梳理語聊領(lǐng)域各類頭部App的音效配置,綜合聲網(wǎng)超過萬億分鐘的用戶音效偏好的數(shù)據(jù)模型,并結(jié)合聲網(wǎng)音頻專家的多年沉淀與研究,能夠?yàn)槠脚_(tái)提供針對(duì)各種語音場(chǎng)景的最佳音效配置,助力平臺(tái)用戶享受行業(yè)頂尖的音效體驗(yàn)。目前已上線的最佳音效包括語聊社交、K歌、游戲陪玩、專業(yè)主播等場(chǎng)景。國內(nèi)某頭部語音社交平臺(tái)就是通過聲網(wǎng)提供的最佳音效配置方案,將空間音頻、美聲、電音等豐富的聲音玩法融入互動(dòng)中,增強(qiáng)平臺(tái)留存和變現(xiàn)能力。
據(jù)聲網(wǎng)音頻娛樂產(chǎn)品負(fù)責(zé)人楊帆介紹,鳳鳴AI引擎目前正在開發(fā)變聲這一功能,用戶將可以體驗(yàn)20+變聲風(fēng)格,多樣角色扮演花式玩轉(zhuǎn)語聊場(chǎng)景。聲網(wǎng)算法專家許冉指出,鳳鳴AI引擎代表聲網(wǎng)在 RTC音頻領(lǐng)域針對(duì)核心技術(shù)的長期投入和產(chǎn)出,以及聲網(wǎng)基于音頻核心能力衍生出各種復(fù)雜功能和高端效果的決心,未來聲網(wǎng)將基于鳳鳴AI引擎形成新一代RTC音頻解決方案,比如探索更個(gè)性化的語音方案、語音超分、co-experiencing場(chǎng)景等。
發(fā)布會(huì)還邀請(qǐng)了仙巴科技創(chuàng)始人兼CEO薛達(dá)、揚(yáng)帆出海創(chuàng)始人兼CEO劉武華、科大訊飛海外解決方案產(chǎn)品部產(chǎn)品總監(jiān)吳浩亮、聲網(wǎng)產(chǎn)品市場(chǎng)負(fù)責(zé)人朱超華及聲網(wǎng)音頻娛樂產(chǎn)品負(fù)責(zé)人楊帆,圍繞“音頻社交行業(yè)現(xiàn)狀及海內(nèi)外趨勢(shì)展望、“音頻技術(shù)與行業(yè)發(fā)展”等話題展開圓桌討論。
談到當(dāng)前的音頻社交行業(yè),楊帆指出,音頻社交近幾年的市場(chǎng)規(guī)模仍在持續(xù)增長,依舊有廣闊的發(fā)展空間,總體來說,音頻社交的主要玩法集中在多人語聊房、1V1語聊、語音播客、游戲開黑等場(chǎng)景。薛達(dá)認(rèn)為,作為用戶之間情感的遞進(jìn)紐帶,語音結(jié)合虛擬人以及類似ChatGPT這樣的大模型,可能未來會(huì)帶來一波新的社交熱潮。
在市場(chǎng)火熱的前景下,音頻技術(shù)的提升對(duì)行業(yè)來說可謂如虎添翼。正如薛達(dá)提到,降噪技術(shù)是實(shí)現(xiàn)元宇宙空間中用戶體驗(yàn)的一個(gè)必不可少因素,因?yàn)橐话銑蕵穲?chǎng)景中都會(huì)播放背景音樂,加上人聲和互動(dòng)音效,如果沒有空間音頻和降噪,那用戶體驗(yàn)會(huì)非常差。吳浩亮認(rèn)為,聲音是打造差異化社交玩法的一個(gè)重要能力,在社交音頻這個(gè)賽道上,大致分為音視頻直播、音頻內(nèi)容生態(tài),以及泛娛樂音頻三個(gè)類型,音頻技術(shù)能力的提升可以有效助力業(yè)務(wù)端提升用戶體驗(yàn)。
不僅國內(nèi)市場(chǎng)火熱,大量出海企業(yè)也押注音頻社交這一賽道且扎堆中東、東南亞市場(chǎng),劉武華認(rèn)為中東市場(chǎng)這種大R市場(chǎng)天然契合音頻社交的商業(yè)變現(xiàn)形態(tài),而東南亞市場(chǎng)年輕用戶多,社交需求旺盛又熱衷于嘗試新鮮事物,且這兩個(gè)市場(chǎng)已有成熟的產(chǎn)品形態(tài)和產(chǎn)業(yè)鏈。此外,吳浩亮提到,東南亞和中東市場(chǎng)目前還處在快速發(fā)展階段,市場(chǎng)機(jī)遇大、用戶基數(shù)大,但還沒有絕對(duì)的寡頭形成,較之前傳統(tǒng)社交類型來講,音頻社交的留存能力也較高,企業(yè)需要在用戶感興趣的窗口期盡快實(shí)現(xiàn)轉(zhuǎn)化。
談到音頻社交的未來趨勢(shì),劉武華表示,社交+游戲、社交+元宇宙、社交+ AIGC 這幾種玩法有不錯(cuò)的發(fā)展空間和前景。楊帆也認(rèn)為,元宇宙方向的場(chǎng)景會(huì)更受年輕人青睞,另外 AIGC 配合語音轉(zhuǎn)文字等應(yīng)用,應(yīng)該也會(huì)帶來一波新AI音頻社交熱潮。
(責(zé)任編輯:宋政 HN002)【免責(zé)聲明】本文僅代表第三方觀點(diǎn),不代表和訊網(wǎng)立場(chǎng)。投資者據(jù)此操作,風(fēng)險(xiǎn)請(qǐng)自擔(dān)。
關(guān)鍵詞: