遠傳科技丨好家伙,大叔變聲“妙音娘子”只需一步
市民呼入到某市12345熱線,坐席接聽后邀請第三方部門進行三方通話。
與以往不同的是,坐席、所屬部門聽到市民的聲音是變聲的。
在通話中,感覺是一位聲音甜美的“妙音娘子”,
實則,在通話背后的是一位鏗鏘有力的中年男士。
現實生活中,人們追求個性,也注重隱私。
在人工智能技術加持下,智能交互將不僅需要滿足多場景下的交互需求,客戶體驗也迎來了革新,能幫助用戶展現自己的“多面人格”的同時,保障用戶的隱私權利。
在音頻處理領域,“變聲”是一個相對常見的功能,語音消息的變聲不難,但是在類似12345熱線中實時變聲,卻是個大挑戰。要保證在用戶無感的超低延時下對人聲進行特殊處理,怎么辦呢?
變聲的原理,是通過改變人聲的音調、音色,使輸出聲音在感官上與原始聲音不同。通過提取原聲語音中的內容信息,包括原聲的節奏和情感,再結合特定人的音色進行轉換結合,復刻模仿特定人的聲音。這種基于音色與內容分離的聲音轉換技術,實現了聲音的cosplay,對用戶本身的音色沒有任何限制。
遠傳科技推出了MVGateWay變聲技術,是智能語音方面新的突破,語音變聲不僅能實現說話人音色的逼真轉換,而且還能將說話人的語速、停頓等韻律、情感、言語方式在所指定的人物角色逼真體現出來,在不同人的聲音中切換自如實現自然的變聲效果。
▼ 可實現以下功能 ▼
?音色個性化定制:根據客戶場景,靈活定制各類變聲音色,如大叔變蘿莉;大叔變“妙音娘子”;
?多場景變聲服務:針對變聲需求,提供語音實時變聲、非實時變聲,靈活滿足不同場景
?高性能服務保障:提供300路坐席并發的服務支撐
?穩定技術接口:滿足多種產品端接入需求,提供穩定技術接口,可靈活定制
遠傳科技的MVGateWay變聲技術不僅可以對通話中聲音的變聲處理和控制,完成對呼叫的控制和對媒體的控制,還兼容遠傳自研的全媒體智能交互平臺U-IPCC系統,并作為一個補充模塊加入到IPCC 7.0系統中,實現啟動變聲控制、停止變聲控制、呼叫控制、媒體控制等功能。在專業客服、聲音美化、虛擬IP、電商直播等領域有著豐富的應用空間。滿足客戶多種應用場景下實現語音“變聲”,讓交互體驗更加豐富。