語音喚醒芯片主要是通過持續(xù)監(jiān)聽喚醒詞,在接受到喚醒詞以后從低功耗狀態(tài)下觸發(fā)設(shè)備從休眠模式轉(zhuǎn)為工作模式。目前廣泛應(yīng)用于各種智能音箱和智能家居當(dāng)中。下面小編和大家講講語音喚醒芯片是怎么實現(xiàn)這一過程的。

一、聲音收集
語音喚醒芯片通過麥克風(fēng)來收集用戶的聲音,然后把聲音轉(zhuǎn)換為電信號,有時候還會采用雙麥克陣列或者多麥克風(fēng)陣列來提升識別準(zhǔn)確度,以WTK6900系列為例就有一部分是支持多陣列麥克風(fēng),能實時監(jiān)測周圍環(huán)境聲音,最遠支持10米遠場識別。
二、信號處理
在收集聲音轉(zhuǎn)化為電信號以后,還需要針對信號進行處理,因為原始的聲音往往會有一部分環(huán)境噪音存在,在進行識別之前會對這些環(huán)境噪音進行一些預(yù)處理。
三、語義識別
這部分往往是由語音芯片上的微識別模型來處理的,模型可以針對性的進行訓(xùn)練,最后進行喚醒詞匹配。
四、喚醒詞匹配
喚醒詞匹配目前主流的方案都是通過輕量化的神經(jīng)網(wǎng)絡(luò)模型比如CNN、DNN等進行模型訓(xùn)練,用大量的喚醒詞樣本和非喚醒詞樣本進行訓(xùn)練,讓模型能夠區(qū)分。
以上就是關(guān)于“語音喚醒芯片是怎么實現(xiàn)的”的全部內(nèi)容了,希望可以幫助到大家。如果還有不明白的地方可以聯(lián)系我們的在線客服。