如何判斷汽車語音識別系統(tǒng)的性能優(yōu)劣?
要判斷汽車語音識別系統(tǒng)的性能優(yōu)劣,可以從以下幾個(gè)方面入手。
首先是誤喚醒率,主喚醒詞誤喚醒率應(yīng)小于 0.2 次/小時(shí),除主喚醒詞外其他免喚醒詞綜合誤喚醒率小于 1.5 次/小時(shí)。測試時(shí)可搭建實(shí)際場景,人工嘴播放測試音頻,至少播放 10 小時(shí)。
其次是喚醒率,不同場景下車速、音樂、車窗、空調(diào)、人聲等因素會影響喚醒率。比如在停車場,車速為 0 時(shí)喚醒率較高。
然后是識別率,通常以字識別率和句識別率為驗(yàn)收標(biāo)準(zhǔn),可用詞錯(cuò)誤率來評測,通過編輯距離算法計(jì)算替換、刪除和插入錯(cuò)誤。
還有響應(yīng)時(shí)間,包括喚醒響應(yīng)時(shí)間和識別響應(yīng)時(shí)間,喚醒響應(yīng)時(shí)間平均應(yīng)小于 0.6 秒,識別響應(yīng)時(shí)間平均應(yīng)小于 1.3 秒。
此外,麥克風(fēng)硬件規(guī)格也很重要,比如電容麥克風(fēng)通常比動圈麥克風(fēng)靈敏度高。硬件實(shí)際狀態(tài)如噪音、麥克風(fēng)數(shù)量和位置等會影響識別效果。回聲消除算法能優(yōu)化語音交互,產(chǎn)品還可設(shè)計(jì) VAD 截?cái)鄷r(shí)長來適應(yīng)不同場景。
最后,可參考車載智能語音系統(tǒng)的測試與評價(jià)方法,從語音喚醒成功率、誤喚醒率、識別成功率、音源定位準(zhǔn)確率、聲紋鑒別率、回聲消除能力、響應(yīng)識別時(shí)間、語音資源占用、系統(tǒng)穩(wěn)定性等方面綜合評估。
最新問答

