摘要:提出基于深層聲學(xué)特征的端到端單聲道語(yǔ)音分離算法,傳統(tǒng)聲學(xué)特征提取方法需要經(jīng)過(guò)傅里葉變換、離散余弦變換等操作,會(huì)造成語(yǔ)音能量損失以及長(zhǎng)時(shí)間延遲.為了改善這些問(wèn)題,提出了以語(yǔ)音信號(hào)的原始波形作為深度神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)網(wǎng)絡(luò)模型來(lái)學(xué)習(xí)語(yǔ)音信號(hào)的更深層次的聲學(xué)特征,實(shí)現(xiàn)端到端的語(yǔ)音分離.客觀評(píng)價(jià)實(shí)驗(yàn)說(shuō)明,本文提出的分離算法不僅有效地提升了語(yǔ)音分離的性能,也減少了語(yǔ)音分離算法的時(shí)間延遲.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中國(guó)科學(xué)院;主辦單位:中國(guó)科學(xué)院軟件研究所
一對(duì)一咨詢服務(wù)、簡(jiǎn)單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >