ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images
Feb 21, 2020•22 min
Episode description
ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました.
今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384
サポーターも募集中です. https://www.patreon.com/jojonki
For the best experience, listen in Metacast app for iOS or Android
