テキストから音の生成AIの「Make-An-Audio」を中国(北京大学、Bytedanceなど)が発表。
様々なテキストから音生様々なテキストから音生成可能。
すごいのが画像や動画を入力として音声生成できる!
ttps://text-to-audio.github.io/paper.pdf
ttps://text-to-audio.github.io/