もっと詳しく

3つの要点 ?? より人間らしいジェスチャー生成のための大規模なマルチモーダルデータセットであるBEAT(Body-Expression-Audio-Text Dataset)を構築 ?? BEATを用いたジェスチャー生成のためのベースラインモデルであるCaMN(Cascaded Motion Network)を提案 ?? 生成されたジェスチャーの多様性を評価する…