グーグル、LLMを活用したマルチモーダル動画生成モデル「VideoPoet」発表

IT総合
グーグルの研究開発機関Google Researchは12月19日、テキストや画像から動画を生成するなど様々な動画生成タスクに対応できる大規模言語モデル「VideoPoet」を発表した。
Sourc

リンク元

コメント

タイトルとURLをコピーしました