【2025年最新】動画生成AI「Vidu」とは?Soraとの違い、使い方、料金まで専門家が徹底解説のPodcast
下記のPodcastは、Geminiで作成しました。
はじめに:AI動画革命に新たな挑戦者「Vidu」登場
生成AIがコンテンツ制作の世界に地殻変動をもたらし、その最後のフロンティアである動画生成の分野が今、大きな注目を集めています。OpenAIの「Sora」が巻き起こした衝撃は記憶に新しいですが、そのSoraに追随するだけでなく、独自の革新を携えて登場した強力な挑戦者が「Vidu」です 。
Viduは、中国の名門である清華大学とAIスタートアップの生数科技(Shengshu Technology)との戦略的提携によって生まれた、高忠実度の動画生成モデルです 。その最大の特徴は、生成される動画の高い「一貫性」、ダイナミックな「動き」、そして驚異的な「生成速度」にあります 。
本記事では、このViduについて、専門家の視点から徹底的に掘り下げます。その核心技術である「U-ViTアーキテクチャ」から、競合を凌駕する画期的な機能、初心者にも分かりやすい実践的な使い方、そしてSoraやRunway、Pikaといった他の主要AIツールとの詳細な比較、さらには料金体系やビジネスモデル、開発の背景にある倫理的枠組みに至るまで、包括的な情報を提供します。
第1章 Viduの物語:世界のAI開発競争に対する中国の答え
Viduの誕生
Viduは、生数科技と清華大学の共同開発によって生まれました。このプロジェクトは、学術的な研究開発力と商業的な野心が見事に融合した事例と言えるでしょう 。生数科技の中核チームは清華大学のAI産業研究院(AIR)出身者で構成され、アリババ傘下のアントグループや百度(Baidu)といった巨大IT企業からの資金調達にも成功しており、その信頼性と将来性が高く評価されています 。
戦略的ポジショニング
Viduの登場は、中国が生成AI分野でリーダーシップを確立しようとする国家的な動きの中で、非常に重要な意味を持ちます 。国内では「国産Sora」として位置づけられ、欧米のモデルと直接競合する性能を目指すと同時に、パンダや龍といった中国独自の文化的要素を深く理解し、生成できる能力も備えています 。
迅速な開発とグローバル展開
特筆すべきは、Soraの発表からわずか2ヶ月という驚異的な速さでViduがデビューしたことです。これは、一夜漬けの開発ではなく、長年にわたる基礎研究の蓄積があったからこそ可能になりました 。Viduはその後もV1.5、V2.0、そして2025年4月に発表された最新のQ1モデルへと急速な進化を遂げています 。現在、Viduは世界中で利用可能となっており、2025年2月にはAPIも公開されたことから、その戦略が中国国内市場にとどまらないグローバルなものであることが伺えます 。
Viduを単なる「Soraの模倣」や「追撃者」と見るのは、本質を見誤る可能性があります。Viduの核心技術であるU-ViTアーキテクチャが論文で提案されたのは2022年9月であり、Soraが採用するDiTアーキテクチャが発表された2022年12月よりも早かったのです 。この事実は、ViduがSoraへの対抗として急遽開発されたのではなく、独自の技術ロードマップに沿って並行して進められてきた研究の成果であることを示唆しています。これは単なる技術的な優位性の主張に留まらず、中国の科学技術における自立と革新の象徴として、国内メディアでも大きく取り上げられています 。世界のAI開発競争は、一方が他方を追いかける単純なレースではなく、複数のイノベーションハブが独立して同様の結論に到達する「パラレルイノベーション(並行進化)」の様相を呈しているのです。
第2章 Viduを支える心臓部:U-ViTアーキテクチャの秘密
コア技術の解説
Viduの卓越した性能を理解するためには、その根幹をなす2つの技術、「Diffusionモデル」と「Transformerモデル」をまず理解する必要があります。
- Diffusion(拡散)モデル:彫刻家が大理石の塊(ノイズ)から始め、少しずつ削っていくことで最終的に美しい彫像(鮮明な動画)を創り出すプロセスに似ています。ノイズだらけの状態から徐々にノイズを取り除き、クリーンな映像を生成する技術です。
- Transformerモデル:長い文章の文法や文脈を理解するように、動画のような長いシーケンス(時間の連なり)における関係性を理解する「頭脳」の役割を果たします。これにより、動画全体を通して時間的な一貫性を保つことが可能になります 。
U-ViTによるブレークスルー
Viduの真の革新性は、これら2つのモデルを融合させた独自の「U-ViT(Universal Vision Transformer)」アーキテクチャにあります 。U-ViTは、時間、テキストによる指示、動画の各フレームといった全ての入力情報を「トークン」という統一された言語として扱います。これにより、Transformerモデルが全体を包括的に処理できるようになり、旧来のU-Netベースのアーキテクチャが抱えていた限界を打ち破りました 。
U-ViTがもたらす価値
このU-ViTアーキテクチャは、Viduに以下のような決定的な利点をもたらしています。
- スケーラビリティ(拡張性):一度の生成で最大16秒から32秒という、従来モデルより長い動画の生成を可能にしました 。最新のQ1モデルでは、最大5秒のクリップでスタジオ品質の出力を実現することに注力しています 。
- コヒーレンス(一貫性):フレーム間でキャラクターやオブジェクトの見た目が崩れることなく、一貫性を維持します 。
- フレキシビリティ(柔軟性):このアーキテクチャは本質的にマルチモーダル(複数の情報形式を扱える)であり、将来的には動画生成以外のタスクにも応用可能です 。
前述の通り、このU-ViTアーキテクチャは、生数科技のチーフサイエンティストである朱軍教授のチームによって2022年9月に提案されており、Soraが採用するDiT(Diffusion Transformer)アーキテクチャの発表(2022年12月)に先行していました。この事実は、Viduが独自の技術的基盤の上に成り立っていることを明確に示しています。
第3章 Viduの画期的な機能群を徹底解剖
前例のない一貫性:「コンシステンシー機能」
- Multiple-Entity Consistency(複数要素の一貫性):Viduの看板機能です。ユーザーは、人物、オブジェクト、背景など、最大7枚の互いに関連のない画像をアップロードするだけで、Viduがそれらを自然に統合し、一つの矛盾のない動画を生成します 。これは、従来のモデルで頻発した「動画の途中でキャラクターの服装が変わる」といった問題を根本的に解決するもので、特に広告制作などプロの現場で絶大な効果を発揮します 。実際に、この機能を用いてキャラクターの一貫性を保ったまま全編AIでアニメシリーズを制作するプロジェクトも進行しています 。
- Multiple-Angle Consistency(複数アングルの一貫性):被写体を写した複数枚の写真をアップロードすることで、AIがその間の映像を補完し、まるで360度から撮影したかのような滑らかな映像を生成します。これにより、生成される映像のリアリティが飛躍的に向上します 。
クリエイターの道具箱:「生成モード」
- Text-to-Video(テキストから動画へ):テキスト(プロンプト)を入力して動画を生成する最も基本的なモードです 。
- Image-to-Video(画像から動画へ):一枚の静止画に生命を吹き込み、ダイナミックな動きを持つ動画へと変換します 。
- Reference-to-Video(参照画像から動画へ):画像を参照元として強く指定し、そのスタイル、キャラクター、シーンの雰囲気を忠実に再現した動画を生成するアドバンスモード。前述の一貫性維持機能はこのモードで最大限に活かされます 。
映画のような表現力:「高度なコントロール機能」
- First & Last Frames Control(始点・終点フレーム制御):ユーザーが動画の開始フレームと終了フレームの画像をアップロードすると、Viduがその間の滑らかなトランジション(場面転換)を自動で生成する非常に強力な機能です 。最新のQ1モデルではこの機能がさらに強化され、VFXアーティストが作成するようなプロ級のトランジションを生成できます 。
- ダイナミックなカメラワーク:Viduは、長回し、フォーカスの移動、ズーム、パンといった複雑なカメラワークを理解し、生成することができます。これにより、旧来のモデルのような単調な固定ショットから脱却し、より映画的な表現が可能になりました 。
スピードと品質の両立
- 驚異的な生成速度:4秒の動画クリップをわずか10秒から30秒で生成するという、業界トップクラスのスピードを誇ります 。Q1モデルでもこの高速性は維持されています 。
- 高解像度:生成される動画は、鮮明な1080pのHD画質に対応しています 。
特定分野での強み:スタイルと文化
- 優れたアニメ生成能力:Viduは、自然なキャラクターの動きを持つ高品質なアニメーションの生成に特化した強みを持っており、これは市場における明確な差別化要因となっています 。Q1モデルでは、より鮮明なビジュアルと滑らかなフレームの融合により、アニメ生成能力がさらに向上しています 。
- 文化的な理解度:グローバルモデルにはない強みとして、中国特有の文化的要素を深く理解し、自然に生成する能力が挙げられます 。
最新モデルQ1の革新
2025年4月にリリースされたVidu Q1モデルは、これまでの機能を大幅に強化し、新たな次元の動画生成を可能にしました 。
- 高忠実度な音声生成:テキストプロンプトから、業界初の48kHzサンプリングレートの高品質なBGMや効果音を、映像と同期させて生成する機能が搭載されました。これにより、外部ツールなしで没入感のあるサウンドトラックを作成できます 。
- セマンティック理解の進化:最大7枚の参照画像とプロンプトから文脈を深く理解し、プロンプトに明示されていない要素(例:バイオリンを弾く女性の画像がない状態で「女性がバイオリンを弾く」と指示すると、自然にバイオリンを生成する)を推論して生成する能力を獲得しました 。
- 品質とフレームレートの向上:解像度は1080pを維持しつつ、フレームレートが24fpsに向上し、より滑らかで映画的な映像表現が可能になりました 。
第4章 実践ガイド:Viduで創る、あなたの最初の傑作
ステップ1:利用開始
まずは公式サイトからアカウントを登録します。以前は招待コードが必要でしたが、現在は誰でも登録可能です 。登録が完了すると、動画生成に使える無料クレジットが付与されます 。
ステップ2:初心者向けウォークスルー(テキストから動画生成)
- ダッシュボードから「Create Video」または「Text to Video」を選択します 。
- 生成したい動画の内容をテキストで入力します。ここでは、「未来都市のハイウェイを、光の尾を引くサイバーパンクなバイクが高速で疾走する。ドローンがバイクを追いかける視点。」
- 「Style」から「リアル(実写風)」か「アニメ(アニメ風)」を選び、アスペクト比などを設定します。ここでは、リアルを選択
- 「Create」ボタンを押して生成を開始。完成した動画をプレビューし、必要であれば「Upscale」機能でさらに高画質化することも可能です 。
出来上がった動画は以下の通り。
ステップ3:応用テクニック(画像・参照画像から動画生成)
- 「ハグ動画」の作り方:SNSで人気の、2人の人物が抱きしめ合う動画は簡単に作成できます。「Image to Video」を選び、2人を並べたコラージュ画像をアップロードし、「抱きしめる」といったプロンプトを入力するだけです 。
- 一貫性のあるキャラクター動画:「Reference to Video」または「Multi-Reference Consistency」機能を活用します。まずキャラクターの画像をアップロードして「参照元」として指定し、次にそのキャラクターにさせたい行動をプロンプトで指示します 。Q1モデルでは最大7枚の参照画像を使えるため、より複雑なシーンも一貫性を保ったまま生成できます 。
- 映画的な場面転換:「First & Last Frames Control」機能を使い、動画の開始点と終了点にしたい2枚の画像をそれぞれアップロードすることで、その間を繋ぐ自然な映像を生成できます 。
例1:Abuacus AIで作成した「日本人の女の子とお父さんがこちらを向いている画像」を添付し、プロンプトに「抱きしめる」を入れて生成された動画は以下の通り。
例2:Abuacus AIで作成した3枚の画像と「参照画像1のサイバーパンクな侍の顔のクローズアップから始まる。次に、参照画像2の雨に濡れたネオン街を彼が力強く歩くシーンへ移行する。光る刀で何かを素早く弾く短いアクションシーンを挟む。最後に、参照画像3の静かな竹林で彼が刀を静かに下ろし、瞑想するシーンで終わる。全体を通して映画のようなカメラワークで、シーンは滑らかに繋がること。」と入れて生成した動画は以下の通り。
例3:AIテンプレートの「Fluffy Diver」を選択し、Abuacus AIで作成した虎の画像を添付して生成した動画は以下の通り。
ステップ4:日本のユーザー向け重要ポイント
- 言語対応:インターフェースは英語と中国語のみですが、ブラウザの翻訳機能を使えば問題なく操作できます 。そして最も重要な点として、プロンプトは日本語で入力することが可能です 。
- プロンプトのコツ:現時点では、複雑な指示よりもシンプルなプロンプトの方が良い結果を得やすいです。特に、登場人物を1人に絞ると、より自然な動画が生成されやすい傾向にあります 。また、日本語でプロンプトを入力すると、欧米人よりも自然なアジア系の人物が生成されやすいという特徴もあります 。
- 現在の限界点:Q1モデルで品質は大幅に向上したものの、ユーザーからは、非常に複雑なシーンや稀なプロンプトに対して、時折アーティファクト(不自然な描画)が発生したり、プロンプトの意図を誤解したりすることが指摘されています 。
第5章 Viduの実力:競合AIとの徹底比較
競争の構図
動画生成AIの市場には、すでに強力なプレイヤーが存在します。リアリズムの頂点を目指す「Sora」、プロのクリエイター向けに高度な編集機能を提供する「Runway」、手軽さとスピードを重視する「Pika」、そして2025年5月に登場し、音声生成機能で業界を驚かせたGoogleの「Veo 3」 。Viduは、これらの競合とは異なる独自のポジションを築いています。
AI動画生成ツール 機能比較マトリクス(2025年版)
Viduの価値を客観的に評価するため、主要な競合ツールとの機能を一覧表にまとめました。この表を見れば、各ツールの長所と短所、そしてどのようなユーザーに最適なのかが一目でわかります。Viduが、Runwayのようなプロ向け機能とPikaのような手軽さを、いかにユニークな形で両立させているかが明確になるでしょう。
| 特徴 | Vidu (生数科技) | Sora (OpenAI) | Runway (Gen-4) | Pika Labs (Pika 2.2) | Google Veo 3 |
| 最大動画長 | 最大32秒(Q1モデルは5秒) | 最大60秒 | 最大16秒 | 最大25秒 | 最大8秒 |
| 最大解像度 | 1080p | 1080pと報告 | 最大4K | 1080p | 4K |
| コア技術 | U-ViT (Diffusion + Transformer) | DiT (Diffusion + Transformer) | Gen-4 モデル | 独自モデル | 独自モデル |
| 最大の強み | 複数要素の一貫性(最大7枚)、音声生成、速度、アニメ、API連携 | 現実世界の物理法則を再現するリアリズム、長尺動画 | 高度なクリエイティブ制御(部分的な動きの指定など)、プロ向けツール群 | 圧倒的な使いやすさ、速度、SNS特化、寛大な無料プラン | ネイティブ音声生成、物理シミュレーション、編集ツールFlowとの統合 |
| ターゲット層 | プロシューマー、広告代理店、開発者、アニメ制作者 | ハイエンドな映画制作者、スタジオ(当初) | プロの映像作家、デザイナー、クリエイティブエージェンシー | SNSクリエイター、マーケター、一般ユーザー | 映画制作者、クリエイター、一般ユーザー |
| 料金モデル | クレジット制、サブスクリプション制、APIアクセス、無料プランあり | 未公開(高価格帯と予想) | サブスクリプション制、クレジット制 | サブスクリプション制、クレジット制、寛大な無料プラン | サブスクリプション制(Gemini Ultraプラン) |
頂上決戦:Vidu vs. Sora & Veo 3
- Viduの強み:キャラクターやオブジェクトの「一貫性」(最大7枚の参照画像)と、テキストからの「音声生成」機能は、現時点でSoraや他の多くのモデルに対する明確なアドバンテージです 。また、生成の「速度」、中国文化への深い理解、そして「今すぐ使えるAPI」の存在も大きな強みです 。
- Soraの強み:最大60秒という動画の「長さ」、物理法則をシミュレートする圧倒的な「リアリズム」において、依然としてSoraは強力な存在です 。
- Veo 3の強み:GoogleのVeo 3は、Viduと同様にネイティブな音声生成機能を持ち、さらに4Kという高解像度と、Flowという専用編集ツールとのシームレスな連携が強みです 。
- ユーザーの評価:評価は分かれています。一部のユーザーはViduを「Soraより3ヶ月遅れている」と評する一方で 、Soraの映像を「ストックビデオのようだ」と感じ、Viduの方が「映画のワンシーンらしい」と評価する声もあります 。映像制作専門誌『Y.M.Cinema Magazine』は、Soraのコンテンツを「ジャンクフード」と評し、Viduをよりアーティストに寄り添った選択肢として紹介しています 。
市場でのポジショニング:Vidu vs. Runway & Pika
- Vidu vs. Runway:Runwayは、映像の特定の部分だけを動かすなど、最大限のクリエイティブコントロールを求めるプロ向けのツールですが、その分操作は複雑です 。Viduは、そこまで複雑な操作をせずとも高いレベルの一貫性を実現できる、より手軽な選択肢と言えます。
- Vidu vs. Pika:Pikaは、SNS向けの短い動画を誰でも簡単に、そして素早く作るためのツールとしては最高峰ですが、品質の一貫性や高度な機能ではViduに及びません 。Viduは、Pikaから一歩ステップアップし、より本格的な動画制作を目指すクリエイターに適しています。
この市場分析から、Viduが狙う独自のポジションが見えてきます。市場は、Runwayのような「ハイエンド・プロフェッショナル向け」、Pikaのような「マス市場・カジュアル向け」、そしてSoraやVeo 3のような「理想的なリアリズムと統合機能の追求」というセグメントに分かれつつあります。Viduは、これらのいずれとも少し異なります。プロ向けの機能を持ちながらRunwayより手軽で、Pikaよりも高品質で一貫性があります。これは、Viduが「プロシューマー」や中小企業(SME)という、新たなニッチ市場を戦略的に狙っていることを示唆しています。つまり、プロフェッショナルな成果を求めるものの、高価で複雑なツールを導入する予算や時間がないデジタル広告代理店、フリーのクリエイター、企業のマーケティングチームなどにとって、Viduの「高度な一貫性」「スピード」「手頃な価格」という組み合わせは、まさに最適なソリューションとなり得るのです。
第6章 AIのビジネスモデル:Viduの料金、API、商用利用
料金体系の詳細
- 個人向けプラン:Viduは無料プランを提供しており、毎月80クレジットが付与されます。4秒の動画を1本生成するのに4クレジットを消費するため、月に約20本の動画を無料で試すことができます 。有料プランは、Standardプランが月額28(年払い)、Ultimateプランが月額$79(年払い)から利用でき、より多くのクレジットや機能が提供されます 。
- 法人・開発者向け(API):APIを利用する場合の料金は、1クレジットあたり0.20から10からと非常に低く設定されており、利用開始にあたっての審査プロセスも不要なため、中小企業や個人開発者でも気軽に導入できます 。Q1モデルのReference-to-Video機能を使った5秒の1080p動画生成は、わずか$0.14で可能と報告されています 。
商用利用ポリシー
ビジネスで利用する上で最も重要な点ですが、生成した動画を商用目的で利用したり、動画内のウォーターマーク(透かし)を削除したりするには、有料プランへの加入が必須となります 。
APIファースト戦略
生数科技は、ViduをB2B(法人向け)のAPIとして提供することに力を入れています。これは、他の広告技術プラットフォームや企業が、自社で巨額の研究開発投資をすることなく、ViduのAI動画生成機能を自社サービスに組み込めるようにする「ホワイトラベル」戦略です 。この戦略を推進するため、「Vidu Creative Leap Program」を立ち上げ、広告やeコマース業界での活用を促進しています 。これは、クラウドコンピューティングにおけるAWS(Amazon Web Services)の成功モデルに似ており、Metaのような巨大企業が自社ツールを開発している間に、Viduは市場のインフラ(つるはしとシャベル)を提供することで、先行者利益を獲得しようとしています 。
第7章 Viduの未来と倫理的課題
Viduのロードマップ
Viduは、バージョン1.5から2.0、そして最新のQ1モデルへと、非常に速いペースでアップデートを重ねており、継続的な進化への強い意志が感じられます 。2025年7月にはQ1モデルがアップデートされ、最大7枚の参照画像をサポートするようになりました 。開発元は、将来的には映画、ゲーム、デザインといった分野への応用を目指していると公言しています 。
クリエイターとのエコシステム
Viduは「Vidu for creators program」や「Vidu大模型合作伙伴计划(Vidu大規模モデルパートナープログラム)」といった取り組みを通じて、クリエイターやパートナー企業とのエコシステム構築にも意欲的です 。その一環として、ロサンゼルスのAura Productionsと提携し、全編AIで制作されるSFアニメシリーズの共同制作を発表しています 。
倫理的枠組み
Viduの開発は、チーフサイエンティストである朱軍教授が所属する清華大学の研究倫理と深く結びついています。朱軍教授は、AIの安全性に関する議論をリードする重要人物の一人です 。
Viduの開発は、中国の国家レベルで定められたAI倫理ガイドラインの下で行われています。その中核となるのは、「AIは安全、制御可能、信頼できるものであるべき」「プライバシーを尊重する」「最終的な責任は人間が負う」といった原則です 。この倫理的・法的枠組みは、Viduのコンテンツフィルタリングや安全機能の設計に直接的な影響を与えていると考えられます。これは、米国の企業が異なる法規制や倫理観の下で運営されていることと比較すると、単なる技術的な違いではなく、哲学的な違いとも言えるでしょう。
この点は、Soraが一部から「アートの価値を貶める」「機械的な凡作を量産する」と批判され、それに対してViduが「よりアーティストフレンドリーな選択肢」として位置づけられていることとも関連しています 。
結論:Viduはあなたにとって最適なツールか?
Viduの総括
Viduは、高速かつ高い一貫性を誇る動画生成AIであり、特にキャラクターやオブジェクトの表現において強力な制御機能を持っています。手頃な価格のAPIを提供し、アニメや広告といった商業分野での応用を強く意識している点が特徴です。最新のQ1モデルでは、音声生成機能も加わり、オールインワンの動画制作ツールへと進化しています。
長所と短所の再確認
- 長所:比類なきキャラクター・オブジェクトの一貫性(最大7枚の参照画像)、テキストからの高品質な音声生成、驚異的な生成速度、ビジネスで利用しやすいAPI、優れたアニメ生成能力、始点・終点フレーム指定による映画的なコントロール。
- 短所:SoraやVeo 3と比較して最大動画長が短いこと、リアリズムの面ではまだ改善の余地があること、複雑なシーンではまだ課題が残ること 。
最終的な推奨
- Viduを選ぶべき人:デジタルマーケター、広告制作者、あるいは一貫性のある高品質なショート動画を大量に、そして迅速に制作する必要があるコンテンツクリエイター。キャラクターやブランドの一貫性を何よりも重視し、映像と音声を一括で生成したい方。自社アプリに動画生成AIを組み込みたい開発者。そして、アニメ制作者。
- 他の選択肢を検討すべき人:1分を超えるような、単一の超リアルな動画クリップを生成することが最優先なら、Soraの一般公開を待つのが賢明でしょう。4K解像度や、より高度な物理シミュレーション、専用編集ツールとの連携を求めるなら、GoogleのVeo 3が有力な選択肢です 。映像の細部に至るまで、プロレベルの編集コントロールを求めるなら、Runwayが適しています。そして、とにかく手軽に、楽しくSNS用の動画を作りたいのであれば、Pika Labsが最高の選択肢です。
参考資料
- ShengShu's Vidu: The AI Ad Tech Disruptor Outpacing Meta, https://www.ainvest.com/news/shengshu-vidu-ai-ad-tech-disruptor-outpacing-meta-2507/
- Get App Try Vidu. AI Video Generator., https://www.vidu.com/
- ShengShu Technology Lays Foundation for Scalable AI Video Generation with Launch of Vidu API Offering Instant Access and Industry-leading Speed for Enterprises & Developers, https://www.prnewswire.com/news-releases/shengshu-technology-lays-foundation-for-scalable-ai-video-generation-with-launch-of-vidu-api-offering-instant-access-and-industry-leading-speed-for-enterprises--developers-302375882.html
- Can Shengshu’s Vidu AI text-to-video generator outcompete its rivals?, https://kr-asia.com/can-shengshus-vidu-ai-text-to-video-generator-outcompete-its-rivals
- China's text-to-video model Vidu available for global users, http://en.people.cn/n3/2024/0803/c90000-20201727.html
- Vidu: Text-to-Video AI from Shengshu Technology, https://www.youtube.com/watch?v=18UGEObCVQo
- 中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu, https://wap.eastmoney.com/a/202404273062205395.html
- 国内首个纯自研视频大模型发布, https://www.tsinghua.edu.cn/info/1182/111163.htm
- 对话生数科技CEO唐家渝:文生视频大模型Vidu面世,对标Sora,核心技术U-ViT早于DiT提出, https://www.21jingji.com/article/20240428/herald/c975257f8cdd7901a7900fa8c8f57dc1.html
- 启明星| 全面对标Sora,生数科技联合清华大学推出中国首个纯自研视频大模型Vidu,(https://www.qimingvc.com/cn/news/%E5%90%AF%E6%98%8E%E6%98%9F-%E5%85%A8%E9%9D%A2%E5%AF%B9%E6%A0%87sora%EF%BC%8C%E7%94%9F%E6%95%B0%E7%A7%91%E6%8A%80%E8%81%94%E5%90%88%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6%E6%8E%A8%E5%87%BA%E4%B8%AD%E5%9B%BD%E9%A6%96%E4%B8%AA%E7%BA%AF%E8%87%AA%E7%A0%94%E8%A7%86%E9%A2%91%E5%A4%A7%E6%A8%A1%E5%9E%8Bvidu)
- 【生数科技与清华联合推出视频大模型Vidu】, https://www.cls.cn/detail/1661634
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video, https://arxiv.org/html/2405.04233v1
- Papers Explained #342: U-ViT, https://ritvik19.medium.com/papers-explained-342-u-vit-54c907b849c8
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://www.emergentmind.com/papers/2405.04233
- [2405.04233] Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://arxiv.org/abs/2405.04233
- All Are Worth Words: A ViT Backbone for Diffusion Models,(https://openaccess.thecvf.com/content/CVPR2023/papers/Bao_All_Are_Worth_Words_A_ViT_Backbone_for_Diffusion_Models_CVPR_2023_paper.pdf)
- Vidu 1.5 Launch Marks New Emergence in Multimodal AI, to Introduce Groundbreaking Consistency Controls that Reshape the Future of AI Video Production, https://www.prnewswire.com/news-releases/vidu-1-5-launch-marks-new-emergence-in-multimodal-ai-to-introduce-groundbreaking-consistency-controls-that-reshape-the-future-of-ai-video-production-302304364.html
- China’s VIDU Video Generation AI Competes With OpenAI’s Sora,(https://medium.com/@ShahabH/chinas-vidu-video-generation-ai-competes-with-openai-s-sora-bfef80c8475e)
- Chinese competitor Vidu rivals OpenAI's Sora | Cybernews, https://cybernews.com/tech/vidu-text-to-video-model-rivals-sora/
- Vidu vs Sora: Which AI Video Tool is the REAL Champ in 2024?,(https://www.youtube.com/watch?v=loxBm1t7Cf8)
- A new Chinese competitor to Sora.ai, Vidu, and how it compares,(https://www.reddit.com/r/SoraAi/comments/1cf5lpt/a_new_chinese_competitor_to_soraai_vidu_and_how/)
- Meet Vidu: A Sora Killer?, https://ymcinema.com/2024/04/30/meet-vidu-a-sora-killer/
- Vidu - Chinas new Sora competitor for highly consistent Ai video generation up to 16 seconds in 1080p,(https://www.reddit.com/r/StableDiffusion/comments/1ceq083/vidu_chinas_new_sora_competitor_for_highly/)
- 【2024年最新】Vidu Studioとは?使い方や料金、AIハグ動画の作り方を解説, https://filmora.wondershare.jp/ai/vidu-studio-review.html
- 【Vidu】テキストや画像から動画生成できるAIツール!使い方や料金プランを解説,(https://www.youtube.com/watch?v=Pvf82TUEdt0)
- 【Vidu】最新モデルQ1が凄い!生成スピードと表現力が大幅に向上!, https://www.youtube.com/watch?v=45OvjFmiZ8w
- 【検証】中国版Sora「Vidu」は日本語で使える?Text-to-VideoとImage-to-Videoを試してみた, https://liginc.co.jp/651332
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://www.zhuanzhi.ai/paper/8b1b6c150a27a302e5439a7fa708c879
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video, https://arxiv.org/html/2405.04233v1
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://www.aimodels.fyi/papers/arxiv/vidu-highly-consistent-dynamic-skilled-text-to
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://www.themoonlight.io/en/review/vidu-a-highly-consistent-dynamic-and-skilled-text-to-video-generator-with-diffusion-models
- Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models, https://www.emergentmind.com/papers/2405.04233
- Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM,(https://www.researchgate.net/publication/387264579_Prompt-A-Video_Prompt_Your_Video_Diffusion_Model_via_Preference-Aligned_LLM)
- The Wizard of Oz (16K) Sphere Project: Reimagining Cinema with Cutting-Edge Technology, https://ymcinema.com/2025/01/22/the-wizard-of-oz-16k-sphere-project-reimagining-cinema-with-cutting-edge-technology/
- Sora Text-to-Video Model Announced: Game Over for Filmmakers?, https://ymcinema.com/2024/02/18/sora-text-to-video-model-announced-game-over-for-filmmakers/
- OpenAI Sora Has Been Leaked: The Pandora’s Box of AI Creativity, https://ymcinema.com/2024/11/27/openai-sora-has-been-leaked-the-pandoras-box-of-ai-creativity/
- Meet Vidu: A Sora Killer?, https://ymcinema.com/2024/04/30/meet-vidu-a-sora-killer/
- Sora: The Digital Equivalent of Junk Food, https://ymcinema.com/2024/12/13/sora-the-digital-equivalent-of-junk-food/
- Y.M.Cinema Magazine - Page 10 of 128 - A magazine for filmmakers, by filmmakers, https://ymcinema.com/page/10/
- Best AI Video Generator in 2025: Runway ML vs. Pika Labs Comparison, https://dicloak.com/video-insights-detail/best-ai-video-generator-in-2025-runway-ml-vs-pika-labs-comparison
- Runway vs Pika Labs: Which AI Video Tool is Best?, https://www.fahimai.com/runway-vs-pika-labs
- Kling vs Hailuo vs Pika vs Runway | Best AI Video Generator?, https://www.youtube.com/watch?v=PgPphPo5bb8
- Runway vs Pika Labs — which is the best AI video tool?, https://www.tomsguide.com/ai/runway-vs-pika-labs-which-is-the-best-ai-video-tool
- Lip Sync Comparision - Runway vs Pika, https://www.reddit.com/r/aivideo/comments/1blua5m/lip_sync_comparision_runway_vs_pika_link_to/
- The Biggest AI News of 2024 (So Far),(https://www.youtube.com/watch?v=UzyRxlkvxEs)
- 【レビュー】Vidu AI動画生成ツールの使い方と料金、日本語での活用法, https://philipptarohiltl.com/vidu-ai-video-generation-tool-review-and-usage-guide/
- Spatial Beats: 2D to 3D with AI, https://arinsider.co/2025/03/24/spatial-beats-2d-to-3d-with-ai/
- AI Image to Video Generator - Turn Photos to Videos Online | Vidu, https://www.vidu.com/ai-image-to-video
- 【Vidu】使い方と料金、商用利用を解説。最新AIで動画生成, https://media.skunc-ai.com/article/vidu-video-generation-guide
- Runway Pricing, Plans & Cost | 2024, https://tekpon.com/software/runway/pricing/
- Complete Guide to Runway AI Pricing and Plans, https://www.1forall.ai/runway-ai-pricing/
- Runway ML Pricing 2025: Is It Worth It? (Plans & Credits Explained), https://magichour.ai/blog/runway-ml-pricing
- Pricing, https://docs.dev.runwayml.com/guides/pricing
- Runway, https://runwayml.com/pricing
- RunwayML Pricing, https://www.saasworthy.com/product/runway-ml/pricing
- Terms of Service, https://pika.art/terms-of-service
- Luma AI vs Pika Labs: Which is the Best AI Video Tool?, https://www.fahimai.com/luma-ai-vs-pika-labs
- Pika AI Review: Is It the Best AI Video Tool in 2024?, https://www.fahimai.com/pika-ai
- FAQ, https://pika.art/faq
- Pika Art Pricing, Features, Reviews and Alternatives, https://subscribed.fyi/pika-art/
- Pika Labs - AI tool for animations, https://neonshake.pl/blog/en/pika-labs-ai-tool-for-animations/
- AI Ethics Overview (China), https://www.chinalawvision.com/2025/01/digital-economy-ai/ai-ethics-overview-china/
- Principles of AI Ethics for the Intelligence Community, https://www.intelligence.gov/ai/principles-of-ai-ethics
- China's Position on Strengthening Ethical Governance of Artificial Intelligence, https://www.fmprc.gov.cn/eng/zy/wjzc/202405/t20240531_11367525.html
- Recommendation on the Ethics of Artificial Intelligence, https://www.unesco.org/en/artificial-intelligence/recommendation-ethics
- Ethical Norms for New Generation Artificial Intelligence Released, https://cset.georgetown.edu/publication/ethical-norms-for-new-generation-artificial-intelligence-released/
- China – General and specific ethical principles for AI, https://data-en-maatschappij.ai/en/policy-monitor/china-algemene-en-specifieke-ethische-principes-voor-ai
- Vidu AI Video Generator (Vidu Studio), https://pollo.ai/m/vidu-ai
- AI Video Generator - Text & Image to Video in Seconds. | Vidu AI, https://www.vidu.com/
- AI personalized videos at scale for sales teams' outreach | Vidu, https://www.vidu.io/
- Vidu - Apps on Google Play, https://play.google.com/store/apps/details?id=com.vidu.oversea
- Vidu AI Review: How to Create Professional Videos in Seconds (Full Tutorial),(https://www.youtube.com/watch?v=Dfv4yxjxgTU)
- Vidu AI Review: How to Create Professional Videos in Seconds (Full Tutorial), https://www.youtube.com/watch?v=jiswgsKXOis
- 生成式人工智能的风险与治理, https://www.tsinghua.edu.cn/info/1182/118325.htm
- 朱军教授, https://conf.csig.org.cn/6594/202407/44770.html
- 清华大学成立人工智能研究院基础理论研究中心,RealAI联合发布RealSafe人脸安全平台, https://realai.ai/news/company-news/164.html
- YOSIA——朱军, https://www.futureforum.org.cn/cn/people/196.html
- 朱军-清华大学计算机科学与技术系, https://www.cs.tsinghua.edu.cn/info/1121/3551.htm
- 清华大学朱军:大模型安全问题日益严重,需关注第三代人工智能, https://m.21jingji.com/article/20230703/herald/a62a8959a37dc90d22af85a79dfa5cfd.html
- U-ViTアーキテクチャの技術的な詳細、特にTransformerとDiffusionモデルの融合について、またその優位性について教えてください。,(https://openaccess.thecvf.com/content/CVPR2023/papers/Bao_All_Are_Worth_Words_A_ViT_Backbone_for_Diffusion_Models_CVPR_2023_paper.pdf)
- Viduの公式サイトから、最新の機能、価格、使い方、そしてどのようなユーザーや業界をターゲットにしているか教えてください。, https://www.vidu.com/
- Vidu APIのローンチに関するプレスリリースから、APIの主な機能、価格設定、ターゲットとなる開発者や企業、そしてViduが目指す市場でのポジションについて教えてください。, https://www.prnewswire.com/news-releases/shengshu-technology-lays-foundation-for-scalable-ai-video-generation-with-launch-of-vidu-api-offering-instant-access-and-industry-leading-speed-for-enterprises--developers-302375882.html
- Vidu 1.5のプレスリリースから、新機能である「Multiple-Entity Consistency」や「Multiple Angle Consistency」の詳細、そしてアニメーションスタイルの拡充など、具体的なアップデート内容を教えてください。, https://www.prnewswire.com/news-releases/vidu-1-5-launch-marks-new-emergence-in-multimodal-ai-to-introduce-groundbreaking-consistency-controls-that-reshape-the-future-of-ai-video-production-302304364.html
- Kr Asiaの記事から、Viduが競合の動画生成AI(Sora, Kling, Hailuoなど)と比較して、どのような強みと弱みを持っているか、また中国のAI開発におけるViduの位置付けについて教えてください。, https://kr-asia.com/can-shengshus-vidu-ai-text-to-video-generator-outcompete-its-rivals
- 21財経の記事から、Viduが「国産Sora」としてどのように評価されているか、特にSoraとの比較における優位性と課題、そして開発元である生数科技の背景や今後の商業化戦略について教えてください。, https://www.21jingji.com/article/20240428/herald/c975257f8cdd7901a7900fa8c8f57dc1.html
- この記事では、Soraのリーク問題と絡めてViduが「より倫理的でアーティストフレンドリーなアプローチ」を持つ競合として言及されています。Viduがなぜそのように位置づけられているのか、Soraの問題点と対比しながら詳しく解説してください。, https://philipptarohiltl.com/vidu-ai-video-generation-tool-review-and-usage-guide/
- この記事ではRunway MLとPika Labsの比較が行われています。それぞれのツールの長所・短所(特に、ターゲットユーザー、機能、品質、価格の観点から)をまとめてください。この情報を元に、Viduがどのような点で差別化できるか考察したいです。, https://dicloak.com/video-insights-detail/best-ai-video-generator-in-2025-runway-ml-vs-pika-labs-comparison
- この記事はRunwayとPika Labsのより詳細な機能比較をしています。特に、AIモデルの数、カメラ制御、ビデオ品質、人間アニメーション、参照画像の扱いといった観点での違いを抜き出してください。Viduの機能と比較するための参考にします。, https://www.fahimai.com/runway-vs-pika-labs
- この記事は日本語でViduの使い方をレビューしています。日本のユーザーがViduを使う上での利点と注意点(言語の壁など)をまとめてください。, https://philipptarohiltl.com/vidu-ai-video-generation-tool-review-and-usage-guide/
- Vidu Q1 Model Launches Globally Offering Unmatched Realistic VFX Capabilities, From Generating Cinematic Transitions to High-Fidelity Sound Effects with Just a Few Simple Inputs, https://www.morningstar.com/news/pr-newswire/20250421cn68618/vidu-q1-model-launches-globally-offering-unmatched-realistic-vfx-capabilities-from-generating-cinematic-transitions-to-high-fidelity-sound-effects-with-just-a-few-simple-inputs
- Vidu Q1: Try This Multimodal Vidu AI Model Free | Pollo AI, https://pollo.ai/m/vidu-ai/vidu-q1
- Vidu updates Q1 AI video generation model to handle up to seven image inputs - SiliconANGLE, https://siliconangle.com/2025/07/08/vidu-updates-q1-ai-video-generation-model-handle-seven-image-inputs/
- Vidu Q1: Multi-Reference Updated, Could It Push AI Video Generation to the Next Level?, https://deevid.ai/blog/vidu-q1-multi-reference-updated-could-it-push-ai-video-generation-to-the-next-level
- Vidu Q1: An Overview, https://pollo.ai/hub/vidu-q1-what-it-offers-and-how-it-performs
- Vidu Q1 Model Launches Globally Offering Unmatched Realistic VFX Capabilities, From Generating Cinematic Transitions to High-Fidelity Sound Effects with Just a Few Simple Inputs, https://www.prnewswire.com/news-releases/vidu-q1-model-launches-globally-offering-unmatched-realistic-vfx-capabilities-from-generating-cinematic-transitions-to-high-fidelity-sound-effects-with-just-a-few-simple-inputs-302433278.html
- Vidu Q1 Model Update Unveils 'Multi-Reference' Feature, Supporting Up to Seven Image Inputs, https://www.prnewswire.com/news-releases/vidu-q1-model-update-unveils-multi-reference-feature-supporting-up-to-seven-image-inputs-302499846.html
- Pricing, https://www.vidu.com/pricing
- Vidu Creative Leap Program Sets New Standard for Automated, AI-Generated Video Ad Creatives, https://www.martechcube.com/shengshu-technology-launches-vidu-creative-leap-program/
- What are AI video generators? What to know about Google's Veo 3, Sora and more, https://www.cnet.com/tech/services-and-software/what-are-ai-video-generators-what-to-know-about-googles-veo-3-sora-and-more/
- Google just released VEO 3, their new AI Video Generation Software and Flow at their latest Google IO 2025 May event., https://www.youtube.com/watch?v=ZV_-NC_qhz0
- Google releases photo-to-video Gemini Veo 3 capabilities, and it might just blow your mind, https://www.techradar.com/computing/artificial-intelligence/google-releases-photo-to-video-gemini-veo-3-capabilities-and-it-might-just-blow-your-mind
- Veo 3 vs. Kling Pro vs. Pixverse 4.5: Which AI Video Model Is Best for You?, https://dev.to/astrodevil/veo-3-vs-kling-pro-vs-pixverse-45-which-ai-video-model-is-best-for-you-2n2g
- Google Flow is an AI filmmaking tool that helps you create cinematic clips, https://blog.google/technology/ai/google-flow-veo-ai-filmmaking-tool/
- What is Google Veo? The AI video generator, explained, https://zapier.com/blog/google-veo/




コメント