-記事2ページ目に招待コードを記載しています-
2025年9月30日(米国時間)――米OpenAIは、次世代のテキストtoビデオおよびオーディオ生成AIモデル「Sora 2」を正式発表した。初代Sora(2024年2月プレビュー、同年12月一般公開)の後継となる同モデルは、物理法則の忠実な再現、音声との高度な同期、そして多様なスタイル制御を備え、「ビデオ生成のGPT-3.5級の進歩」と位置づけられる。
同日、YouTubeのライブストリーム上でデモンストレーションが行われ、iOS専用アプリ「Sora」が同時にローンチ。TikTok風のソーシャル体験を取り入れたことで、映像生成AIの新たな方向性を示した。
■ 技術的進化:物理再現から音声統合まで大幅刷新
Sora 2は、Diffusion Transformer(DiT)アーキテクチャを基盤に、時空間Transformerを融合させた構造を採用。モデル規模は約10億パラメータと推定され、膨大な動画・音声・テキストデータで学習された。
OpenAIによると、初代Soraの課題だった「物理法則の破綻」や「ショット間の不整合」、「無音生成」などを徹底的に改善。主な進化点は次の通りである。
- 物理再現性:重力・運動量・衝突など物理法則を厳密に遵守。ボールのリバウンドやスケボーの軌道などが極めて自然に描写。
- 一貫性と制御性:シーン間のキャラクターや照明の崩壊を防止。JSON風プロンプトにより多ショット構成を制御可能。
- オーディオ統合:台詞・BGM・効果音を自動生成し、リップシンク精度を大幅向上。
- スタイル対応:リアル、アニメ、シネマティックなど多様なスタイルを選択可能。静止画をもとにアニメ風動画を生成することもできる。
- 生成仕様:最大10~15秒、1080p/24FPSの映像生成に対応。縦型・横型・正方形アスペクトに対応。
これにより、従来の短いAIクリップ生成から脱却し、「AIフィルムメイキング」の基盤モデルへと進化した。
■ Cameos機能とソーシャル統合:自分自身を“映像世界”へ
新機能「Cameos(カメオ)」では、ユーザーが1回のみ録音する短い動画や音声を用い、自身をAI映像の登場人物として挿入できる。
顔・声の認証による本人確認と、友人の同意が必須で、撤回も自由。ディープフェイク防止策を講じた上で、ファンタジー世界などへの自然な“自己登場”が可能となる。
さらに、「Sora」アプリはTikTokライクなフィード構造を採用。興味ベースのアルゴリズムによる動画配信、共有、リミックスが可能で、10秒縦型クリップを中心にC2PAメタデータと透かし(ウォーターマーク)を自動付与する。
■ アクセス方法と料金プラン(※本記事内招待コードあり)
Sora 2の利用は以下の通り:
- iOSアプリ(招待制):ChatGPT Proユーザーが優先的にアクセス可能
- ブラウザ版(sora.com):ChatGPT Plus / Proユーザー向けに提供
- API提供:近日中に開発者向けベータ公開予定
料金体系は次の通り:
| プラン | 内容 |
|---|---|
| 無料 | 基本機能(利用制限あり) |
| ChatGPT Plus | 標準アクセス |
| ChatGPT Pro(月額20ドル) | Sora 2 Pro(高品質・長尺対応・優先枠) |
なお、日本での正式提供は近日中に開始予定。記事末尾に限定招待コードを記載する。
■ 安全性と倫理的配慮:生成AIの“影”にも対応
OpenAIは同時に「Sora 2 Safety」文書を公開し、次の対策を明示した。
- CSAM・性的ディープフェイクの生成ブロック
- 全動画への透かし+メタデータ付与
- 内部検索ツールによる出所確認
- 専門チームによるレッドチームテスト
- 違反検出時の削除・アカウント停止
ただし、手や複雑な時系列の動きなどに依然として誤りが生じることがあり、OpenAIは「完全な現実再現には至らない」と認めている。
■ 競合との比較:Veo 3、Vibesを凌駕
| モデル | 強み | 弱点 |
|---|---|---|
| Sora 2(OpenAI) | 物理・音声同期、Cameos、共有性 | クリップ長が短い(拡張中) |
| Veo 3(Google) | 長尺生成、YouTube統合 | 音声同期が弱く、物理挙動に誤差 |
| Vibes(Meta) | SNS連携、無料利用 | 品質中庸、プライバシー懸念 |
| Kling(中国勢) | 高速生成 | 英語・日本語対応が限定的 |
Sora 2は映像の自然さと安全性で頭一つ抜けており、AI動画市場の主導的地位を確立しつつある。
■ 影響と展望:映像産業の地殻変動
Sora 2は、広告・教育・エンタメ業界における制作コストの劇的削減をもたらし、「一人映画監督」時代の到来を予感させる。
一方で、「ビジュアル真実の崩壊」とも評されるほどのリアルさに、ディープフェイク拡散への懸念も指摘されている。
X(旧Twitter)では発表直後から「AIフィルム革命」「現実の定義が変わる」といった議論が沸騰。OpenAIは7億人超のChatGPTユーザーを背景に、映像生成分野での新たな覇権を狙う構えだ。
1 / 2
コメント