Sora 2を半日触った手応え:動画生成サンプルとプロンプト公開

2025-10-02 · Issue #4

Image

Sora 2って?

今注目の動画生成AI Sora 2。現在は招待制であり、どうにかコードを手にいれました。

できること

  • プロンプトから10秒の動画を生成
  • 縦長、横長から選択
  • 画像は入れても入れなくてもOK、1枚目のフレームになる
    • Luma AIのようにEndフレームの指定はできなそう
  • 声とSEも合わせてつく

半日ほど特性やプロンプトについて実験しながら遊んでみたので、メモがてら動画と一緒に共有いたします。

顔がはっきり写っている実写の写真はポリシー違反

「顔がはっきり写っている実写の写真」をインプットに動画生成しようとすると、以下の画面になり生成できませんでした。

Image

iOSDCのこの登壇写真で面白い動画を作ろうとしたけどダメでした。

Image

アニメ調にして回避

実写じゃなければいけると思って、ChatGPTで3DCGアニメ調に変換してから試してみました。

Image

それを以下のプロンプトと一緒に読み込ませますと...

プレゼンテーションしている男性が、投影された画面に走っていって、両手をあげて飛び込みます。
その時に「今から、作ったアプリのデモをしますね!?」と言います。
すると画面に異次元のゲートが開いて、男性が吸い込まれて消えてしまいます。
その後、一匹の茶色いウサギ(実写のようなネザーランドドワーフ)が画面からは飛び出て来て、ノートパソコンの上に飛び乗り、カメラに向かって手を振ります。
iOSDC.MP4

割と思った通りのものが出力できました!
(4,5回は生成して好みのものを選んでいます)

写真に写っていないはずの角度から、景色を補完して生成しているのがすごいですね!
SEやセリフなども自然に差し込まれています。

実写でも動物系は全然OK

うさぎの写真からでも、付随するストーリーを与えてあげれば、ショート動画が生成できました。

このうさぎさんが箱から飛び出して、大冒険!
グレーのジムニーを見つけたうさぎは、車のドアを開け乗り込みました。
default.MP4

※ちょっと人が写っているパターンはもっと下で紹介します。

プロンプトと動画

プロンプトにストーリーを渡せばカット割などは勝手にやってくれました。
細かい指定もできそうなので、動画の構成や登場人物をプロンプトに含めてみました。

1. ニュース番組風

default.MP4

ニュースに架空のアイドルグループや大勢のファンを登場させてみます。
結構な数のカットや人物をコントロールできそうですね。

テレビのニュース番組のパロディ映像。  
画面左上にニュース番組風のロゴと「速報」の赤いテロップ。  
アナウンサーが読み上げるような男性ナレーション(落ち着いた声)。  
トピック: 「人気6人組アイドルグループ『社畜連合』が茨城にやってきた」  

映像は複数カット構成:  
1. 駅前に集まる大勢のファンの群衆(横断幕やペンライトを持っている)。  
2. 黒いバンから登場する6人組アイドル「社畜連合」。スーツ姿にネクタイ、疲れ気味だけど笑顔。  
3. ファンに手を振ったり、笑顔でファンサービスをするアイドル達。  
4. 茨城の街並みを背景に、ファンが熱狂的に声援を送るシーン。  
5. スタジオ風の背景でキャスターがコメントするパロディカット。  

画面下にニュース風のテロップ:  
「社畜連合、茨城に上陸」「ファン数百人が熱狂」「笑顔で応える社畜たち」  

映像全体は明るくユーモラスなトーンで、実際のニュース番組を真似たパロディ風。  

2. お笑い番組風動画

default.MP4

バラエティ番組のパロディなどもできそうです。
ネタのセリフをプロンプトに含めると、ちゃんと場面に会った口調で喋ってくれますね。

日本のお笑い番組「エンタの神様」風パロディ映像。  
豪華ステージセット、金色の装飾、カラフルな照明。  
オープニングで観客の大歓声と拍手。  

画面演出:  
・6人組アイドル「社畜連合」がステージ中央から登場。全員黒スーツに派手なネクタイ(赤・青・黄・緑・紫・オレンジ)。  
・画面左上に「爆笑ショートコント」とテロップ。  
・背景LEDに「社畜連合 スペシャル」と光る。  

ショートコント内容:  

1. **タイトルコール**  
 リーダー(赤ネクタイ):「ショートコント! 社畜アイドル!」  
 全員:「よろしくお願いしまーす!」  
 観客「ワァーー!」  

2. **ネタ開始**  
 青ネクタイ:「俺たち、社畜連合です!」  
 黄ネクタイ:「今日もファンサービス、全力でいきます!」  
 (全員が無理やり笑顔を作り、左右に手を振る)  

3. **オチへ**  
 緑ネクタイ:「それでは残業ファンサービスにいきまーす!」  
 紫ネクタイ:「ファンよりも上司に手を振っちゃうんかーい!」  
 (6人全員で一斉に上司の方を向いて90度お辞儀)  
 オレンジネクタイがずっこけて、赤ネクタイが全力でツッコミ。  

4. **ラスト**  
 観客「アハハハ!!!」と大爆笑。拍手喝采。  
 画面下に大きくテロップ:「社畜連合、爆笑のコント披露!」  
 BGMが華やかに鳴り響く。  

音声・効果:  
・観客の歓声と拍手  
・笑い声SE  
・ツッコミ時の効果音「カーン!」  
・最後に観客スタンディングオベーション演出  

3. 架空のYouTuberの挨拶系動画

default.MP4

複数人にテロップとセリフ割りをさせてみました。これは5,6回に一回成功する感じです。
テロップずれ、セリフを言う人が異なるなど、ガチャ要素高めでした。

YouTubeチャンネル「社畜連合」のオープニング風パロディ映像。  
舞台はカラフルなスタジオセット。BGMはアップテンポで10秒に収まる短いジングル。  

6人が横一列に並び、1人ずつテンポよく名乗っていく。  

名乗り順とセリフ:  

1. シグレ:「シグレ!」  
2. フォメル:「フォメル!」  
3. センチノミー:「センチノミー!」  
4. くろメロン:「くろメロン!」  
5. ライブラ:「ライブラ!」  
6. えぼんばー:(急に段ボールから飛び出し)  
 「えぼんばーーーッ!!!」  
 (効果音ドーン! 煙のエフェクト。全員ズッコケ&「いや爆発すなーー!」と総ツッコミ)  

最後に全員で:  
「社畜連合です!!!」  

画面演出:  
・名乗るたびにカラフルなポップアップテロップ。  
・えぼんばーの時だけ爆発エフェクト+爆笑SE。  
・最後にチャンネルロゴと「チャンネル登録よろしく!」のテロップ。  

音声・効果:  
・名乗り部分にポンポン!キラキラ!の効果音。  
・えぼんばーで爆発音SE。  
・最後に歓声+拍手。  

4. 旅系YouTuberのコント系動画

default.MP4

こちらは複数人の人物で、特定の人間だけ指示を与えて動かしてみました。
前のと同じく、テロップ、タイミングなど指示通りにならいことが多かったですね。

舞台:茨城の港。海を背にして6人組YouTuber「社畜連合」が並んで歩いてくる。  
背景は青空と漁船。BGMは元気なYouTube風ジングル。  

演出:  
・6人がカメラに向かって堂々と歩く。  
・1人ずつの前にカラフルなテロップで名前が表示される。  
 「くろメロン」  
 「フォメル」  
 「センチノミー」  
 「シグレ」  
 「ライブラ」  
 「えぼんばー」  

展開:  
1. 6人揃って歩いてきたかと思うと、突然 **くろメロン・フォメル・センチノミー・シグレ・ライブラ** の5人が勢いよく海に飛び込む!  
 (効果音:ドボーーン! 水しぶきの派手なエフェクト)  

2. その場に1人残された **えぼんばー** が、カメラに向かってツッコミ:  
 「なんで俺だけ残すんだよーーッ!!!」  

3. 画面下に大きなテロップ:  
 「社畜連合、港で大暴走!!」  
 「チャンネル登録よろしく!」  

音声・効果:  
・各名前テロップに合わせてポンッ!と効果音。  
・飛び込み時に派手な水しぶきSE。  
・えぼんばーのツッコミには観客の笑い声SE。  
・最後にキラキラ音と一緒にチャンネルロゴ表示。  

5. 架空のLive2D Vtuberのコラボ配信風トーク

VT.MP4

実写だけでなく架空のVTuberなども生成できました。
文字は苦手そうですが、雰囲気はバッチリですね。

【形式】16:9 横長、Live2D Vtuber配信風パロディ

舞台:YouTube配信風の画面。  
右にコメント欄(「草」「www」「それな」など流れる)。  
画面下に6人の名前テロップ(くろメロン/フォメル/シグレ/センチノミー/ライブラ/えぼんばー)を出しっぱなし。  
セリフを言った人だけ、画面中央下に大きく発言テロップ。  

トーク展開(10秒想定):  

1. くろメロン(真面目に)  
 テロップ:「今月の残業時間、やばくない?」  

2. フォメル(落ち込みながら)  
 テロップ:「オレ、120時間いった……」  

3. えぼんばー(急に元気に)  
 テロップ:「オレは0時間!定時退社でーす!!」  

→ 他メンバー全員が一斉に叫ぶ(画面揺れ演出)  
 テロップ:「裏切り者ーー!!!」  

演出:  
・セリフのたびにドーンとテロップが出る。  
・えぼんばーの発言で爆発エフェクト+コメント欄が「www」「草」「羨ましい」で埋まる。  
・最後に全員のLive2Dキャラがポーズ → チャンネルロゴ+「社畜連合」表示。  

音声・効果:  
・名乗りなし、会話のみ。  
・セリフごとに効果音(ポン!)。  
・最後のツッコミでドカーンSE+観客笑い声。  

6. 実写で顔が写ってない画像+架空の人物でショートコント

ミニ四駆会の写真を使って生成してみました。

default.mp4

後ろ姿くらいなら、ポリシー違反は1/3くらいの確率でしか指摘されませんでした。
ミニ四駆なんて画像にないのに、ちゃんとコース上を走っているのがすごいですね。
「見知った場所で知らないことが起きている」感覚...新鮮ですね。

【形式】9:16 縦長、実写ショートコント風

舞台:実写のミニ四駆コース(写真を背景に使用)。  
登場人物:男性3人(くろメロン/フォメル/えぼんばー)、私服カジュアル。  

流れ(約10秒):  

1. 【スタートシーン】  
   ・画面下に名前テロップ(常時表示)。  
   ・コース上に小さなミニ四駆。  
   ・くろメロンがそのミニ四駆に **片足だけ無理やり乗せて** バランスをとっている。  
   ・観客笑いSE。  
   ・くろメロン(叫ぶ):  
     テロップ「くろメロン:俺が乗っても走れるんだーー!」  

2. 【走行シーン】  
   ・ミニ四駆が実際にコースを疾走。  
   ・片足を乗せたまま必死にポーズを決めるくろメロン。  
   ・カメラは縦長でローアングル追従、スピード感を強調。  
   ・効果音:ブィィィーーン!  
   ・テロップ「片足ライダーくろメロン!」  

3. 【総ツッコミ】  
   ・フォメル(画面左からツッコミ):「ちょっと待て!重すぎるだろ!」  
   ・えぼんばー(画面右から全力ツッコミ):「ミニ四駆が泣いてるぞーー!!!」  
   ・それぞれのセリフを大きく中央下にテロップ表示。  
   ・効果音:カーン!+観客笑いSE。  

4. 【オチ】  
   ・くろメロンがカーブでバランスを崩し、派手に転倒。  
   ・スローモーションで片足が外れて転げる。  
   ・効果音:ドシャーーン!  
   ・大きなテロップ:「くろメロン転倒!!!」  
   ・フォメルとえぼんばーが爆笑リアクション。  

5. 【エンディング】  
   ・縦長画面下に「社畜連合チャンネル」ロゴ+「フォローよろしく!」テロップ。  
   ・笑い声SE+拍手で締め。  

まとめ

  • Sora 2は10秒内でカット/カメラ/SE/セリフを自動生成、ストーリー盛るほどリッチに
  • 実写の鮮明な顔はポリシーNG→アニメ化 or 顔不鮮明 or 動物写真で回避OK。
  • 複数人のセリフ&テロップはガチャ、3〜6回回して当たり厳選が現実解。
  • 手持ち写真を“存在しない記憶”化する体験が最強に楽しい