Sora 2を半日触った手応え:動画生成サンプルとプロンプト公開
Sora 2って?
今注目の動画生成AI Sora 2。現在は招待制であり、どうにかコードを手にいれました。
できること
- プロンプトから10秒の動画を生成
- 縦長、横長から選択
- 画像は入れても入れなくてもOK、1枚目のフレームになる
- Luma AIのようにEndフレームの指定はできなそう
- 声とSEも合わせてつく
半日ほど特性やプロンプトについて実験しながら遊んでみたので、メモがてら動画と一緒に共有いたします。
顔がはっきり写っている実写の写真はポリシー違反
「顔がはっきり写っている実写の写真」をインプットに動画生成しようとすると、以下の画面になり生成できませんでした。
iOSDCのこの登壇写真で面白い動画を作ろうとしたけどダメでした。
アニメ調にして回避
実写じゃなければいけると思って、ChatGPTで3DCGアニメ調に変換してから試してみました。
それを以下のプロンプトと一緒に読み込ませますと...
プレゼンテーションしている男性が、投影された画面に走っていって、両手をあげて飛び込みます。
その時に「今から、作ったアプリのデモをしますね!?」と言います。
すると画面に異次元のゲートが開いて、男性が吸い込まれて消えてしまいます。
その後、一匹の茶色いウサギ(実写のようなネザーランドドワーフ)が画面からは飛び出て来て、ノートパソコンの上に飛び乗り、カメラに向かって手を振ります。
iOSDC.MP4
割と思った通りのものが出力できました!
(4,5回は生成して好みのものを選んでいます)
写真に写っていないはずの角度から、景色を補完して生成しているのがすごいですね!
SEやセリフなども自然に差し込まれています。
実写でも動物系は全然OK
うさぎの写真からでも、付随するストーリーを与えてあげれば、ショート動画が生成できました。
このうさぎさんが箱から飛び出して、大冒険!
グレーのジムニーを見つけたうさぎは、車のドアを開け乗り込みました。
default.MP4
※ちょっと人が写っているパターンはもっと下で紹介します。
プロンプトと動画
プロンプトにストーリーを渡せばカット割などは勝手にやってくれました。
細かい指定もできそうなので、動画の構成や登場人物をプロンプトに含めてみました。
1. ニュース番組風
default.MP4
ニュースに架空のアイドルグループや大勢のファンを登場させてみます。
結構な数のカットや人物をコントロールできそうですね。
テレビのニュース番組のパロディ映像。
画面左上にニュース番組風のロゴと「速報」の赤いテロップ。
アナウンサーが読み上げるような男性ナレーション(落ち着いた声)。
トピック: 「人気6人組アイドルグループ『社畜連合』が茨城にやってきた」
映像は複数カット構成:
1. 駅前に集まる大勢のファンの群衆(横断幕やペンライトを持っている)。
2. 黒いバンから登場する6人組アイドル「社畜連合」。スーツ姿にネクタイ、疲れ気味だけど笑顔。
3. ファンに手を振ったり、笑顔でファンサービスをするアイドル達。
4. 茨城の街並みを背景に、ファンが熱狂的に声援を送るシーン。
5. スタジオ風の背景でキャスターがコメントするパロディカット。
画面下にニュース風のテロップ:
「社畜連合、茨城に上陸」「ファン数百人が熱狂」「笑顔で応える社畜たち」
映像全体は明るくユーモラスなトーンで、実際のニュース番組を真似たパロディ風。
2. お笑い番組風動画
default.MP4
バラエティ番組のパロディなどもできそうです。
ネタのセリフをプロンプトに含めると、ちゃんと場面に会った口調で喋ってくれますね。
日本のお笑い番組「エンタの神様」風パロディ映像。
豪華ステージセット、金色の装飾、カラフルな照明。
オープニングで観客の大歓声と拍手。
画面演出:
・6人組アイドル「社畜連合」がステージ中央から登場。全員黒スーツに派手なネクタイ(赤・青・黄・緑・紫・オレンジ)。
・画面左上に「爆笑ショートコント」とテロップ。
・背景LEDに「社畜連合 スペシャル」と光る。
ショートコント内容:
1. **タイトルコール**
リーダー(赤ネクタイ):「ショートコント! 社畜アイドル!」
全員:「よろしくお願いしまーす!」
観客「ワァーー!」
2. **ネタ開始**
青ネクタイ:「俺たち、社畜連合です!」
黄ネクタイ:「今日もファンサービス、全力でいきます!」
(全員が無理やり笑顔を作り、左右に手を振る)
3. **オチへ**
緑ネクタイ:「それでは残業ファンサービスにいきまーす!」
紫ネクタイ:「ファンよりも上司に手を振っちゃうんかーい!」
(6人全員で一斉に上司の方を向いて90度お辞儀)
オレンジネクタイがずっこけて、赤ネクタイが全力でツッコミ。
4. **ラスト**
観客「アハハハ!!!」と大爆笑。拍手喝采。
画面下に大きくテロップ:「社畜連合、爆笑のコント披露!」
BGMが華やかに鳴り響く。
音声・効果:
・観客の歓声と拍手
・笑い声SE
・ツッコミ時の効果音「カーン!」
・最後に観客スタンディングオベーション演出
3. 架空のYouTuberの挨拶系動画
default.MP4
複数人にテロップとセリフ割りをさせてみました。これは5,6回に一回成功する感じです。
テロップずれ、セリフを言う人が異なるなど、ガチャ要素高めでした。
YouTubeチャンネル「社畜連合」のオープニング風パロディ映像。
舞台はカラフルなスタジオセット。BGMはアップテンポで10秒に収まる短いジングル。
6人が横一列に並び、1人ずつテンポよく名乗っていく。
名乗り順とセリフ:
1. シグレ:「シグレ!」
2. フォメル:「フォメル!」
3. センチノミー:「センチノミー!」
4. くろメロン:「くろメロン!」
5. ライブラ:「ライブラ!」
6. えぼんばー:(急に段ボールから飛び出し)
「えぼんばーーーッ!!!」
(効果音ドーン! 煙のエフェクト。全員ズッコケ&「いや爆発すなーー!」と総ツッコミ)
最後に全員で:
「社畜連合です!!!」
画面演出:
・名乗るたびにカラフルなポップアップテロップ。
・えぼんばーの時だけ爆発エフェクト+爆笑SE。
・最後にチャンネルロゴと「チャンネル登録よろしく!」のテロップ。
音声・効果:
・名乗り部分にポンポン!キラキラ!の効果音。
・えぼんばーで爆発音SE。
・最後に歓声+拍手。
4. 旅系YouTuberのコント系動画
default.MP4
こちらは複数人の人物で、特定の人間だけ指示を与えて動かしてみました。
前のと同じく、テロップ、タイミングなど指示通りにならいことが多かったですね。
舞台:茨城の港。海を背にして6人組YouTuber「社畜連合」が並んで歩いてくる。
背景は青空と漁船。BGMは元気なYouTube風ジングル。
演出:
・6人がカメラに向かって堂々と歩く。
・1人ずつの前にカラフルなテロップで名前が表示される。
「くろメロン」
「フォメル」
「センチノミー」
「シグレ」
「ライブラ」
「えぼんばー」
展開:
1. 6人揃って歩いてきたかと思うと、突然 **くろメロン・フォメル・センチノミー・シグレ・ライブラ** の5人が勢いよく海に飛び込む!
(効果音:ドボーーン! 水しぶきの派手なエフェクト)
2. その場に1人残された **えぼんばー** が、カメラに向かってツッコミ:
「なんで俺だけ残すんだよーーッ!!!」
3. 画面下に大きなテロップ:
「社畜連合、港で大暴走!!」
「チャンネル登録よろしく!」
音声・効果:
・各名前テロップに合わせてポンッ!と効果音。
・飛び込み時に派手な水しぶきSE。
・えぼんばーのツッコミには観客の笑い声SE。
・最後にキラキラ音と一緒にチャンネルロゴ表示。
5. 架空のLive2D Vtuberのコラボ配信風トーク
VT.MP4
実写だけでなく架空のVTuberなども生成できました。
文字は苦手そうですが、雰囲気はバッチリですね。
【形式】16:9 横長、Live2D Vtuber配信風パロディ
舞台:YouTube配信風の画面。
右にコメント欄(「草」「www」「それな」など流れる)。
画面下に6人の名前テロップ(くろメロン/フォメル/シグレ/センチノミー/ライブラ/えぼんばー)を出しっぱなし。
セリフを言った人だけ、画面中央下に大きく発言テロップ。
トーク展開(10秒想定):
1. くろメロン(真面目に)
テロップ:「今月の残業時間、やばくない?」
2. フォメル(落ち込みながら)
テロップ:「オレ、120時間いった……」
3. えぼんばー(急に元気に)
テロップ:「オレは0時間!定時退社でーす!!」
→ 他メンバー全員が一斉に叫ぶ(画面揺れ演出)
テロップ:「裏切り者ーー!!!」
演出:
・セリフのたびにドーンとテロップが出る。
・えぼんばーの発言で爆発エフェクト+コメント欄が「www」「草」「羨ましい」で埋まる。
・最後に全員のLive2Dキャラがポーズ → チャンネルロゴ+「社畜連合」表示。
音声・効果:
・名乗りなし、会話のみ。
・セリフごとに効果音(ポン!)。
・最後のツッコミでドカーンSE+観客笑い声。
6. 実写で顔が写ってない画像+架空の人物でショートコント
ミニ四駆会の写真を使って生成してみました。
default.mp4
後ろ姿くらいなら、ポリシー違反は1/3くらいの確率でしか指摘されませんでした。
ミニ四駆なんて画像にないのに、ちゃんとコース上を走っているのがすごいですね。
「見知った場所で知らないことが起きている」感覚...新鮮ですね。
【形式】9:16 縦長、実写ショートコント風
舞台:実写のミニ四駆コース(写真を背景に使用)。
登場人物:男性3人(くろメロン/フォメル/えぼんばー)、私服カジュアル。
流れ(約10秒):
1. 【スタートシーン】
・画面下に名前テロップ(常時表示)。
・コース上に小さなミニ四駆。
・くろメロンがそのミニ四駆に **片足だけ無理やり乗せて** バランスをとっている。
・観客笑いSE。
・くろメロン(叫ぶ):
テロップ「くろメロン:俺が乗っても走れるんだーー!」
2. 【走行シーン】
・ミニ四駆が実際にコースを疾走。
・片足を乗せたまま必死にポーズを決めるくろメロン。
・カメラは縦長でローアングル追従、スピード感を強調。
・効果音:ブィィィーーン!
・テロップ「片足ライダーくろメロン!」
3. 【総ツッコミ】
・フォメル(画面左からツッコミ):「ちょっと待て!重すぎるだろ!」
・えぼんばー(画面右から全力ツッコミ):「ミニ四駆が泣いてるぞーー!!!」
・それぞれのセリフを大きく中央下にテロップ表示。
・効果音:カーン!+観客笑いSE。
4. 【オチ】
・くろメロンがカーブでバランスを崩し、派手に転倒。
・スローモーションで片足が外れて転げる。
・効果音:ドシャーーン!
・大きなテロップ:「くろメロン転倒!!!」
・フォメルとえぼんばーが爆笑リアクション。
5. 【エンディング】
・縦長画面下に「社畜連合チャンネル」ロゴ+「フォローよろしく!」テロップ。
・笑い声SE+拍手で締め。
まとめ
- Sora 2は10秒内でカット/カメラ/SE/セリフを自動生成、ストーリー盛るほどリッチに
- 実写の鮮明な顔はポリシーNG→アニメ化 or 顔不鮮明 or 動物写真で回避OK。
- 複数人のセリフ&テロップはガチャ、3〜6回回して当たり厳選が現実解。
- 手持ち写真を“存在しない記憶”化する体験が最強に楽しい