数分でリアルなディープフェイク動画を作成する手順を紹介



数分でリアルなディープフェイク動画を作成する手順を紹介します。

画像2_1ITセキュリティ担当者であれば誰しもが、ディープフェイク動画を作成する必要がある、または作成したいという時があるのではないでしょうか。非常にリアルなディープフェイク動画を作成して、自分自身や友人、同僚、上司を驚かせたいと考えるかもしれません。わかります、楽しいですからね。

初めてのリアルなディープフェイク動画を作成するのは非常に簡単で、ここで紹介する手順に従えば、作成前に必要な無料アカウントを設定する時間(1~2分)の方が長くかかるでしょう。

ディープフェイク音声、画像、動画を作成するためのサイトやサービスは文字通り何百もあり、その数は日々増えています。既存のサイトやサービスも日々改善され、より使いやすく、機能も充実しています。これらのサイトを使用して初めてのディープフェイク動画を作成できます。

まずは、非常にわかりやすく使いやすいインターフェイスを提供しているWebサイトHedra(https://www.hedra.com/)を紹介します。

画像2_2-Dec-05-2024-12-59-07-4482-AM

まずHedraの無料ユーザーアカウントを新規作成する必要があります。その後[Create](作成)を選びます。このような画面が表示されます。

画像2_3

ここではディープフェイク音声や動画に話してもらいたい内容を、テキストでアップロード(もしくはコピー&ペースト)します。

音声は、アップロードすることもできますし、何十種類もある無料音声から選んで利用することもできます。自分や特定の人物の声をクローン(コピー)して使うことも可能です。私は、初回は英国人女性の声を選択しました。オプションで、プロンプト機能を使って音声や動画の雰囲気などを細かく指定することも可能です。

下記の例では、最新の私の著書を紹介するテキストと、女優Gillian Anderson の写真をアップロードしました。

画像2_4

その後[Generate video](ビデオを生成する)をクリックします。

重要:Hedraをはじめとする多くの正規ディープフェイクサイトは、著作権のある画像や音声の使用を禁止しています。必ず、利用する画像や音声の著作権を保有しているか人から許可を得るなど、法的な手続きを行ってください。本記事では、あくまでも例としてGillian Andersonを使用しています。実在の人物だけでなく、AI生成画像や人物など、さまざまな素材を使用することができます。Hedraおよびその他のサイトは、著作権で保護された画像や著名人を自動的に検出し、使用を制限しています。

操作はたったこれだけです。わずか数分でディープフェイク動画が完成しダウンロードできます。

画像2_5

初めて作成したディープフェイク動画は想像以上に素晴らしい出来でした。女優の本当の声ではありませんが、彼女はよく英国人の役を演じるため、ほとんどの人は気づかないでしょう。

ディープフェイク動画作成サイトは数多くありますが、その中でもHedraは非常に使いやすいサイトのひとつです。

私はまだ遊び足りないので、また本人の許可なく彼女の写真を使うことはできないので、Gillian Andersonの顔と私の顔を入れ替える「フェイススワップ」をすることにしました。

Akool(www.akool.com)という別のサイト(下記参照)に行き、別の無料アカウントを作成します。

画像2_6

そして、先ほどと同じGillian Andersonの画像と私の画像をアップロードします(下記参照)。

画像2_7

そして出来上がったものがこちらです。

画像2_8

ヒッピーのような長髪は、私にはあまり似合っていません。

Akoolが私の顔をGillian Andersonの頭や体にうまくなじませたのには驚きました。初回から非常にリアルな仕上がりでした。この時点で、Gillian Andersonの体に、英国人女性の声で話す、私のハイブリッド画像/動画が完成しました。

もしやろうと思えば、またHedraに戻って私の声のクローンし、このハイブリッド画像と動画に私の声を使って何でも話させることができます。しかし、私は別の音声クローニングサービスを試すことにしました。

今度はSpeechify(https://myvoice.speechify.com)にアクセスしました。

画像2_9

 

音声クローニングサービス(下記参照)では、任意の音声と、その音声で読み上げる内容のテキストと一緒にインポートします。

画像2_10

ほとんどの音声クローニングサービスは、音声をクローンするために1分以上の音声を必要としますが、わずか6秒ほどの音声からでも、ある程度リアルな偽の音声を作成できるサービスもあります。しかし、長時間の音声の方が、学習素材としてはより優れています。

そして、私が今まで言ったことのないようなことを言っている自分ができました。

これは非常に恐ろしいことです。ごく短い音声サンプルから、誰かの声を模倣して、どんな言葉でも言わせることができてしまいます。詐欺師が、あなたの声のサンプルを入手するため電話をかけてくることは容易に想像できます。例えば、自動車の延長保証の営業を装い、短い質問を繰り返し、回答させます。声の主は、自分の声の要素が永遠に盗まれてしまったことに気づいていません。

最終段階として、私は自分のハイブリッド写真と新しく作成した偽のクローン音声を再びHedraにアップロードし、ハイブリッドのRogerが自分の本がどれだけ好きかを語る新しい動画を作成しました(下記画像参照)。

画像2_11

ここから学んだことは次の通りです。

  • リアルなディープフェイク動画を作成するよりも、無料アカウントの設定に時間がかかる。
  • 最初に作成したディープフェイク動画でも、ほとんどの人を騙すには十分である。
  • 誰もが数分以内に作成できるほどこれらのツールは優れている。
  • ディープフェイク動画にもう少し時間をかければ、非常に良いものが作成できる。
  • 攻撃者が、あなたや誰かのクローンを作成するには、写真と声のサンプルがあれば十分である。

世界は変わった

誰でも、簡単に、リアルなディープフェイク動画を作成できる時代になりました。当然のことながら、悪意を持った人々もこのツールを利用して、巧妙な詐欺を仕掛けてくることでしょう。

あなたが自分自身や家族、友達、同僚に、メール、電話、ソーシャルメディア、SMSメッセージを安易に信頼しないように教えたように、今では動画、画像、音声についても同じように警戒する必要があります。デジタルメディア通じて発信している人が、ほんとにその本人か信頼することはできません。画像や動画が本物であるかも信頼できません。これが新しい現実です。以前はこのようなことを心配する必要はありませんでしたが、世界は変わりつつあります。私たちは変化に適応しなければなりません。

ディープフェイクの検出方法

ディープフェイク動画や音声を検出すると主張するサービスは数多く存在します。私の同僚James McQuigganは多くのサービスを試しましたが、どれも完ぺきとは言えません。これらのサービスは、本来検出すべきものを見逃してしまう偽陰性や、誤って検出してしまう偽陽性が多すぎるのです。これらのサービスは役立ちますが、完全に頼ることはできません。AIディープフェイク検知機構とAIディープフェイクの関係は、ウィルス対策スキャナーとマルウェアの関係のように、常に負け続ける追いかけっこをすることになると考えておいてください。

KnowBe4のChief Human Risk Management Strategist(最高人的リスク管理責任者)で、ベストセラー書籍「FAIK: A Practical Guide to Living in a World of Deepfakes, Disinformation, and AI-Generated Deceptions」(FAIK:ディープフェイク、ディスインフォメーション、AIが生み出す欺瞞の世界で生きるための実践ガイド)の著者でもあるPerry Carpenterは、KnowBe4のチームに次のように語っています。(ここでは要約を紹介します。)

私たちが使用するほぼすべてのツールやサービスはAIを活用し、何らかの形で私たちを支援するようになるでしょう。ソーシャルメディアでは、AIによって、これまで以上に洗練されたテキスト、音声、画像、動画が作成され、実際よりも一段上の自分を演出することができます。すでに多くの音声、画像、動画ツールがAIを使用しており、今後もさらに多くのツールがAIを使用することで、私たちが魅力的に感じるコンテンツが作成できるようになるでしょう。現在の世界では、非常に多くの正当なコンテンツがAIによって生成または支援されているため、真偽を判定するための検出ツールに、AIによって生成されたものかどうかを尋ねることは、もはや意味を持ちません。

*PerryのFAIKの書籍はご購入いただく必要があります。

その音声、画像、動画はAIによって生成されたものですか?という質問への回答は「その通りです!」となります。AI検知ツールが将来的に生成されるすべての音声、動画、画像にどのように反応するのかは、前述の通りです。

ここで自分自身へ投げかけるべき重要な質問は、あなたが言われていることや見せられているものが、悪意を持って意図的に欺こうとしているかどうかです。

コンテンツが現実かAIかは重要ではなく、悪意をもって欺こうとしているかという点に注目してください。画像がフェイクっぽく見えるとか、指がぼやけているという点ではありません。

つまり、「これはAIか?」に対する感度を高めていくのではなく、「これはユーザーを騙そうとしているコンテンツであるか?」に高い注意を払うべきです。

AIによる生成かどうかに関係なく、もし予期せぬメッセージが届き、その内容が(少なくともその送信者から)今までに依頼されたことのないものであれば、対応したり感情的に反応したりする前に、他の方法でメッセージの内容を確認することが重要です。確認ポイントは次の通りです。

画像2_12

現在、そして今後、悪質な詐欺メッセージを見破る最適な方法を簡潔に紹介します。まず、連絡が予期せぬものであるかどうか、その内容が今まで依頼されたことのないものであるか(その依頼主から)、行動を起こす前に一度立ち止まり、考えてください。このことは大半の詐欺に対して有効な対策です。

このアプローチで考える習慣を身につけてください。家族や、従業員にも同様のアプローチを教え、訓練してください。組織が特定の期間に攻撃を受けるかどうかは、このアプローチをどれだけ広め、従業員がこのスキルを身につけて実践できるかにかかっています。

おわりに

ディープフェイクが簡単に作成できる時代になりました。これまでもそうでしたが、今後ディープフェイクの作成はさらに簡単に、さらに一般的になるでしょう。しかし、私たちは決して無力ではありません。何もせずに何度も詐欺にあうようなことはありません。

すべてのサイバー防御ツールはAIを活用し、AIによる詐欺(または人による詐欺)に対して、より優れた保護を提供します。詐欺はメールやテキストメッセージだけでなく、今後はすべての音声、画像、動画にも紛れ込む可能性があるため、注意が必要です。詐欺を仕掛けるメッセージやコンテンツには、必ず悪意が含まれています。リアルな私であろうがハイブリッドの私であろうが、悪意のある部分は変わりませんのでメッセージの内容に注意してください。悪意のある部分とは、パスワードを送れとか、どこかへ送金しろとか、あなたの利益を害するような行為を求めるものです。

同僚が、騙そうとする行為を見抜くための手助けを求めているなら、Perry Carpenterの書籍を紹介してください。 

原典:Roger Grimes著 2024年11月12日発信 https://blog.knowbe4.com/step-by-step-to-creating-realistic-deepfake-video-in-minutes

Topics: ディープフェイク, KnowBe4 SATブログ

Get the latest about social engineering

Subscribe to CyberheistNews