AIでのサイバー攻撃って、どんな感じでやるの? 「ミトス(Mythos)」は他のAIと何が違う
AIでのサイバー攻撃って、どんな感じでやるの?
結論から言うと、現在の最先端AIは「命令を出すだけで、裏で勝手に実行して成果を返す」という状態(自律型エージェント)にかなり近づいています。
人間が「〇〇というサイトの弱点を見つけて、侵入経路を作って」と指示を出すと
AIは以下のような手順をすべて自動で、しかも数秒〜数分でこなします。
弱点の探索(スキャン)
ターゲットのシステムに不具合や古い部品(脆弱性)がないか、
4時間体制で超高速チェックします。
攻撃コードの自動作成:
弱点を見つけたら、そこを突くためのハッキング用プログラム(攻撃コード)をその場で瞬時に書き上げます。
防御の網をかいくぐる
セキュリティソフトに見つからないよう、プログラムの形を微妙に変えながら攻撃を仕掛けます。
人間なら数日〜数週間かかる「調査・プログラミング・実行」のサイクルを、AIは一瞬で、しかも文句も言わずに何万回も繰り返すことができる。
これがAIサイバー攻撃の恐ろしさです。
「ミトス(Mythos)」は他のAIと何が違う
今回政府に止められた「ミトス級」のAI
(Claude Fable 5 や Mythos 5)が、従来のAI(ChatGPTやこれまでのClaudeなど)と
決定的に違うのは
「推論能力の深さ」と「実行力(エージェント能力)」の桁が違う点です。
標準的なAIと、ミトス級の能力を比較すると以下のようになります。
特徴一般的なAI(従来のモデル)
ミトス(Mythos)級の最先端AI指示への反応
「ハッキングのコードを書いて」と言われても、安全装置が働いて拒否する。
安全装置を突破(脱獄)されると、防御側が気づいていない未知の弱点(ゼロデイ)すら自力で見つけ出す。
行動の範囲チャット画面の中で「テキスト」を答えるだけ。
ネットや外部のツールと連携し、
「自分で考えて、自分でツールを操作して攻撃を完結させる」
能力(1Mトークンという超巨大な記憶容量)を持つ。
スピードと規模人間が1回ずつ指示を出す必要がある。
実験では、重要インフラ(銀行や電力網など)のシステム欠陥を
またたく間に1万件以上発見・分析した。
これまでのAIは「ハッキングのヒントを教えてくれる賢い教科書」でしたが
ミトス級は「指示すれば勝手に夜中に忍び込んで仕事を終わらせてくる
超一流のサイバー兵器」になり得るレベルに達してしまったのです。
他のAIは同じように危険じゃないの?
現在、ChatGPT(OpenAI)や他の安全なAI
(Claudeの旧バージョンであるOpusやSonnetなど)は、厳重な安全フィルター(ガードレール)がかかっているため、同じような危険な攻撃はできないようになっています。
しかし、開発元のAnthropic社自身が
「私たちのミトスだけじゃなく、他社の最新AI(GPT-5.5など)でも
同じようなことは技術的に可能だ」と指摘しています。
つまり、技術が進化しすぎて、「AIに悪用防止の鍵(リミッター)をかけても
ハッカーたちが次々とその鍵を壊して(ジェイルブレイクして)悪用してしまう」という
いたちごっこが始まっています。
今回の米政府の緊急停止は、「リミッターが破られるリスクがある以上、外国人を含めた不特定多数にこのレベルのAIを触らせるわけにはいかない」という、最悪の事態を防ぐための超強硬手段だったと言えます。
ミトス「高度なサイバー攻撃能力(ハッキング能力)」を秘めている
人間の比ではないスピード: 実験段階で、システムの致命的な欠陥(脆弱性)をまたたく間に1万件以上も見つけ出しました。
安全装置(ガードレール)の突破:
(悪用を防ぐリミッター)をハッカーが突破(脱獄)できてしまった
公開からわずか3日での政府介入による強制停止は、AIの歴史上初めての前例のない事態
コメント
コメントを投稿