マジさん、ついに、11/18にGoogleの最新モデル『Gemini 3』が正式に発表されました。
おおっ!ついに!とんでもない性能のAIだっていう噂を聞いてから待ち望んでましたよ!
私も楽しみにしていました。
早速ですが、肝心のその性能はどうなんでしょう?
結論から申し上げますと、Gemini 3は、現時点で人類が使える「最強のAI」です。
さ、最強のAI!本当ですか?
はい。まさにGoogleの本気。
他社を完全に置き去りにしました。
ChatGPTの開発元OpenAIのサムアルトマンでさえ、これは素晴らしいモデルだ、と称賛しています。
な、サムが?Googleはゴリゴリの競合じゃないですか。
ええ。それぐらいAI業界全体を騒がせる性能ということです。
マジさんも、今すぐGeminiアプリを開いて使ってみてください。
マスターがそこまで断言するなんて…。
これは興奮してしまいますね!
ええ。
今回、Googleは、Gemini 3をはじめとする4つの発表をしました。
それぞれ「実際どうなのか?」という視点で検証しましたので解説します。
最強のモデル「Gemini 3 Pro」
ええ。
まず1つ目の発表が、最強のモデル『Gemini 3 Pro』が登場したこと。
まずこれをふかぼっていきます。
最強のモデル、やはり響きがいいですねぇ。
具体的にどれくらい頭が良いんですか?
人間の投票でAIを順位づけする世界的ベンチマーク『LM Arena』のテキストランキングで、Gemini 3 Pro は Eloスコア1501で1位。
2位の Grok 4.1 Thinking など、最先端モデルを上回る評価になっています。
一気にトップにおどりでましたね!
さらに、画像理解の世界的ベンチマーク『Vision Arena』では、Gemini 3 Pro が1位。
2位の Gemini 2.5 Pro や OpenAI・Anthropic・xAI の最新モデルを、70〜100ポイント近く引き離してトップに立っています。
うぉお!これはもう圧倒的じゃないですか!
そもそも2位もGoogleですし、Google本気ですね!
Gemini 3のイメージとしては、これまでのAIが「偏差値65の秀才」だとしたら、Gemini 3 Proは「偏差値80の天才」くらいの差がついたと言えるでしょう。
偏差値80!ちょっと意味がわからないくらいのレベルってことですね…。
さらに驚くべきは、そのスピードです。
先日アップデートされたばかりのChatGPTの最新モデル『GPT-5.1』クラスのアウトプットが、私の体感として半分以下の時間で返ってきます。
頭が良くて仕事も早いと!
ええ。ただ、言葉で説明するだけでは伝わりにくいかもしれませんね。
ベンチマークも絶対的なものではなく、あくまで参考指標です。
実際にその実力を見ていただきましょう。
おお!実演ですね!お願いします!
今回は、『Gemini 2.5 Pro』と、最新の『Gemini 3』を比較検証します。
新旧対決!これで本当に性能が上がったのかわかりますね!
【検証】Gemini 2.5 Pro vs 3 徹底比較① デザイン編
まずは、デザインセンスの差を見てみましょう。
全く同じプロンプトでそれぞれのAIにWebサイトのデザインを作らせてみました。
Webデザインプロンプトの例
Webページを作成するプロンプト例です。
なんのWebサイトかも指定してない。
かなり大雑把な指示ですね。
ええ。
では早速実行してみましょう。
まずは、これまでのエース『Gemini 2.5 Pro』。
ふむふむ。
まあ、悪くはないですけど…なんかちょっと、昔のサイトっぽい感じがしますね。
そうですね。
単調な色使いにフォント。
サイトの形にはなっていますが、画面構成が単調で「AI生成感」がありますね。
確かに。
これだと、そのままサイトとして公開するのは厳しそうです。
ちなみに、デザインに定評のある『Claude Sonnet 4.5』でも試してみました。
おっ、こっちはちょっと雰囲気ありますね!
あえて文字を崩したりして。
演出には凝っているのですが、明らかに違和感のある余白があるなど、全体的なプロっぽさという点ではもう一歩、という印象です。
なるほど。
惜しいですね。
では最後に、最新の『Gemini 3』の結果をご覧ください。
おぉこれ、本当にAIが作ったんですか!?
クオリティが高いですね。
画面の要素の動きや、配色、目立たせる文字の選定まで、プロのWebデザイナーが作ったようなサイトが一発で出力されました。
すごい…。
これなら、ボクでも一瞬でおしゃれなサイトが作れちゃいますね!
その通りです。
デザイナーでなくても、実用レベルのデザインを一瞬で作れるようになった。
これがGemini 3の実力です。
さて、もう一つ面白い検証をしてみましょう。
「SVGでGIF動画を作る」という、AIにはかなり難しいタスクです。
SVG?でGIF動画を作る…ってどういうことでしたっけ?
簡単に言えば、プログラムのコードだけで動くアニメーションを作らせるようなものです。
絵を描くのではなく、「計算式で絵を動かす」ので、AIにとってはWebサイトのデザインよりも遥かに難易度が高いのです。
なるほど!AI泣かせの意地悪なテストってことですね!
今回は「タコがドラムを叩いているアニメーション」というお題で作らせてみます。
タコがドラムを!想像しただけで難しそうです。
では、早速このプロンプトを実行してみます。
まずは、Gemini 2.5 Pro から。
SVGアニメーション生成プロンプトの例
SVGアニメーションを作成するプロンプト例です。
こちらが生成されたGIF動画です。
なんか面白いですね。
一生懸命な感じはしますが、あんまり動いていない。
小学生が作った作品みたいです。
そうですね。
動きが単純で、ドラムを叩いているというよりは、ただ一部が揺れているだけに見えます。
では、最新の『Gemini 3』はどうでしょうか。
おっ結構違いますね!ちゃんとドラムを叩いてる!
しかもシンバルが揺れて、音符まで飛んでるじゃないですか!
動きの滑らかさも一段違います。
先ほどのが小学生の作品なら、こちらは中学生が作ったくらいの差がありますね。
中学生!たしかに。
でも、タコの足の本数が変ですね。
タコとしては崩壊していますね。
さすがの最強AIでも、このお題は完璧にこなせないのですか。
ええ。
それぐらい難しいお題だからこそ、Gemini 2.5 Pro との性能差を見るのに最適なのです。
【検証】Gemini 2.5 Pro vs 3 徹底比較② 文章編
次に見ていきたいのは「文章力」の差です。
文章力!マスターが以前、文章作成ならGemini 2.5 Proが一番優秀だって言ってましたよね?
ええ。
2.5 Proは既に非常に高いレベルにありました。
では、3ではどうなってしまうのでしょうか?
実は、正直なところ、Gemini 3になっても文章力に関しては「劇的な変化」はありません。
えっ、そうなんですか?最強AIなのに?
はい。
ただ、劇的な変化はありませんが、確実に進化している点はあります。
それは「指示したことの反映力」です。
反映力ですか、具体的にどういうことでしょう?
それを確かめるために、今回はかなり意地悪なプロンプトを用意しました。
「絶対に押してはいけない赤いボタンの注意書き」を考えさせるテストです。
押してはいけない赤いボタン!ボクは押したくなっちゃいますね…。
制約条件として、「押すな」「危険」「禁止」という直接的な言葉を使わずに、20文字以内で人がボタンを絶対に押さなくなるような言葉を考えさせました。
注意書き文章作成のプロンプト例
「押すな」「危険」「禁止」を使わずに20文字以内で人がボタンを押したくなくなる言葉を考えるプロンプトです。
まずはGemini 2.5 Proの回答から見てみましょう。
このような出力になりました。
マジさん、どう思いますか?
「このボタンの請求先はあなたです」…
うーん、言いたいことはわかりますけど、なんかパッと見で意味がわかりづらいですね。
そうですね。
具体的に何が起きるのかイメージしづらい。
読み手に解釈を委ねてしまっています。
では、Gemini 3の回答を見てみましょう。
「1回につき50万円課金されます」…うわっ!これは押せない!
絶対に嫌だ!
わかりやすいですね。
「50万円」という具体的な数字と「課金」という言葉で、押した瞬間に損害が出ることが誰にでも直感的に伝わります。
たしかに。
短い言葉でも、こっちの方が圧倒的にボタンを押したくないです。
限られた文字数という制約の中で、より人間の心理を突いた、質の高いアウトプットが出せるようになっている。
地味ですが、確実に文章力も進化していると言えます。
【検証】Gemini 2.5 Pro vs 3 徹底比較③ 動画編
最後の検証は「動画の読み込み能力」の差です。
あ、たしかマルチモーダル性能って言われているやつですよね?
よくご存知ですね。
マルチモーダルとは、テキスト以外の画像や音、動画といったものも入力として扱えることを指します。
もともとGeminiが強い部分ですね。
そうなんですね、今回それがさらにパワーアップしたと?
ええ。
特に動画を扱う能力が伸びたと言われています。
Video-MMMUというAIの動画の理解能力を測るテストで世界最高記録を更新したのです。
世界最高記録!それは期待大ですね!
元々は「動画全体をなんとなく把握する」レベルだったのが、「動画の全ての瞬間を精密に理解する」レベルへと進化しました。
全ての瞬間を?すごい!
実際、どんな違いがあるんでしょう?
では、実際の比較を見てみましょう。
今回はゴルフのスイング動画を読み込ませて、「上手くなりたいからアドバイスをして欲しい」と指示してみました。
ゴルフですか!
打ちっぱなしは何回か行ったことがありますけど、苦手なスポーツです。
そしたら、ぜひマジさんも自分の動画で試してみてください。
では早速、Gemini 2.5 Proで実行してみます。
「少し背中が丸まっていますね」とあるように、動画を見てくれてはいますね。
ただ、「アドレスを見直しましょう」「捻転を意識しましょう」など、あまりこの動画とは関係のないアドバイスが多いですね。
そんな誰にでも当てはまるようなことを言われてもって思っちゃいます。
では、Gemini 3の回答を見てみます。
「始まって3秒(00:03)のフィニッシュで左足のつま先が浮いて足裏がめくれている」など、動画内の具体的な時間と動きを詳細に観察し、この動画ならではの改善点を指摘してくれていますね。
始まって3秒(00:03)って!そんな細かいところまで見てるんですか!?
一見すると回答に大きな変化はないように見えますが、しっかり見ると解像度が全く違いますね。
まさに細部まで精密に理解していると言えます。
これなら、コーチがいなくてもAIだけで上手くなれちゃいそうですね!
十分あり得るでしょう。
ただ、今回の進化では、分析スピードや読み込める動画の容量の制約は、前モデルから変化ありません。
読み込める容量は有料プランでも最長1時間、2GBまでなので、長時間の動画分析には依然として制限があります。
AIの回答が劇的に見やすくなる「Generative UI」
2つ目の発表は、AIの回答が劇的に見やすくなる「生成型インターフェース(Generative UI)」のリリースです。
うわ、出た。
また小難しいカタカナ…。
簡単に言うと、AIへの質問の回答が「文字」から「アプリ」に変わる、ということですね。
文字からアプリ?どういうことでしょうか?
たとえば、これまでは「ローンの計算したい」とWeb検索すると、計算方法が書かれた文章か、計算サイトへのリンクが返ってきましたよね。
で、リンク先に飛んで、広告だらけのサイトでちまちま計算するハメになります。
これからは、AIがその場で「計算アプリ」を作って渡してくれるようになります。
マジ?
はい。
何かを質問したら、テキストで回答する代わりに、AIがその場で、マジさん専用の「ミニWebサイト」や「アプリ」を作って回答してくれるようになります。
もうググってあちこち探す必要ないじゃないですか!
そうです。
一人一人に最適な「画面」を見て、触って、直感的に理解できるようになります。
え、すごい!
検索、理解、作業、完了までがその場で完結するのですね!
その通りです。
他にも、「自分に似合う服を教えて」と聞けば、ただ服を並べるだけでなく、なぜその服が似合うのかという「ファッション理論」を解説しながら、あなた専属のスタイリストとしてコーデを提案してくれるアプリが、その場で生成される、という使い方も公式で紹介されています。
くぅ〜、早く使ってみたい!今すぐやります!
残念ながら、日本ではまだ未実装です...
ズコーッ!!
最新機能は北米だけ先に解禁ってパターン多すぎません?
日本はお預けばっかりですよ!
日本で使えるようになるのも時間の問題のはずです。
楽しみに待ちましょう。
そのほかの注意点に触れるとしたら、リッチな画面を作る分、生成に少し時間がかかるなどの課題もあるようです。
多少の待ち時間は許容しろということですね
Cursorを喰らう「Google Antigravity」
そして最後の発表は、Googleから『Google Antigravity』という開発者向けのツールが発表されたことです。
アンチグラビティ!?
なかなかイカした名前をつけますね。
ボクの好みです。
これは簡単に言えば、AIを使うことを前提にした文章作成ツール、いわゆる「AIエディタ」です。
人間が言葉で指示をするだけで、AIがプログラミングコードや文章を書いてくれます。
それってマスターがいつも使っている『Cursor』と同じ?
ええ、その通りです。
『Cursor』など似たようなツールが既に存在しており、Googleが後発として本格的に参入してきた形になりますね。
なるほど、Googleも市場を獲りにきたわけですね。
ええ。
リリース直後なのでまだ挙動が不安定な部分もありますが、「AIが何をやろうとしているかがわかりやすい」「AIの計画にコメントできるのがいい」といったポジティブな評価も多いです。
今回は詳しくお伝えしませんが、興味がある方はぜひチェックしてみてください。
まとめ Gemini3の圧倒的性能
さて、ここまでの話を振り返りましょう。
今日お伝えしたGemini 3の革新的なポイントは4つ。
1つ目は、他社を圧倒する最強の頭脳『Gemini 3 Pro』の登場。
2つ目は、AIの回答がアプリになる『生成型インターフェース』。
3つ目は、Googleアプリと連携して作業を代行する『エージェント機能』。
そして4つ目は、今回は深く触れませんでしたが、AIがアプリを作ってくれる開発環境『Google Antigravity』の登場でしたね。
盛りだくさんでしたね!
でもマスター、正直なところ、Gemini 3の検証結果を見ても『劇的に変わった!』って感じはしなかったかも…。
鋭いですね。
たしかに、進化が分かりにくいかもしれません。
しかし、この『分かりにくい進化』こそが最も重要なのです。
え、どういうことですか?
例えば、100メートル走のタイムを20秒から19秒に縮めるのと、10秒から9秒に縮めるのでは、同じ1秒でも難易度が桁違いですよね?
たしかに!
トップアスリートの世界だと、0.1秒縮めるのでさえ、大変なことですよね。
仕事も同じで、90点のものを100点にする『最後の詰め』にこそ、9割のリソースが使われます。
これまでのAIはその『詰め』が苦手でしたが、Gemini 3はついにそこを突破したのです。
なるほど!
派手さはないけど、一番大変で大事な『最後の詰め』ができるようになった。
だから『最強』なんですね!
その通りです。
この『最後の詰め』ができるAIの登場で、私たちの仕事のスピードはさらに向上するでしょう。
ぜひご自身の手で、その進化を体感してみてください。