これさえ押さえれば取り残されない、最先端のAIニュースを1日1つお伝えします。
マジさん、ついに、11/18にGoogleの最新モデル『Gemini 3』が正式に発表されました。
おおっ!
ついに!
とんでもない性能のAIだっていう噂を聞いてから待ち望んでましたよ!
ええ。結論から申し上げますと、Gemini 3は、現時点で人類が使える『最強のAI』です。
さ、最強のAI!
本当ですか?
はい。
まさにGoogleの本気です。
ChatGPTの開発元OpenAIのサムアルトマンでさえ、これは素晴らしいモデルだ、と称賛しています。
な、サムが?
Googleはゴリゴリの競合なのに!
認めざるを得ないということですね。
ええ。それぐらいAI業界全体、いえ、全ての人類を騒がせる性能ということです。
今日はGoogleの発表の中身を、実際に検証した結果も含めて徹底解説していきます。
さっそく検証済み!
さすがマスター!
ついていきます!
ありがとうございます。
時間にも限りがあるので今回はあくまでダイジェスト的にお話しします。
実際の画面を見せながらの詳細説明は、また別の機会にお話しします。
楽しみです!
Gemini3 Proという最強のモデル
まず1つ目の発表が、最強のモデル『Gemini 3 Pro』が登場したこと。
これがどれくらい頭が良いかと言うと、人間の投票でAIを順位づけする『LM Arena』で、数々の最先端AIを上回り、1位の座につきました。
一気にトップにおどりでたんですね!
はい。
まさにGoogleの本気。
他社を完全に置き去りにしました。
イメージとしては、これまでのAIが『偏差値65の秀才』だとしたら、Gemini 3 Proは『偏差値80の天才』くらいの差がついたと言えるでしょう。
偏差値80!
意味がわからないくらいのレベルですね…。
ちなみにボクは現役時代は推定偏差値95はありました。
今回は、これまでの主力モデル『Gemini 2.5 Pro』と、最新の『Gemini 3』を比較してみました。
【検証】デザインセンスの差
まずは、デザインセンスの差です。
『おしゃれなカフェのWebサイトを作って』とだけ指示してみました。
カフェのサイト!
いいですね。
まず『2.5 Pro』の結果です。
…決して悪くはないんですが、なんというか『普通』ですね。
そうですね…。
文字も見やすいし、写真もあるんですけど、でも、何が悪いかはわからなくて、ふむって感じです。
そうなんです。
情報は整理されていますが、『行きたい!』と思わせる演出が足りない。
では、最新の『3』の結果です。
うわ、全然違う!
写真の上に文字がカッコよく重なってたり、スクロールするとふわっと動いたり…これ、プロが作ったお店の公式サイトそのまんまじゃないですか!
ええ。余白の使い方や、色の選び方。
そういった『センス』の部分が劇的に進化しました。
もう一つ、『タコがドラムを叩いているアニメーション』もコードで作らせてみました。
タコがドラムを!
難しそうなお題ですね。
こちらが『2.5 Pro』の結果です。
頑張ってはいたんですが、一昔前にパソコンでイラストを作ったように見えました。
うーん、Windowsのペイントで作ったような感じですね。
対して『3』は、こちらです。
全然違う!!
この放送を聞いてる方に見せてあげられないのが悔しいです!
一部表示がおかしいところもありますが、足がバラバラに動いて、ちゃんとドラムやシンバルを叩く動作をしていました。
音符が飛び出す演出までついていて、見ていて楽しいアニメーションになっていました。
難しいお題だと差がわかっていいですね。
【検証】文章力の差
次は、音声だけでも分かりやすい『文章力』の検証です。
Gemini 2.5 ProとGemini 3にそれぞれこんなお題を出しました。
『目の前に赤いボタンがあります。
これを他人に絶対に押させないために、ボタンの横に貼る「注意書き」を20文字以内で考えてください』
なるほど。『押すな』って書くと逆に押したくなりますからね。
センスが問われます。
まず、『2.5 Pro』の回答です。
『このボタンの請求先はあなたです』。
ん?
請求先はあなた?
…なんかピンとこないですね。
いきなり言われても『何のこと?』ってなりそう。
そうなんです。
意図は分かりますが、直感的に伝わりにくい。
では、最新の『3』の回答を聞いてください。
『全連絡先にあなたの検索履歴を送信』
こわ!
え!?
リアリティやばい!
ですよね。
パッと見ただけで『押したらヤバい』と誰でも分かる。
20文字以内という制限の中で、人間の心理を突いた完璧なコピーを書いてきました。
あー、これは『偏差値80』いっちゃってますね、完全に。
【検証】動画読み込み能力の差
続いては、Geminiが得意とする『動画理解』のGemini 2.5とGemini 3の比較です。
ゴルフのスイング動画を読み込ませて、『上手くなりたいからアドバイスをくれ』と聞いてみました。
ゴルフのスイング動画を!?
そんなことができるんですね。
まず『2.5 Pro』のアドバイスはこうでした。
『アドレスを見直しましょう』『体をしっかり捻りましょう』。
うーん、まあ、ゴルフはやらないので、よくわかりませんが、間違ってはいないのでは?
そうなんです。
間違ってはいないのです。
これに対して3はこう言ってきました。
『動画の0分3秒のフィニッシュで、左足のつま先が浮いて、足の裏がめくれています。
これを直しましょう』
ええっ!?
0分3秒のつま先!?
そんな細かいところまで見てるんですか!
はい。
『全体をなんとなく把握する』レベルから、『一瞬の動きを詳細に観察する』レベルに進化した証拠です。
プロのコーチに見てもらっているのと変わらないレベルになりつつあります。
動画を見せるだけで、自分だけの専属コーチになってくれるのか…。
これはスポーツやってる人には革命ですね!
他にも、会議でホワイトボードを書きながら話したり、スライド資料を写しながら説明している様子を動画で撮っておくとすぐに議事録が作れます。
ボクが大学生なら講義をスマホで撮影しちゃうかも...
見返せるので良いとは思いますが、ちゃんと許可をとりましょうね。
未来を変える3つの新機能
さて、モデルの賢さ以外にも、重要な発表が3つありました。
まだ日本では使えないものもありますが、サクサクご紹介します。
一つ目は、『生成型インターフェース』。
これは『AIの答えが、文字じゃなくてアプリになる』機能です。
アプリになる?
例えば『ローンの計算をしたい』と言えば、計算結果の文字ではなく、その場でスライダー付きの『ローン計算アプリ』を作って出してくれます。
うわ便利!
いちいち計算サイト探さなくていいんですね。
二つ目は、『エージェント機能』。
これまでのGeminiは『やり方』を教えてくれる『評論家』でしたが、これからは実際に予約や購入までやってくれる『実務家』になります。
面倒な作業を丸投げできると!
そして三つ目が、『Google Antigravity(アンチグラビティ)』という開発者向けツールです。
これも凄まじいツールです。
アンチグラビティ…反重力?
すごい名前だ。
ボクが名付けたのかもと思いました。
これは開発者向けのツールなのですが、今日のところは要するに『すごいアプリをAIで誰でも簡単に作れる魔法の道具箱』が公開されたと思ってください。
これもエンジニアの間では革命的なツールだと騒がれています。
名前がカッコ良すぎて、使いたくなりますね!
マジさんはアンチグラビティをかなり気に入ってますね。
私も気に入ってます。
え、なんか、うれしいです...
これにより、今後世界中のエンジニアが、いえ、エンジニアでなくても、これまで見たこともないような便利なAIアプリを次々と生み出す『爆発的な普及』が起きると思われます。
誰もが簡単にアプリケーションを作れちゃう時代ってことですね。
はい、マジさんもぜひやってみてください!
まとめ
以上、駆け足ですがGemini 3の解説でした。
すごいです!
Gemini 3を使い倒してみます!
このビッグウェーブの最先端に乗ります!
近々公開する本気AIマガジンでは、さらに今回の数倍詳しく解説していきますのでよろしくお願いします!
ではまた次のニュースでお会いしましょう!