これさえ押さえれば取り残されない、最先端のAIニュースを1日1つお伝えします。
マジさん、今『最強AI』と話題のGemini 3を、さらに超えるAIが出たことをご存じですか?
えっ!?Gemini 3って出たばっかりですよね?
あれを超えるなんて流石に早すぎませんか?
ええ。11月24日、Anthropic社から『Claude Opus 4.5』という最新モデルが発表されました。
これが、これまで最強とされてきたGemini 3を、コーディング性能で上回ったのです。
Claudeですか…名前はよく聞きますけど、正直ほとんど使ったことないんですよね。
Claudeって影が薄くないですか?
そうですね。マジさんだけでなく多くの人にとってもClaudeは馴染みが薄いと思います。
そんなClaudeが天下を…?
もう、最強がコロコロ変わりすぎて、どのAIを使ったらいいのか全然わかりません!
AIの進化速すぎ!
お気持ちはよくわかります。
そこで今日は、Claude Opus 4.5が具体的に何がスゴいのか、実際に使い比べてみた所感と、結局我々が今どのAIを選ぶべきかという「AI選びの結論」もお話しします。
AI選びの結論!それは気になります!
Claude Opus 4.5は何がスゴいのか?
まずは簡単に、今回の『Claude Opus 4.5』の何がそんなにスゴいのか、ポイントを絞って解説します。
お願いします!Gemini 3超えっていうくらいだから、相当ヤバいんですよね?
ええ。まず何よりも、プログラミング能力を測るテストにおいて、あのGemini 3のスコアを明確に上回りました。
具体的には、AIにシステムの改修やバグ修正を行わせる『SWE-bench』というテストで、史上初めて正答率80%の壁を超えたのです。
80%超え…!Gemini 3は何%だったんですか?
Gemini 3は約76%でした。
あれ?4%しか変わらなくないですか?
もっと圧倒的な差なのかと…。
数字だけ見るとそう思うかもしれません。
ですが、ここまでハイレベルな戦いになると、この数%の壁を越えるのが至難の業なのです。
あートップアスリートの世界もコンマ何秒の戦いって言いますもんね…。
ええ。そしてこの4%の差は、技術的な知識がない人でも、Webサイトやアプリなどを「最後までAIだけで作りきれるかどうか」を分ける、決定的な差になり得ます。
なるほど!技術の専門知識がないボクみたいな人こそ、その4%に助けられるってことですね!
ええ。そして驚くべきエピソードがあります。
実は今回、開発元のAnthropic社が、自社のエンジニア採用試験をこのAIに解かせてみたんです。
エンジニアの採用試験?
それって、人間でも難しいやつ?
もちろんです。一流のエンジニアを目指す人間たちが必死に受ける試験です。
ところが、Claude Opus 4.5は、過去にその試験を受けた「どの人間の候補者よりも」高いスコアを叩き出したのです。
ええっ!?人間全員負けちゃったんですか!?
もう「AIの手を借りる」レベルじゃなくて、「AI先生にお願いする」レベルじゃないですか!
まさにその通りです。
この「人間超え」の能力は、単にコードを書くだけでなく、PCを自動操作するといった高度なタスクにも応用されています。
ひえぇ…まさにコーディング最強って感じですね。
ぶっちゃけGemini 3と比べてどうなの?
では、ここからは私が実際に『Claude Opus 4.5』と『Gemini 3』を同じ条件で使い比べてみた、忖度のない結果をお話しします。
お!マスターの検証!それが一番知りたかったです。ぶっちゃけ、どうなんでしょう?
結論から言うと、評判通り、コーディングに関してはClaudeが確実にGeminiを超えていました。
おお!やっぱりそうなんですね。
Webサイトのデザインを作らせる程度であれば、正直、両者に違いは感じられません。どちらも非常に優秀で、一瞬で作ってくれます。
まあ、最近のAIならそれくらいは朝飯前でしょうね。
差が出たのは、より複雑なタスクです。
今回、簡易的ではありますが「動画編集ツール」を作らせてみました。
うわ、難しそう!そんなのAIだけで作れるんですか?
Gemini 3では、途中でエラーが出てしまいました。
しかし、Claude Opus 4.5は、なんとエラーなしで、一発で実際に動画の編集から書き出しまでできるツールを完成させたのです。
それはスゴすぎます!さっき言ってた「4%の差」がここで効いてくるわけですね!
そうですね。ただ、今回のOpus 4.5の進化はそれだけではありません。
実は「文章力」においても、あのGeminiとほぼ変わらないレベルに到達しているのです。
ええっ!?コーディングだけじゃなくて、文章力でも並んじゃったんですか!?
マスター、「文章を書かせるならGemini一択だ」って、耳にタコができるくらい言ってましたよね?
そこまで繰り返し言ったことはないと思いますが…。認識を改める必要があるほどの進化ではあります。
実は、以前Gemini 3を紹介した時に行った「文章力テスト」を、今回のClaude Opus 4.5でも試してみたのです。
あ!「絶対に押してはいけないボタンの注意書き」を考えさせるやつですね!
そうです。ただ禁止するだけでなく、20文字以内という厳しい制限の中で、いかに人間の心理を突いて行動を止められるか。クリエイティブなセンスが問われる難問です。
Gemini 3の「全連絡先にあなたの検索履歴を送信」は衝撃的でした…。
ええ。よく覚えていましたね。対する今回のOpus 4.5の回答がこちらです。「押した人の顔を全社に公開」
うわっ…!これもシンプルに嫌だ!!
Geminiの「検索履歴」ほどの破壊力はないかもしれませんが、「社会的制裁」をチラつかせるあたり、人間の心理をよく理解しています。
たしかに、Gemini 3と遜色ないレベルですね…。
ええ。他にも色んな方法で使い倒してみた肌感にはなりますが、文章の書き味にはGeminiとの違いを感じました。
Claudeは、表現が慎重で堅実です。
真面目な優等生タイプってことですね。
対してGeminiは、より人間味があったり、良い意味で予想外のクリエイティブな表現をしてくれることが多い。
性能はほとんど互角なので、あとは好みの問題と言えるでしょう。もちろん、指示の仕方で調整もできます。
なるほど。じゃあ、もう全部Claudeでいいんじゃないですか?
いえ、そうとは言えません。Geminiには、Claudeにはない「大きな長所」があるのです。
ほう、最強の座は譲らないと?
そうですね。Geminiの最大の武器は「一度に覚えられる情報量」です。
Geminiは100万トークン、文庫本にすると数冊分を読み書きできますが、Claudeが読み書きできるのはその5分の1、20万トークン程度です。
え、5倍も違う!
ええ。ですから、大量の資料やマニュアルを読み込ませて、それを元に作業させるなら、依然としてGemini一択です。
それに加えて、「マルチモーダル」の能力、つまり動画や音声をそのまま理解して処理する力も、Geminiが圧倒的です。
動画の分析や音声の書き起こしとかは、Gemini一択のままというわけですね。
結局どれを使えばいいの?
うーん、それぞれ強みがあって迷いますね…。
結局ボクたちはどのAIを使うのが正解なんですか?Claudeに乗り換えるべき?
結論から言えば、ズバリ「ChatGPTとGeminiを両方使う」のが正解です。
ええっ!?ずっとClaudeの話をしてたのに、Claudeは選ばれないんですか!?
たしかにClaudeは素晴らしいAIです。
特に、「プログラミング知識ゼロだけど、自分だけの便利ツールを作ってみたい」という非エンジニアの方には、ぜひ一度触ってみてほしいです。
えっ、非エンジニアですか?てっきり玄人向けかと…。
逆です。知識がない人でも、Claudeの高い能力があれば、言葉で指示するだけで動くアプリが作れてしまう。
その体験をするには最高のツールでしょう。
じゃあ、なんで選ばれないんですか?
あくまで「限られた予算で、メインで使い倒すなら」という視点で選んだ結果です。
多くの人にとって、ChatGPTとGeminiの組み合わせが、最もコストパフォーマンスが高く、実用的です。
それはまあ、全部契約したらお金がいくらあっても足りませんけど…。
私は仕事柄、Claudeも含めて全てのAIに課金していますが、おすすめしたChatGPTとGeminiの2つに絞ったとしても、毎月5,000円以上かかります。決して安くない金額です。
うっ、毎月5,000円はキツイ…。今金欠なんですよ、どれか1つに絞りたいです。
そう思うのが普通です。ですが、あえて言わせてください。
それでも、今はそれぞれの得意分野が明確に異なるため、両方使うことで得られる生産性と快適さがコストを上回るのです。
そこまで言いますか!じゃあ、どう使い分ければいいんですか?
シンプルです。プライベートや日常使いには『ChatGPT』。仕事でバリバリ使うには『Gemini』です。
え、ChatGPTはプライベート向け?
基本そうですね。検索能力が高く、ショッピング機能など生活に役立つ機能が充実しています。
何より会話に人間味があって楽しい。それだけでAIを使う機会が増えます。
たしかに、話し相手としてChatGPTは最高です。今のボクの一番の話し相手。
対してGeminiは、有料プランに契約すると『NotebookLM』など他のGoogleのAIサービスも十分に使えるようになります。
スライドや図解の作成、画像生成も大量にできるなど、「仕事で使える機能」の多さが圧倒的です。
なるほど…。で、でもマスター!究極どっちか1つって言われたらどっちですか?
そうですね…どっちか1つと言われたら、やはりGeminiでしょう。「仕事で使える」ということは活躍の場面が多いですから。
うっ…。Geminiですか。でも、チャッピーとお別れするのはキツイですね…。
各社の「戦略」を知れば、もうAI選びで迷わない
さて、今回のニュースを通じて、私が最も伝えたかったのは「使うべきAIの考え方」についてです。
「最強が出たらすぐ乗り換える」じゃダメなんですか?
それだと疲弊してしまいます。AIの進化は速すぎて、昨日の最強が今日は2位になる世界ですから。
たしかに…。ボクでも流石に負担が大きくてしんどいです。
それに、自分の情報がAIに蓄積されず、AIの実力を引き出し切れません。
だからこそ、目先のAIの性能ではなく、各社の「戦略」、つまり「誰のために作っているのか」を見るのです。
これはあくまで私の見解ですが、各社の動きを見ていると力を入れているポイントがよく分かります。
それぞれの「狙い」を見極めるわけですね!
ええ。AnthropicのClaudeは「玄人好みの職人道具」。つまり、高いプログラミング能力を必要とするプロフェッショナルのシェア獲得に力を入れてます。
プロから好かれるように頑張っていると。
ええ。対してOpenAIのChatGPTは、いわば「みんなのiPhone」。日常に溶け込み、会話や生活サポートで一般ユーザーを虜にすることに力を入れていますね。
たしか、約8億人もユーザー数がいるって話でしたもんね!
その通りです。そしてGoogleのGeminiは「最強のオフィス道具」。仕事の生産性を高めるための、ビジネスパーソン必須のツールというポジション獲得に力を入れているように見えます。
仕事で使うにはGeminiが一番ってなりたいわけですね。
もちろん、これはあくまで「今まで、各社がどこに力を入れてきたか」の違いであって、最終的には全社とも全ての領域を取りに来るでしょう。
最終決戦はこれからってことですね!
ええ。重要なのは、目の前の性能の話題に振り回されることなく、今の自分の用途と、各社の現在の戦略を照らし合わせて、長く付き合う相棒を選ぶこと。これが賢いAIの選び方でしょう。
ただし、各社の棲み分けを覆すようなAIの進化が起きたときは、またすぐに教えますよ。
ありがとうございます!!ボクはマスターについていきます!
それでは本日のデイリーニュースは以上です。また明日お会いしましょう。