Opus 4.8 考えすぎ問題 ~「こいつGPTみたいになったな」と思った時に見直すこと~
みなさんOpus4.8使ってますか?コーディングエージェントとしては確実に注意力や推論能力が上がっていますが、端々で「なんか日本語がおかしいな」って思ったことないでしょうか。
実際めちゃくちゃおかしい事になっているので、現象のまとめと対策法を考えてみました。
みなさんOpus4.8使ってますか?コーディングエージェントとしては確実に注意力や推論能力が上がっていますが、端々で「なんか日本語がおかしいな」って思ったことないでしょうか。
実際めちゃくちゃおかしい事になっているので、現象のまとめと対策法を考えてみました。
Claude Codeに新しくできたDynamic Workflowっていう機能がありまして。簡単に言うと数十個のAIエージェントにブレストさせる機能なんですが、それにGrokを組み込もうとして失敗した記録なんですが、セキュリティ的な意味で貴重な発見がありましたのでシェアします。
先日Claude Opus4.5の発表資料を見ていたら、AIコーディングとRustはかなり相性がいいらしくて、SWE-benchの成績でRustがJavaに次ぐパス率でした。しかし体感的には、Typescriptでバイブコーディングしてる時の3倍速くらいで5時間リミットに到達しちゃいます。得意なはずなのになぜ……?
今回はClaude CodeのSkills機能をフル活用して、RustでOpusが無双できる環境づくりを紹介したいと思います。
ClaudeCodeで並列処理するとサブエージェントをいくつか起動して作業してくれますよね。でもこのサブエージェント、なんかCLAUDE.mdとかSkillsのルールを無視しているような動きをしてるなって思ったことありませんか?
なんと実際無視していました(衝撃)
私が作りました(生産者シール)
HOTFIX: v3.0あたりからnpxでインストールすると動作しない状態が2週ほど続いていたようでした。現在はnpxで動作するように修正済みです。ご迷惑おかけしました。
sqlewはもともとClaudeCodeのエージェントが効率的に並列作業をするための、サブエージェント用のコミュニケーションレイヤーを作ったはずでした。
が、使いながら自己開発をするうえで色々な機能が追加・削除されて、今では「プロジェクトのコーディングルールと設計理念を効率的に保持するツール」に落ち着きました。
10/16に発表になったClaude Skillsは、これまでClaudeCodeのみだったAgent機能やまともにプログラミング知識が必要なMCPサーバとちがって、Claude DesktopのみでClaudeに機能追加できる画期的な新機能でした。
早速試してみましたのでレポートを。
Claude Codeで使えるMCPサーバ「sqlew」を作ってnpmで公開しました。MCPサーバを作りたい人ってほとんどバイブコーダーだと思うのでみんな割と簡単に作ってると思います。MCPサーバ特有の「最適化」については誰も語ってないような気がしたので、いろいろと工夫した結果を共有します。
ClaudeCodeのサブエージェント同士、あまり情報のやり取りが出来ていない&他のサブエージェントが何をやっているのか理解していなそうな動きをしているのが気になりまして。
「サブエージェント同士が同じレイヤーで何をしているか」を把握しやすいようなツールを探していましたが、無いので作りました。人生初npm公開。
昔から使ってるPCなので、なんにも考えずにWindows環境にnodeやらnpmやらを入れてまして。IDEで動かしているだけならなんの問題もなかったんですけど、ClaudeCodeってLinuxのBashの上で動かす前提でファイル操作をしようとするんですよね。なので、ファイルパスを間違えた”CUersMyNameDocumentPhpProjectProjectDirTest.json”みたいな明らかに君パス間違ったよねっていうファイルを吐いたりします。
前回GPT5でがんばるぞいって言った夜にSonnet4.5が出て、すっかりClaudeCode一択になってます。
ClaudeCodeにはサブエージェントという、本編チャットとは独立したコンテクストを持つチャットを持つことができます。サブエージェントにはそれぞれに役割を付加する事でかなり生成効率を上げる事ができます。
基本的な導入方法とカスタムエージェントのアイディアを共有していきます。