3対0で負けた高いAIを、それでも使う場所が見つかった話(監督と作業員の分け方)
先日の対決で書き手としては3対0で負けた最新モデル(Fable 5)。じゃあこの高い新型は無駄なのか、と思いきや、ちゃんと得意な場所がありました。高い道具を『監督』、安い道具を『作業員』に分ける使い方と、きょう実際にやったAI環境の大掃除(AIに読ませるルールの量が約73%減)を、成果の数字ごと正直に公開します。
先に結論:最新の高いAIモデルは、全部の作業に使うと料金がもったいないうえ、仕上がりも安いモデルと大差ない場面が多いです。そこで「判断は高いモデル、作業は安いモデル」と役割を分けました。高い方(Fable 5)を計画づくりと最終チェックの監督に、安い方(Opus 4.8)を調査や執筆の作業員に。設定は、AIに日本語で一度お願いして覚えてもらうだけ。きょうはこの方式でAI環境の大掃除をやって、AIに読ませるルールの量を約73%減らせました。その一部始終を公開します。
こんにちは、アイランドネームです。
先日、AIの相棒が新型になったので今までの相棒と対決させた話を書きました。新しいモデル「Fable 5(フェーブル・ファイブ)」と、今までの相棒「Opus 4.8(オーパス)」に同じ仕事をさせて、目隠しで判定した記録です。結果は、書き手としてはまさかの3対0で今までの相棒の勝ち。テストの点数では上のはずの新型が、私の好みでは全敗しました。
そこで湧いた疑問がこれです。「じゃあ、この高い新型は、私には無駄だったのか?」
結論から言うと、違いました。書き手としては負けたけれど、別の場所にちゃんと適所があったのです。今日はその「使いどころ」の話をします。
高い最新モデルを全部に使うのは、もったいない
まず前提の話を。最新最強とされるモデルは、たいてい料金が高いです。私が使っているClaude Codeでも、Fable 5はOpus 4.8より一回あたりのコストがかかります。
これを全部の作業に使うのは、たとえるなら、時給のすごく高い凄腕コンサルタントに、コピー取りやお茶くみまで頼むようなものです。もったいないですよね。しかも、先日の対決でわかった通り、文章を書かせても安いモデルと大差ない、どころか私の好みでは負けることさえある。だったら、全作業に高い方を使う理由はありません。
でも、じゃあ高い方は一切いらないのかというと、それも違いました。使う場所さえ選べば、高い方は確かに頼りになるのです。
解決策は「監督と作業員」に分けること
私がたどり着いた答えは、役割を二つに分けることでした。
- 監督(高い方・Fable 5):計画づくり、仕事の割り振り、成果物の最終チェック、修正するかどうかの判断
- 作業員(安い方・Opus 4.8):調査、執筆、ファイル整理といった、実際の手を動かす作業
工事現場をイメージするとわかりやすいかもしれません。現場監督は、全体の段取りを決めて、職人に仕事を割り振って、できあがりを確認します。実際にレンガを積むのは職人です。監督が全部のレンガを自分で積んでいたら、日当のわりに進みませんし、そもそも監督の仕事が回りません。AIも同じで、判断が得意な高いモデルには判断を、手数が必要な作業は安いモデルに、と分けるわけです。
設定は拍子抜けするほど簡単でした
「そんな役割分担、どうやって設定するの?」と身構えていたのですが、拍子抜けするほど簡単でした。
やったことは、AIに日本語で一度こうお願いして、覚えてもらっただけです。
これからは、プラン設計と最終チェックはあなた(監督)がやってください。
それ以外の実作業(調査・執筆・ファイル整理など)は、
部下のOpusにやらせてください。
たったこれだけです。一度お願いして記憶してもらえば、以後は私が何も言わなくても、AIが自分で「これは自分がやる仕事」「これは部下に任せる仕事」と判断して使い分けてくれます。難しいプログラムの設定は一切ありません。日本語のお願い一つで、チームの体制ができました。
実例:きょうやった「AI環境の大掃除」
理屈だけだと伝わりにくいので、きょう実際にこの方式でやった作業を公開します。テーマは「AI環境の大掃除」です。
長くAIを使っていると、AIに読ませているルールや設定のファイルが、だんだん増えて散らかってきます。人間の部屋と同じで、気づくと使わないものが溜まっている。これを片付けよう、という作業でした。
流れはこうです。
- まず監督が「どこを調べるか」の計画を設計する
- 3人のAI監査員が、それぞれ別の担当を持って、同時に調査する
- 監査員の報告を、監督がチェックして、問題点をリストにまとめる
- そのリストをもとに、3人の作業員が、同時に修繕する
- 最後に監督が、直った状態を確認する
監督が一人で全部やるのではなく、実際に調べたり直したりする手数の多い部分は、複数の作業員に同時にやらせる。ここが効率のいいところです。
見つかった「ムダ」が、なかなか面白かった
調査でどんなムダが見つかったか。読んでいて少し笑ってしまうものもありました。
- 毎回読み込まれていた中国語版のルール一式。中身は英語版とまったく同じ内容の、ただの翻訳でした。私は日本人で中国語は使わないのに、なぜか毎回律儀に読み込まれていたのです
- 一度も書いたことのないプログラミング言語、9種類ぶんの開発ルール。「いつか使うかも」ですらなく、私にはそもそも縁のない言語たちでした
- 使っていない開発ツールの設定が41個
- AIの記憶をまとめた「索引」が、あれこれ足すうちに肥大化していた
どれも、悪意があって溜まったわけではなく、便利そうなものを少しずつ足していった結果です。人間の「とりあえず取っておいた書類の山」と、まったく同じ現象でした。
成果の数字
片付けた結果、数字はこうなりました。
- AIに読ませているルールの総量が、約73%減りました(159,670バイトから43,671バイトへ)
- AIの記憶の索引も、約4割減らせる見込みが立ちました
読み込む量が減ると、AIが本来の仕事に使える集中力が増えますし、毎回のコストも軽くなります。散らかった机より、片付いた机のほうが仕事がはかどるのと同じ感覚です。
安全のための手順:調査は「読むだけ」
一つ、大事な安全の話を。この大掃除で、私が守った手順があります。
監査員が調べるときは、あくまで「読み取り専用」にしました。つまり、調べるだけで、勝手には一つも直させない。見つかった問題点はいったん全部リストにして、「どれを直すか」は人間の私が選んでから、作業員に直させました。
AIに「調べて、ついでに直しておいて」とまとめて頼むと、良かれと思って余計なものまで消してしまう危険があります。だから、調べる係と直す係を分けて、その間に人間の判断を挟む。この一手間で、事故はぐっと減ります。
で、結局いくら安くなるのか(試算してみた)
気になるお金の話も、数字で公開します。まず前提として、公式の料金表によると、Fable 5の料金はOpus 4.8のちょうど2倍です。読む量にも書く量にも同じ倍率がかかるので、作業を安い方に任せた分だけ、素直に安くなります。
今回の大掃除から記事作成までの一連の作業(AIが処理した量はおよそ75万トークン、日本語で数十万文字に相当)を、3つのパターンで計算してみました。ついでに、作業員をもう一段安いモデル(Sonnet 5。料金はOpus 4.8のさらに6割)にした場合も並べます。
全部Fable 5 █████████████ 100(約2,000円)
監督+作業員方式 ████████ 約60(約1,200円)
作業員をSonnet 5 █████ 約40〜44(約740〜890円)
同じ仕事が、役割分担するだけで約4割引。作業員をさらに安いモデルにすれば半額以下です。ひとつ正直な断り書きをすると、これはAIの公式単価から計算した概算で、契約形態(定額プランなど)によって「お金」ではなく「利用枠の消費量」の話になる場合もあります。ただ、比率の考え方はどちらでも同じです。
なお私は今のところ、作業員はOpus 4.8のままにしています。先日の対決で信頼している相棒ですし、監督のチェックがあるとはいえ、品質と節約のバランスはもう少し様子を見てから決めるつもりです。この判断も含めて、また結果を報告します。
正直な注意点(このサイトの信条なので)
いい話ばかりに聞こえるといけないので、正直な注意点も書いておきます。
一つめ。監督役が読み書きするぶんの料金は、高いままです。監督には高いモデルを使っているので、そこはゼロにはなりません。安くなるのは、あくまで「作業員に任せた部分」のコストです。全体がタダ同然になるわけではない、というのは正直に書いておきます。
二つめ。高いモデルに任せる価値が大きいのは、「判断」の部分です。先日の対決でわかった通り、文章を書く作業そのものの質は、正直どのモデルでも大差ない場面が多い。だから、量をこなす作業に高いモデルを使っても、値段のわりに見返りは小さいのです。効くのは、段取りを決めたり、できあがりの良し悪しを見極めたりする、頭を使う場面です。
三つめ。これが一番大事かもしれません。「全部作り直せば、もっと良くなる」というのは幻想です。今回、動いている仕組みを賢いAIに丸ごと書き直させれば、もっときれいになるのでは、という誘惑もありました。でも、それはやりませんでした。
なぜなら、今の仕組みには、過去にいろいろ失敗して「二度とこうしないように」と積み重ねてきた再発防止のルールが、あちこちに埋め込まれているからです。丸ごと書き直すと、その「失敗から学んだ知恵」まで一緒に消えてしまう危険がある。だから今回も、始める前に「直すのは一部だけ。動いているものは触らない」と決めてから作業しました。散らかったものは片付けるけれど、ちゃんと動いている家具は動かさない、という感覚です。
実は、この記事も「監督と作業員」方式でできています
最後に、ちょっとした種明かしを。
実はこの記事自体が、今日紹介した「監督と作業員」方式で作られています。下書きを書いたのは作業員のOpus 4.8。記事の構成を設計して、最後にチェックしたのは監督のFable 5です。
先日の対決で、書き手としては3対0で負けた新型と、勝った旧型。その二つが、今はチームを組んで、一本の記事を一緒に作っている。負けたほうが監督になり、勝ったほうが現場で書く。ちょっと不思議な組み合わせですが、これがいちばん自然に回るのだから面白いものです。勝ち負けで終わりにせず、それぞれの得意を活かして共存させる。対決の続きが、こういう形に落ち着きました。
なお、記事の頼み方そのものについては、AIに記事を書いてもらう私の頼み方に、実際のお願い文つきでまとめています。あわせてどうぞ。
まとめ
今日の持ち帰りを、もう一度だけ。
- 最新の高いAIは、全部に使うと料金がもったいなく、仕上がりも安いモデルと大差ない場面が多い
- そこで「判断は高いモデル、作業は安いモデル」と役割を分けた(監督と作業員方式)
- 設定は、AIに日本語で一度お願いして覚えてもらうだけ
- きょうの大掃除では、AIに読ませるルールの量が約73%減った。ただし調査は読むだけにして、直す判断は人間が挟んだ
- 費用の試算では、全部を高いモデルでやる場合に比べて約4割減。作業員をさらに安いモデルにすれば半額以下も可能
- 動いている仕組みを丸ごと書き直すのは、過去の知恵まで消す危険があるのでやらない
この「高い道具は判断に、安い道具は量に」という考え方は、実はAIに限った話ではないな、と作業しながら思いました。仕事を外注するときも、自分の時間の使い方を決めるときも、同じことが言えます。全部を高いものでそろえる必要はなくて、本当に効く一点にだけ良いものを使う。あとは身の丈に合った道具で数をこなす。そのほうが、たいてい長続きします。
高いAIが出るたびに「乗り換えなきゃ」と焦らなくて大丈夫です。負けた道具にも、ちゃんと使いどころはある。そう思えると、少し気が楽になりました。
今日も読んでいただき、ありがとうございました。また次の記録で。
次に読む
- 使い方ガイド
Fable 5が監督、Opus 4.8が職人、Sonnet 5が若手。AIの適材適所を仕組み化した話
前回の記事で「作業員を安いモデルにするかは様子を見る」と書いた宿題に、同じ日のうちに答えが出ました。カギは『賢さ』で分けるのをやめて『間違えても気づけるか』で分けたこと。できあがった3段階の役割表と、非エンジニアが日本語だけで組んだ『自動でモデルが切り替わる仕組み』の種明かしを、正直な注意点つきで公開します。
- 制作の記録
AIの相棒が新型になったので、今までの相棒と対決させてみた(まさかの3対0)
新しいAIモデル(Fable 5)が使えるようになったので、今までの相棒(Opus 4.8)と『同じ仕事』を目隠しで競わせてみました。審判は私。ベンチマークでは新型が上のはずが、結果は3対0で今までの相棒Opus 4.8の勝ち。数字の強さと『自分に合う』は別物でした。実験のやり方も全部公開します。
- 制作の記録
プライバシーポリシーと免責事項を、相棒と相談して作った話
個人ブログにもプライバシーポリシーや免責事項っているの?と相棒(AI)に聞いたら、『プライバシーポリシーは実質必須、免責事項も強く推奨』との答え。その理由(ステマ規制や自分を守る話)と、サイトを重くせずに“ただのページ”で用意できた記録です。