Fable 5が監督、Opus 4.8が職人、Sonnet 5が若手。AIの適材適所を仕組み化した話
前回の記事で「作業員を安いモデルにするかは様子を見る」と書いた宿題に、同じ日のうちに答えが出ました。カギは『賢さ』で分けるのをやめて『間違えても気づけるか』で分けたこと。できあがった3段階の役割表と、非エンジニアが日本語だけで組んだ『自動でモデルが切り替わる仕組み』の種明かしを、正直な注意点つきで公開します。
先に結論:前回、作業を「監督」と「作業員」に分けました。今日はその作業員をさらに2階級に分けて、どの仕事にどのモデルを使うかを自動で決まるようにしました。分ける軸は「賢さ」ではなく「もし間違えても、あとのチェックで気づけるか。やり直しは安いか」です。気づける機械的な作業は安いモデル、公開する文章やお金に関わる作業は必ず上位のモデル。そして、この仕組みはプログラムを書かずに、AIの記憶にルール表を保存しただけで動いています。非エンジニアの私でも、日本語のお願いだけで組めました。
こんにちは、アイランドネームです。
前回、3対0で負けた高いAIを、それでも使う場所が見つかった話という記事を書きました。高いモデルを「監督」、安いモデルを「作業員」に分ける、という話です。
その記事の終わりに、私はひとつ宿題を残していました。作業員を、もう一段安いモデル(Sonnet 5)にするかどうか。品質と節約のバランスをもう少し様子を見てから決める、と書いたのです。
ところが、その宿題に、同じ日のうちに答えが出ました。今日はその続報です。作業員を2つの階級に分けて、どの仕事にどのモデルを使うかを、自分でいちいち考えなくても自動で決まるようにした話をします。
最初は「賢さ」で分けようとして、手が止まった
作業員を2階級に分ける。言葉にすると簡単ですが、いざやろうとすると、最初の一歩で手が止まりました。
私が最初に考えた分け方は「賢さ」でした。難しい仕事は賢い(高い)作業員に、簡単な仕事は安い作業員に。ごく自然な発想です。
でも、これがうまくいきませんでした。理由は単純で、仕事の「難しさ」や「賢さ」は、私にはうまく測れないからです。この作業は難しいのか、簡単なのか。線引きしようとすると、どれも「場合による」としか言えなくて、基準が決まらない。ここで完全に詰まりました。
うまくいったのは、軸を変えたこと
行き詰まって、ふと考え方を変えてみました。「賢さ」で分けるのをやめて、別の軸で分けてみたのです。
新しい軸は、これでした。
- もし作業員が間違えたら、あとのチェックで気づけるか
- もし間違えていたら、やり直しは安く済むか
この二つで「はい」と言える仕事なら、安いモデルに任せても大丈夫だ、と考えました。
なぜこれで大丈夫なのか。カギは、前回作った「監督が必ず最後にチェックする」体制にあります。私のところでは、作業員が何をやっても、必ず監督のチェックが挟まります。だから、たとえ安いモデルがどこかで間違えても、機械的に気づける種類の間違いなら、チェックの網で拾えるのです。拾えるなら、そこで直せばいい。結果として、仕上がりの品質は落ちません。
たとえば「300個のファイルに、この一文が入っているか確認して」という作業。もし数え間違いや見落としがあっても、あとで別のやり方で照合すれば、機械的にすぐ気づけます。こういう仕事は、安いモデルで十分だと判断しました。
逆に、公開する文章の本文はどうか。ここで安いモデルが「なんとなく薄い文章」を書いても、それは機械的な間違いではないので、チェックで拾いにくい。読んで「なんか違うな」と気づけても、直すには結局書き直しになる。やり直しが高くつくのです。だから、こういう仕事は上位のモデルに任せる。
「賢いかどうか」ではなく「間違えても取り返しがつくかどうか」。軸をこう変えたら、急に線が引けるようになりました。
できあがった3段階の役割表
そうして整理したのが、この3段階の役割表です。前回の「監督」の下に、作業員が2階級ぶら下がる形になりました。
- 監督(Fable 5):計画づくり、最終チェック、どこを直すかの判断
- 上級作業員(Opus 4.8):公開する文章の本文、お金や信頼に関わる作業、答えのない調査や分析
- 一般作業員(Sonnet 5):機械的な一括チェック、手順書のある定型作業、素材集めや下調べ
会社にたとえるなら、監督が現場責任者、上級作業員がベテラン職人、一般作業員が若手、といったところでしょうか。難しい判断や大事な仕事はベテランに、手順が決まっている数の多い仕事は若手に。ごく普通の役割分担です。それをAIでやっているだけ、とも言えます。
節約のために、信頼は売らない(安全弁が2つ)
この分け方には、破ってはいけない安全弁を2つ用意しました。
一つめ。迷ったら、上位のモデルを使う。どちらの階級に振るか判断に迷う仕事は、必ず上のモデルに任せます。安く済ませたい気持ちより、失敗しない方を優先する、というルールです。
二つめ。公開する文章の本文と、お金に関わる作業は、例外なく上位のモデル。ここは節約の対象にしません。読者に読んでもらう文章と、お金の絡む判断だけは、いちばん信頼できる相棒に任せる。ここをケチったら本末転倒だからです。
節約はしたい。でも、節約のために読者からの信頼を売るようなことはしない。この線引きだけは、はっきり決めておきました。
基準は「育てる」もの。最初から完璧を目指さない
もう一つ、大事にした考え方があります。それは「最初から完璧な基準を作ろうとしない」ということです。
どの仕事をどの階級に振るか。これを机の上で完璧に決めきるのは無理だと、最初の失敗でわかっていました。だから、基準そのものを、使いながら育てていく方針にしました。ルールはこうです。
- まず安いモデルに任せてみて、問題がなければ、その作業は「安いモデルで確定」にする
- もし2回連続で直しが必要になったら、その作業は上位のモデルに戻す
- 全体を、月に1回見直す
これは、新人スタッフの育て方とまったく同じだな、と思いながら決めました。いきなり全部の仕事を任せるのではなく、簡単な仕事から任せてみる。うまくできたら、その仕事は「もう任せて大丈夫」とする。何度もつまずくようなら、その仕事はまだ早い、と一段上の人に戻す。人を育てるときの、ごく当たり前のやり方です。
基準を固定せず、実績を見ながら少しずつ調整する。そう決めたら、気持ちがずいぶん楽になりました。最初の線引きが多少ずれていても、あとで直せばいいのですから。
種明かし:この「自動で切り替わる仕組み」、プログラムは書いていません
さて、ここまで読んで「自動でモデルが切り替わる仕組み」と聞くと、なにか難しいプログラムを組んだように思われるかもしれません。私も最初はそう身構えていました。
でも、実際にやったことは、拍子抜けするほど単純でした。
やったのは、今作った3段階の役割表を、AIの「記憶(メモリ)」に日本語で保存しただけです。それだけ。プログラムのコードは、一行も書いていません。
なぜこれで「自動」になるのか。私が使っているAIは、毎回の作業を始めるときに、まず自分の記憶を読み込む仕組みになっています。だから、私が「この仕事をやっておいて」と頼んだ瞬間に、AIは記憶にある役割表をさっと見て、「この仕事は一般作業員でいいな」「これは上級作業員に回そう」と、自分で判断してモデルを選んでくれるのです。
私は毎回モデルを指定する必要がありません。ただ日本語で仕事を頼むだけ。あとはAIが表を見て、勝手に適材適所で振り分けてくれる。これが、非エンジニアの私にも作れた「自動でモデルが切り替わる仕組み」の正体です。プログラミングではなく、日本語のルール表一枚で組めてしまいました。
で、いくら安くなるのか(前回の試算のおさらい)
お金の話も、軽く触れておきます。詳しい計算は前回の記事に書いたので、ここでは結論だけ。
前回試算した通り、一般作業員をSonnet 5にできれば、全部を高いモデル(Fable 5)でやる場合に比べて、半額以下になる見込みです。役割を分けるだけで、これだけ変わります。
しかも、Sonnet 5には今だけの追い風があります。このモデルは2026年8月末まで導入価格になっていて、通常よりさらに安く使えるのです。つまり、今は「一般作業員をお試しで回してみる」のに、いちばん都合のいい時期だということになります。安い時期に試して、ダメなら戻せばいい。基準を育てる方針とも、ちょうど噛み合いました。
一つ正直な断り書きを。これはAIの公式単価から計算した概算で、契約プランによっては「お金」ではなく「利用枠の消費量」の話になる場合もあります。ただ、比率の考え方はどちらでも同じです。
正直な注意点:この仕組みは、今日動き始めたばかりです
いい話が続いたので、正直な注意点も書いておきます。このサイトの信条なので。
いちばん大事な注意点は、これです。今日ここで紹介した仕組みは、まさに今日動き始めたばかりで、一般作業員(Sonnet 5)班の実績は、まだ一件もありません。ゼロです。
つまり、私はまだ「安いモデルでも本当に品質が落ちないか」を、自分の目で確かめてはいないのです。理屈の上では大丈夫なはず、と設計しただけ。実際に回してみたら、想定と違う結果が出るかもしれません。
だから、これは「うまくいった自慢話」ではなく、「こういう仕組みを組んで、今から試すところです」という記録として読んでください。もし一般作業員に任せてうまくいかない作業が出てきたら、それも隠さずに報告します。うまくいかなかった話こそ、たぶん誰かの役に立つので。
実は、この記事も「できたての役割表」どおりに作られています
最後に、ちょっとした種明かしを。前回に続いて、今回もあります。
実はこの記事自体が、今日作ったばかりの役割表どおりに作られています。本文を書いたのは、上級作業員のOpus 4.8です。公開する文章の本文だから、というルールに従って、いちばん信頼している相棒に書いてもらいました。そして、記事の構成を設計して、最後にチェックしたのは、監督のFable 5です。
つまり、できあがったばかりの役割表にとって最初の仕事が、この記事を作ることだったのです。表を作って、その表に従って表の説明記事を書く。ちょっとおかしな話ですが、仕組みがちゃんと動いている、なによりの証拠だと思っています。
なお、記事の頼み方そのものについては、AIに記事を書いてもらう私の頼み方に、実際のお願い文つきでまとめています。あわせてどうぞ。
まとめ
今日の持ち帰りを、もう一度だけ。
- 前回の宿題(作業員を安いモデルにするか)に、同じ日のうちに答えを出した
- 分ける軸を「賢さ」から「間違えても気づけるか、やり直しは安いか」に変えたら、うまく線が引けた
- できあがったのは3段階(監督・上級作業員・一般作業員)の役割表
- 安全弁は2つ。迷ったら上位、公開する本文とお金の作業は必ず上位。節約のために信頼は売らない
- 基準は最初から完璧にせず、新人を育てるように、実績を見て調整していく
- この「自動で切り替わる仕組み」は、プログラムではなく、AIの記憶にルール表を保存しただけで動いている
- ただし一般作業員班の実績はまだゼロ。これから検証して、うまくいかなければ正直に報告する
今回いちばんの発見は、分け方に詰まったとき、軸そのものを変えたら道が開けた、ということでした。難しさで分けようとして手が止まったのに、「間違えても取り返しがつくか」で分けたら、すっと決まった。うまくいかないときは、頑張る方向を変えるより、測る物差しを変えてみる。これはAIの話に限らず、いろんな場面で使えそうな気がしています。
そして、非エンジニアの自分でも、日本語のルール表一枚で「仕組み」が作れたこと。これが今日いちばん嬉しかったことでした。コードが書けなくても、考え方を整理して言葉にできれば、AIに手伝ってもらって形にできる。そう実感できた一日でした。
今日も読んでいただき、ありがとうございました。また次の記録で。
次に読む
- 使い方ガイド
3対0で負けた高いAIを、それでも使う場所が見つかった話(監督と作業員の分け方)
先日の対決で書き手としては3対0で負けた最新モデル(Fable 5)。じゃあこの高い新型は無駄なのか、と思いきや、ちゃんと得意な場所がありました。高い道具を『監督』、安い道具を『作業員』に分ける使い方と、きょう実際にやったAI環境の大掃除(AIに読ませるルールの量が約73%減)を、成果の数字ごと正直に公開します。
- 制作の記録
AIの相棒が新型になったので、今までの相棒と対決させてみた(まさかの3対0)
新しいAIモデル(Fable 5)が使えるようになったので、今までの相棒(Opus 4.8)と『同じ仕事』を目隠しで競わせてみました。審判は私。ベンチマークでは新型が上のはずが、結果は3対0で今までの相棒Opus 4.8の勝ち。数字の強さと『自分に合う』は別物でした。実験のやり方も全部公開します。
- 制作の記録
プライバシーポリシーと免責事項を、相棒と相談して作った話
個人ブログにもプライバシーポリシーや免責事項っているの?と相棒(AI)に聞いたら、『プライバシーポリシーは実質必須、免責事項も強く推奨』との答え。その理由(ステマ規制や自分を守る話)と、サイトを重くせずに“ただのページ”で用意できた記録です。