若手Sonnet 5、実戦デビュー2連勝。ついでに、見込み倒れの訂正もします
一昨日作った3段階の役割表で「実績はまだゼロ」と書いた若手モデル(Sonnet 5)が、同じ日のうちに実戦デビューし、下調べと総点検の2つで結果を出しました。育成ルールに従い、この2種類の仕事は正式に若手の担当に。あわせて、前に書いた『索引も約4割減らせる見込み』が外れたので、その訂正も正直にします。賢いAIでも長い作業の途中で止まる、という学びつきで。
先に結論:一昨日、AIチームを3段階(監督・上級作業員・若手)に分ける役割表を作りました。そのとき「若手(Sonnet 5)の実績はまだゼロ」と書いたのですが、その若手が同じ日のうちに実戦デビューし、2つの仕事で結果を出しました。ひとつは新記事をGoogleに登録するための下調べ、もうひとつは片付け後の総点検です。どちらも監督のチェックで修正ゼロ。育成ルールに従い、この2種類は正式に若手の担当に決めました。あわせて、前に「AIの記憶の索引も約4割減らせる見込み」と書いたのが外れたので、その訂正も正直にします。見積もりは外れる。外れたら隠さず言う。今日はそういう記録です。
こんにちは、アイランドネームです。
一昨日、Fable 5が監督、Opus 4.8が職人、Sonnet 5が若手。AIの適材適所を仕組み化した話という記事を書きました。AIチームを3段階に分けて、どの仕事にどのモデルを使うかを自動で決まるようにした、という内容です。
その記事の中で、私は正直にこう書いていました。若手(Sonnet 5)班の実績は、まだ一件もない。ゼロですと。仕組みは作ったけれど、実際には回していない、と。
ところが、その若手が、同じ日のうちに実戦デビューしました。しかも、2つの仕事で続けて結果を出してくれたのです。今日はその報告をします。あわせて、以前の記事の「見込み」がひとつ外れたので、その訂正も正直にします。良い報告と、ばつの悪い報告が、両方ある回です。
デビュー戦その1:新記事を検索に載せるための下調べ
若手の最初の仕事は、下調べでした。
やりたかったのは、新しく書いた記事を、検索サービス(Google)にちゃんと登録してもらう作業です。記事を公開しただけでは、すぐに検索結果に出てくるとは限りません。だから、こちらから「この記事ができましたよ」と登録の手続きをします。その前段として、まず状況を調べる必要がありました。この下調べを、若手に任せました。役割表でいう「素材集めや下調べ」に、まさに当てはまる仕事だからです。
若手が調べ上げてきたのは、こんな内容でした。
- これまで私がどういうやり方で登録してきたか、その過去の手順
- 今回、登録すべきページはどれとどれか、その一覧
- 手続きの注意点。たとえば、手動でお願いできる件数には1日10件ほどの上限があること
どれも正確でした。監督(Fable 5)が最後にチェックしましたが、修正はゼロ。若手がまとめた下調べを、そのまま次の作業の土台に使えました。
この下調べをもとに、実際の登録作業はベテラン(Opus 4.8)が引き受けて、無事に登録も完了しました。若手が調べ、ベテランが動く。役割表どおりのリレーです。
うれしい発見もありました
作業の途中で、うれしい発見もありました。公開したばかりの記事のいくつかが、私がお願いの手続きをする前に、すでに自動でGoogleに載っていたのです。こちらから頼まなくても、向こうが勝手に見つけて拾ってくれていた。
これは地味ですが良い兆候です。サイトの下ごしらえ(検索エンジンが記事を見つけやすいように整えておく準備)が、ちゃんと効いている証拠だからです。日々の地味な仕込みが、こういう形で返ってくるのは、素直にうれしいものでした。
デビュー戦その2:片付け後の総点検
若手の2つめの仕事は、総点検でした。
一昨日、私はAIの記憶(メモリ)の大掃除をしました。この話は3対0で負けた高いAIを、それでも使う場所が見つかった話に書いた通りで、AIに読ませているルールの量を大きく減らす作業です。
大掃除のあとには、必ず確認が要ります。勢いよく片付けたあと「大事なものまで捨てていないか」「片付け残しはないか」を点検する、あの作業です。これを若手に任せました。若手が総点検したのは、こんな項目です。
- 記憶の索引に張られたリンク93本が、ちゃんと生きているか(リンク切れがないか)の全数確認
- ファイルの数が、あるべき数と合っているか
- 大掃除で、消してはいけない大事なルールが、うっかり消えていないか
これはまさに「機械的な一括チェック」で、若手向きの仕事です。もし見落としがあっても、あとで別のやり方で照合すれば機械的に気づける。役割表でいう「間違えても取り返しがつく」種類の仕事です。
結果、若手は全項目クリアの点検報告書を上げてきました。リンク93本すべて生存、ファイルの数も一致、大事なルールも無事。監督のチェックでも、問題は見つかりませんでした。
結果、「下調べ」と「総点検」は若手で確定にしました
デビュー戦2つの結果を受けて、私は育成ルールを発動させました。一昨日の記事で決めた育成ルールは、こうです。まず若手に任せてみて、問題がなければ「若手で確定」にする。もし2回連続で直しが必要になったら、上位のモデルに戻す。人を育てるときと同じやり方です。
今回、下調べも総点検も、監督のチェックで修正ゼロでした。だから、このルールに従って、この2種類の仕事は正式に若手(Sonnet 5)の担当に確定しました。
これが何を意味するか。品質は落ちていないのに、費用は下がる、ということです。この2種類を今後ずっと上位のモデルでやっていたら、その分だけ余計に費用がかかっていました。若手に任せられると分かった今、そこは節約できて、しかも品質は監督のチェックで担保される。
一昨日「これから試す」と書いた役割表が、机上の空論で終わらず、実際に回り始めた。これが今日いちばんの良い報告です。仕組みは、回して結果が出て、初めて「使える」と言える。その最初の一歩を、若手が踏み出してくれました。
ここから、ばつの悪い報告です:見込みがひとつ外れました
さて、良い報告はここまでです。ここからは、ばつの悪い報告をします。正直に書くのが、このサイトの信条なので。
前に書いた3対0で負けた高いAIを、それでも使う場所が見つかった話の中で、私は大掃除の成果として、こう書いていました。
「AIの記憶の索引も、約4割減らせる見込みが立ちました」
この「約4割減らせる見込み」が、外れました。実際にやってみたら、ほぼ横ばいだったのです。数字で言うと、索引は18.4KBから17.9KBへ。4割どころか、ほんのわずかしか減りませんでした。
なぜ見込みが外れたのか。理由は2つあります。
一つめ。私は今回、「情報は消さない」という安全方針で片付けを進めました。あとで必要になるかもしれない情報は、思い切って捨てずに残す。慎重にやった結果、削れる量が当初の見込みより少なくなりました。
二つめ。この数日で、私は新しいルールを次々に追加しました。役割表(3段階の使い分け)や、二段階承認(情報の持ち出しルール)などです。これらは全部、索引に書き足されます。つまり、片付けで減らした一方で、新しいルールを足したぶんが増えた。差し引きで、ほぼ横ばいになったわけです。
それでも実害が小さい理由
言い訳がましくならないように、事実だけ正直に書きます。
見込みは外れましたが、実害は小さいです。片付けの本丸は、ちゃんと達成できているからです。
そもそも今回の大掃除の主役は、索引ではありませんでした。主役は「AIが毎回読み込むルールの総量」で、こちらは約73%減らせました。この数字は前回の記事に書いた通り、達成済みです。読み込む量が大きく減ったので、AIが本来の仕事に使える集中力が増える、というねらいは果たせています。索引は、いわば脇役でした。脇役の減り幅が見込みより小さかったのは事実ですが、本丸が達成できているので、大掃除全体としては効果が出ています。
とはいえ、見込みを外したのは事実です。「約4割減らせる」と書いておいて、実際は横ばいだった。これは、はっきり訂正しておきます。見積もりは外れることがあります。外れたときに、こっそりなかったことにするのではなく、外れましたと言う。それがこのサイトの流儀なので、ばつは悪いですが書いておきました。
もう一つの学び:賢いAIでも、長い作業の途中で止まることがある
今回、もう一つ学びがありました。AIを使う人みんなに関わる話だと思うので、共有しておきます。
実は大掃除の最中に、ベテランの作業員(Opus 4.8)が、長い作業の途中で止まってしまったのです。一度にたくさんの手順を頼んだところ、その途中でぷつっと止まった。エラーで壊れたわけではなく、長い仕事の途中で息切れしたような感じでした。
このとき助けになったのは、監督のチェックでした。監督が「あれ、途中で止まっているな」と気づいて、残っている仕事を小さく分け、仕切り直しで頼み直した。そうしたら、無事に最後まで終わりました。
ここから得た教訓は、はっきりしています。大きな仕事は、まとめて頼まず、小分けにして頼む。これです。考えてみれば、人間の仕事の頼み方とまったく同じでした。相手が優秀な人でも、「これ全部、一気にやっておいて」と大量に渡せば、どこかで抜けたり息切れしたりします。賢い人にこそ、仕事は適度な大きさに切って渡したほうが、結局きれいに片付く。AIも同じでした。賢いモデルだからといって、一度に欲張らない。小分けにして、一つずつ頼む。これが今回いちばん実務的な学びでした。
予約公開の結果報告
最後に、予約公開の結果報告です。昨日の朝の記事、AIを騙そうとする割り込みが来た話は、前の晩に仕込んでおいた「予約公開」の仕組みで、翌朝に自動で世に出ました。仕組みは、ちゃんと動きました。
そして、実はこの記事も、同じ方式による予約公開の第2号です。もしあなたがこれを朝の時間に読めているなら、それは仕組みが2回続けて動いた、ということになります。1回だけなら「たまたま」かもしれませんが、2回続けば、もう「実験」ではなく「運用」です。夜に下書きを仕込んで、朝は自動で出す。この流れが、私の日課のひとつになりました。
まとめ
今日の持ち帰りを、もう一度だけ。
- 実績ゼロだった若手(Sonnet 5)が実戦デビューし、下調べと総点検の2つで結果を出した(どちらも修正ゼロ)
- 育成ルールに従い、この2種類の仕事は正式に若手の担当に確定。品質は落とさず費用は下がる。役割表が実戦で回り始めた
- 前に書いた「索引も約4割減らせる見込み」は外れた(18.4KBから17.9KBでほぼ横ばい)。安全方針で削り幅が小さく、新ルール追加ぶんが増えたため。ただし本丸のルール73%減は達成済みで実害は小さい。見込みが外れたことは正直に訂正する
- 賢いAIでも長い作業の途中で止まることがある。大きな仕事は、まとめず小分けに頼む
- 正直な記録は、これからも続けます
結び
ここ数日で、AIチームの形が、だんだん見えてきました。監督がいて、ベテランがいて、若手が育ってきた。役割表を作り、安全のルールを作り、今日は若手が実戦デビューして結果を出した。少しずつですが、ちゃんとしたチームになってきた実感があります。
次は、この体制で「本業の記事づくり」を試していこうと思っています。ここで言う本業とは、アフィリエイトの話ではなく、このサイトそのものの中身のことです。できあがったチームで、記事を作る一連の流れを、どこまで速く、どこまで安くできるのか。それを、また数字ごと正直に公開していくつもりです。
見込みは、ときどき外れます。今日みたいに。でも、外れたら訂正して、また次を試す。その繰り返しの記録を、これからも残していきます。
今日も読んでいただき、ありがとうございました。また次の記録で。
次に読む
- 使い方ガイド
Fable 5が監督、Opus 4.8が職人、Sonnet 5が若手。AIの適材適所を仕組み化した話
前回の記事で「作業員を安いモデルにするかは様子を見る」と書いた宿題に、同じ日のうちに答えが出ました。カギは『賢さ』で分けるのをやめて『間違えても気づけるか』で分けたこと。できあがった3段階の役割表と、非エンジニアが日本語だけで組んだ『自動でモデルが切り替わる仕組み』の種明かしを、正直な注意点つきで公開します。
- 使い方ガイド
3対0で負けた高いAIを、それでも使う場所が見つかった話(監督と作業員の分け方)
先日の対決で書き手としては3対0で負けた最新モデル(Fable 5)。じゃあこの高い新型は無駄なのか、と思いきや、ちゃんと得意な場所がありました。高い道具を『監督』、安い道具を『作業員』に分ける使い方と、きょう実際にやったAI環境の大掃除(AIに読ませるルールの量が約73%減)を、成果の数字ごと正直に公開します。
- 制作の記録
AIの相棒が新型になったので、今までの相棒と対決させてみた(まさかの3対0)
新しいAIモデル(Fable 5)が使えるようになったので、今までの相棒(Opus 4.8)と『同じ仕事』を目隠しで競わせてみました。審判は私。ベンチマークでは新型が上のはずが、結果は3対0で今までの相棒Opus 4.8の勝ち。数字の強さと『自分に合う』は別物でした。実験のやり方も全部公開します。