AI相棒ノート
記録一覧へ
使い方ガイド10 分で読めます

若手Sonnet 5、実戦デビュー2連勝。ついでに、見込み倒れの訂正もします

一昨日作った3段階の役割表で「実績はまだゼロ」と書いた若手モデル(Sonnet 5)が、同じ日のうちに実戦デビューし、下調べと総点検の2つで結果を出しました。育成ルールに従い、この2種類の仕事は正式に若手の担当に。あわせて、前に書いた『索引も約4割減らせる見込み』が外れたので、その訂正も正直にします。賢いAIでも長い作業の途中で止まる、という学びつきで。

先に結論:一昨日、AIチームを3段階(監督・上級作業員・若手)に分ける役割表を作りました。そのとき「若手(Sonnet 5)の実績はまだゼロ」と書いたのですが、その若手が同じ日のうちに実戦デビューし、2つの仕事で結果を出しました。ひとつは新記事をGoogleに登録するための下調べ、もうひとつは片付け後の総点検です。どちらも監督のチェックで修正ゼロ。育成ルールに従い、この2種類は正式に若手の担当に決めました。あわせて、前に「AIの記憶の索引も約4割減らせる見込み」と書いたのが外れたので、その訂正も正直にします。見積もりは外れる。外れたら隠さず言う。今日はそういう記録です。

こんにちは、アイランドネームです。

一昨日、Fable 5が監督、Opus 4.8が職人、Sonnet 5が若手。AIの適材適所を仕組み化した話という記事を書きました。AIチームを3段階に分けて、どの仕事にどのモデルを使うかを自動で決まるようにした、という内容です。

その記事の中で、私は正直にこう書いていました。若手(Sonnet 5)班の実績は、まだ一件もない。ゼロですと。仕組みは作ったけれど、実際には回していない、と。

ところが、その若手が、同じ日のうちに実戦デビューしました。しかも、2つの仕事で続けて結果を出してくれたのです。今日はその報告をします。あわせて、以前の記事の「見込み」がひとつ外れたので、その訂正も正直にします。良い報告と、ばつの悪い報告が、両方ある回です。

デビュー戦その1:新記事を検索に載せるための下調べ

若手の最初の仕事は、下調べでした。

やりたかったのは、新しく書いた記事を、検索サービス(Google)にちゃんと登録してもらう作業です。記事を公開しただけでは、すぐに検索結果に出てくるとは限りません。だから、こちらから「この記事ができましたよ」と登録の手続きをします。その前段として、まず状況を調べる必要がありました。この下調べを、若手に任せました。役割表でいう「素材集めや下調べ」に、まさに当てはまる仕事だからです。

若手が調べ上げてきたのは、こんな内容でした。

  • これまで私がどういうやり方で登録してきたか、その過去の手順
  • 今回、登録すべきページはどれとどれか、その一覧
  • 手続きの注意点。たとえば、手動でお願いできる件数には1日10件ほどの上限があること

どれも正確でした。監督(Fable 5)が最後にチェックしましたが、修正はゼロ。若手がまとめた下調べを、そのまま次の作業の土台に使えました。

この下調べをもとに、実際の登録作業はベテラン(Opus 4.8)が引き受けて、無事に登録も完了しました。若手が調べ、ベテランが動く。役割表どおりのリレーです。

うれしい発見もありました

作業の途中で、うれしい発見もありました。公開したばかりの記事のいくつかが、私がお願いの手続きをする前に、すでに自動でGoogleに載っていたのです。こちらから頼まなくても、向こうが勝手に見つけて拾ってくれていた。

これは地味ですが良い兆候です。サイトの下ごしらえ(検索エンジンが記事を見つけやすいように整えておく準備)が、ちゃんと効いている証拠だからです。日々の地味な仕込みが、こういう形で返ってくるのは、素直にうれしいものでした。

デビュー戦その2:片付け後の総点検

若手の2つめの仕事は、総点検でした。

一昨日、私はAIの記憶(メモリ)の大掃除をしました。この話は3対0で負けた高いAIを、それでも使う場所が見つかった話に書いた通りで、AIに読ませているルールの量を大きく減らす作業です。

大掃除のあとには、必ず確認が要ります。勢いよく片付けたあと「大事なものまで捨てていないか」「片付け残しはないか」を点検する、あの作業です。これを若手に任せました。若手が総点検したのは、こんな項目です。

  • 記憶の索引に張られたリンク93本が、ちゃんと生きているか(リンク切れがないか)の全数確認
  • ファイルの数が、あるべき数と合っているか
  • 大掃除で、消してはいけない大事なルールが、うっかり消えていないか

これはまさに「機械的な一括チェック」で、若手向きの仕事です。もし見落としがあっても、あとで別のやり方で照合すれば機械的に気づける。役割表でいう「間違えても取り返しがつく」種類の仕事です。

結果、若手は全項目クリアの点検報告書を上げてきました。リンク93本すべて生存、ファイルの数も一致、大事なルールも無事。監督のチェックでも、問題は見つかりませんでした。

結果、「下調べ」と「総点検」は若手で確定にしました

デビュー戦2つの結果を受けて、私は育成ルールを発動させました。一昨日の記事で決めた育成ルールは、こうです。まず若手に任せてみて、問題がなければ「若手で確定」にする。もし2回連続で直しが必要になったら、上位のモデルに戻す。人を育てるときと同じやり方です。

今回、下調べも総点検も、監督のチェックで修正ゼロでした。だから、このルールに従って、この2種類の仕事は正式に若手(Sonnet 5)の担当に確定しました。

これが何を意味するか。品質は落ちていないのに、費用は下がる、ということです。この2種類を今後ずっと上位のモデルでやっていたら、その分だけ余計に費用がかかっていました。若手に任せられると分かった今、そこは節約できて、しかも品質は監督のチェックで担保される。

一昨日「これから試す」と書いた役割表が、机上の空論で終わらず、実際に回り始めた。これが今日いちばんの良い報告です。仕組みは、回して結果が出て、初めて「使える」と言える。その最初の一歩を、若手が踏み出してくれました。

ここから、ばつの悪い報告です:見込みがひとつ外れました

さて、良い報告はここまでです。ここからは、ばつの悪い報告をします。正直に書くのが、このサイトの信条なので。

前に書いた3対0で負けた高いAIを、それでも使う場所が見つかった話の中で、私は大掃除の成果として、こう書いていました。

「AIの記憶の索引も、約4割減らせる見込みが立ちました」

この「約4割減らせる見込み」が、外れました。実際にやってみたら、ほぼ横ばいだったのです。数字で言うと、索引は18.4KBから17.9KBへ。4割どころか、ほんのわずかしか減りませんでした。

なぜ見込みが外れたのか。理由は2つあります。

一つめ。私は今回、「情報は消さない」という安全方針で片付けを進めました。あとで必要になるかもしれない情報は、思い切って捨てずに残す。慎重にやった結果、削れる量が当初の見込みより少なくなりました。

二つめ。この数日で、私は新しいルールを次々に追加しました。役割表(3段階の使い分け)や、二段階承認(情報の持ち出しルール)などです。これらは全部、索引に書き足されます。つまり、片付けで減らした一方で、新しいルールを足したぶんが増えた。差し引きで、ほぼ横ばいになったわけです。

それでも実害が小さい理由

言い訳がましくならないように、事実だけ正直に書きます。

見込みは外れましたが、実害は小さいです。片付けの本丸は、ちゃんと達成できているからです。

そもそも今回の大掃除の主役は、索引ではありませんでした。主役は「AIが毎回読み込むルールの総量」で、こちらは約73%減らせました。この数字は前回の記事に書いた通り、達成済みです。読み込む量が大きく減ったので、AIが本来の仕事に使える集中力が増える、というねらいは果たせています。索引は、いわば脇役でした。脇役の減り幅が見込みより小さかったのは事実ですが、本丸が達成できているので、大掃除全体としては効果が出ています。

とはいえ、見込みを外したのは事実です。「約4割減らせる」と書いておいて、実際は横ばいだった。これは、はっきり訂正しておきます。見積もりは外れることがあります。外れたときに、こっそりなかったことにするのではなく、外れましたと言う。それがこのサイトの流儀なので、ばつは悪いですが書いておきました。

もう一つの学び:賢いAIでも、長い作業の途中で止まることがある

今回、もう一つ学びがありました。AIを使う人みんなに関わる話だと思うので、共有しておきます。

実は大掃除の最中に、ベテランの作業員(Opus 4.8)が、長い作業の途中で止まってしまったのです。一度にたくさんの手順を頼んだところ、その途中でぷつっと止まった。エラーで壊れたわけではなく、長い仕事の途中で息切れしたような感じでした。

このとき助けになったのは、監督のチェックでした。監督が「あれ、途中で止まっているな」と気づいて、残っている仕事を小さく分け、仕切り直しで頼み直した。そうしたら、無事に最後まで終わりました。

ここから得た教訓は、はっきりしています。大きな仕事は、まとめて頼まず、小分けにして頼む。これです。考えてみれば、人間の仕事の頼み方とまったく同じでした。相手が優秀な人でも、「これ全部、一気にやっておいて」と大量に渡せば、どこかで抜けたり息切れしたりします。賢い人にこそ、仕事は適度な大きさに切って渡したほうが、結局きれいに片付く。AIも同じでした。賢いモデルだからといって、一度に欲張らない。小分けにして、一つずつ頼む。これが今回いちばん実務的な学びでした。

予約公開の結果報告

最後に、予約公開の結果報告です。昨日の朝の記事、AIを騙そうとする割り込みが来た話は、前の晩に仕込んでおいた「予約公開」の仕組みで、翌朝に自動で世に出ました。仕組みは、ちゃんと動きました。

そして、実はこの記事も、同じ方式による予約公開の第2号です。もしあなたがこれを朝の時間に読めているなら、それは仕組みが2回続けて動いた、ということになります。1回だけなら「たまたま」かもしれませんが、2回続けば、もう「実験」ではなく「運用」です。夜に下書きを仕込んで、朝は自動で出す。この流れが、私の日課のひとつになりました。

まとめ

今日の持ち帰りを、もう一度だけ。

  • 実績ゼロだった若手(Sonnet 5)が実戦デビューし、下調べと総点検の2つで結果を出した(どちらも修正ゼロ)
  • 育成ルールに従い、この2種類の仕事は正式に若手の担当に確定。品質は落とさず費用は下がる。役割表が実戦で回り始めた
  • 前に書いた「索引も約4割減らせる見込み」は外れた(18.4KBから17.9KBでほぼ横ばい)。安全方針で削り幅が小さく、新ルール追加ぶんが増えたため。ただし本丸のルール73%減は達成済みで実害は小さい。見込みが外れたことは正直に訂正する
  • 賢いAIでも長い作業の途中で止まることがある。大きな仕事は、まとめず小分けに頼む
  • 正直な記録は、これからも続けます

結び

ここ数日で、AIチームの形が、だんだん見えてきました。監督がいて、ベテランがいて、若手が育ってきた。役割表を作り、安全のルールを作り、今日は若手が実戦デビューして結果を出した。少しずつですが、ちゃんとしたチームになってきた実感があります。

次は、この体制で「本業の記事づくり」を試していこうと思っています。ここで言う本業とは、アフィリエイトの話ではなく、このサイトそのものの中身のことです。できあがったチームで、記事を作る一連の流れを、どこまで速く、どこまで安くできるのか。それを、また数字ごと正直に公開していくつもりです。

見込みは、ときどき外れます。今日みたいに。でも、外れたら訂正して、また次を試す。その繰り返しの記録を、これからも残していきます。

今日も読んでいただき、ありがとうございました。また次の記録で。

次に読む