「なんかClaude、重くなってない?」トークン消費を減らす3つの対策【実体験】

未分類
Claudeのトークン節約法

YouTubeでClaude Codeの動画を見まくって使い始めて、だんだん慣れてきた頃に気づいたんです。

「あれ、なんか最近Claudeの動きが遅くなってきてない?」って。

最初の頃はサクサク答えてくれてたのに、ある日突然「コンテキストが長すぎます」みたいなメッセージが出てきた。コンテキストって何?(笑)調べてみたら、原因はトークン(AIが1回の会話で処理できる情報量のこと)の消費が増えすぎてたことでした。

今回は、私がやらかした失敗と、実際に試してみた節約法を全部ぶっちゃけます。同じ状況になってる人、絶対おると思うので。

そもそもトークンってなんやねん

トークンの仕組み

まずここを知らないと話が始まらないので、素人なりに説明します。

トークンというのは、要するに「AIが1回に読み書きできる文章の量」のことです。

チャットで「こんにちは」って打ったとき、Claudeはそれだけじゃなくてそれまでの会話全部を読み返してから返事をしてます。これが怖いところで、会話が長くなればなるほど、毎回読む量が増えていくんです。

  • 会話1回目:「こんにちは」だけ読む
  • 会話50回目:今までの49回の会話全部+「今の質問」を読む

これが積み重なると、1回の返事にめちゃくちゃコストがかかる状態になってくるんです。「なんか重くなってきたな」と感じたら、たいていこれが原因です。

やらかし① 同じセッションで使い続けてた

セッション(会話のまとまりのこと)を閉じずに、何日も同じところで使い続けてました。「前の続きができて便利やん!」と思ってたんですが、これが大間違いでした。

会話が積み重なるほど、毎回読む量が増えてどんどん重くなっていく。作業中にいろんな質問をしながら進めてたら、気づいたら会話が100回を超えてました。そのあたりから返事が遅くなってきて、「まあ気のせいやろ」って思ってたんですが、気のせいじゃなかった(笑)。

対策はシンプルで、作業の区切りで新しい会話を始めること。

ターミナル版(黒い画面に文字を打ち込む方式のこと)を使っている人は、/clear というコマンド(命令文のこと)を打つと会話の履歴をリセットできます。または /compact(重要な部分だけ要約して軽くしてくれる命令のこと)も使えます。

デスクトップアプリ版の人は「新しい会話を始める」ボタンを押すだけ。前の話を引き継ぎたい場合は、必要な情報だけを冒頭にコピペして新しい会話を始めた方がコストを抑えられます。

やらかし② CLAUDE.mdを書きすぎてた

CLAUDE.mdの管理

CLAUDE.md(Claudeに覚えさせるルールファイルのこと)に、思いつくままにルールを書き続けたら、気づいたらとんでもない量になってました。

これもトークンを増やす大きな原因で、セッションを始めるたびにこのファイルの中身が全部Claudeに読み込まれます。ファイルが大きければ大きいほど、毎回その分のコストがかかるんです。

「あれも覚えさせたい」「これも書いとこう」と追加しまくってたら、CLAUDE.mdが300行を超えてました。正直どこに何を書いたかも自分でわからなくなってた(笑)。これはあかん。

CLAUDE.mdは200行以内を目安にするのが良いそうです。特に「もう終わった作業のメモ」「一時的に使っただけのルール」はどんどん消していく。

Claudeに「私のCLAUDE.mdを見て、今必要ない情報を教えて」って頼んだら、整理を手伝ってくれます。これが地味に使える(笑)。自分で見直すより全然早かったです。

やらかし③ 全部Opusでやってた

Claudeのモデル選択

Claude Codeには複数のモデル(AIの種類のこと)があって、それぞれ得意なこととコストが違います。

モデル特徴向いている作業
Opus(オーパス)最高品質・最高コスト難しい判断・複雑な設計
Sonnet(ソネット)バランス型日常的な作業(これが万能)
Haiku(ハイク)速い・安い単純な質問・翻訳・整理

私はずっとOpus(一番上のモデル)で全部やってたんですが、「ちょっとした質問」や「文章の翻訳」みたいな簡単な作業もOpusに頼んでたのがもったいなかった。高級寿司屋に毎日ランチ食べに行くようなもんです(笑)。

「難しい判断が必要な作業 → Opus」「普段の作業 → Sonnet」「単純な質問・整理 → Haiku」と使い分けるだけで、コストをかなり抑えられます。Sonnetで十分な作業が9割くらいあるというのが正直な感想です。

実際に試して変わったこと

節約の効果

この3つを意識し始めてから、体感でかなり変わりました。

  • 作業の区切りで新しい会話を始める→ 動きが軽くなった。返事も早くなった気がする
  • CLAUDE.mdを200行以内に整理した→ セッション開始直後の動きが明らかに速くなった
  • モデルをSonnetに切り替えた→ 正直Opusとの差をほぼ感じない。なのにコストは下がる

どれも知ってしまえば対策は簡単です。ただ知らないまま使い続けると「なんか重くなってきた」「なんか遅い」の原因がわからないまま損し続ける。50代・ITど素人の私でも気づけたので、同じ状態の人はぜひ試してみてください。

まとめ

Claudeが重くなる・コストが増える主な原因は3つ。

  • 同じセッションを長く使いすぎる → 区切りで新しい会話を始める
  • CLAUDE.mdが太りすぎ → 定期的に掃除する(200行以内目安)
  • 全部上位モデルに頼る → 作業に合わせてモデルを選ぶ

「気のせいかな?」と放置せず、早めに対策してみてください。私みたいに長期間気づかずに損するのは時間とお金のもったいない使い方です(笑)。

次の記事では、実際にCLAUDE.mdを整理した手順を公開する予定です。お楽しみに!

コメント

タイトルとURLをコピーしました