Как расходуются токены в Claude? Лайфхаки токеносбережения
Сейчас я больше работаю с Claude, поэтому задумалась об экономии ) Что накопала — делюсь )
Токен — это кусочек текста, чуть меньше слова, для английского ≈ ¾ слова, для русского дороже, кириллица дробится на большее количество токенов). Вот тут первый лайфхак: пишите на английском )
При каждом сообщении модель обрабатывает:
• Входные токены — вся история чата целиком, системные инструкции, прикреплённые файлы, инструкции проекта.
• Выходные токены — собственно ответ Claude.
Ключевой момент: история читается заново на каждом шаге. Поэтому чем длиннее диалог, тем дороже каждая следующая реплика, даже если она короткая.
Как тратить меньше токенов?
• Планировать сообщение. Объединять связанные вопросы в одно сообщение.
• Новая тема — новый чат. Не таскать за собой длинную нерелевантную историю.
• Длинные тексты и документы, к которым обращаешься многократно, держать в Проектах и формате md: содержимое кэшируется (а в RAG-режиме подгружается только релевантными кусками) и не списывается заново при каждом сообщении.
• Отключить ненужные инструменты и коннекторы в настройках.
• Выключать extended thinking, когда задача простая.
• Выбирать текст, а не скрин. Для сравнения: 1 000 токенов ≈ 750 слов текста.
• Подбирать модель под задачу — для простого незачем брать Opus.
Как отслеживать расход?
Сlaude.ai/settings/usage — прогресс-бары текущей сессии и недели для Pro/Max/Team. Это запаздывающий индикатор: он показывает «сколько процентов плана съедено», но не счётчик токенов конкретной реплики.
Claude Code: команда /cost показывает потокенный расход сессии, /stats — паттерны во времени; плюс локальные JSONL-логи, которые читают сторонние мониторы.
API: точное число входных/выходных токенов в каждом ответе + отдельный эндпоинт для предварительного подсчёта.
en<able> - о дизайне в A11y | Наши статьи на VC

