My AI tools were eating 23,000 tokens before doing any actual work.Мои AI-инструменты съедали 23 000 токенов ещё до начала какой-либо реальной работы.
My AI tools were eating 23,000 tokens before doing any actual work.
MCP servers load their full schema on every prompt. 1,000-10,000 tokens per server, and you’re paying before the model even starts thinking.
I refactored my setup from monolithic MCP servers to Progressive Skills — a framework where only metadata loads upfront (50 tokens), and full documentation loads on demand.
Results:
- Notion: 9,600 → 600 tokens (94% reduction)
- Telegram: 3,500 → 400 tokens (89% reduction)
- Total: 23,000 → 6,900 tokens (70% saved)
The approach: each skill is a small SKILL.md entry point (15-25 lines) with scripts/ and references/ loaded only when needed. One skill, all tools — works across Claude Code, Codex, and Cursor via symlinks.
If you’re running multiple MCP servers and wondering why your context window feels cramped, this might be why.
Мои AI-инструменты съедали 23 000 токенов ещё до начала какой-либо реальной работы.
MCP-серверы загружают всю свою схему на каждый промпт. 1 000–10 000 токенов на сервер, и вы платите ещё до того, как модель вообще начинает думать.
Я переделал свою конфигурацию с монолитных MCP-серверов на Progressive Skills — фреймворк, в котором заранее грузится только метаинформация (50 токенов), а полная документация подгружается по запросу.
Результаты:
- Notion: 9 600 → 600 токенов (сокращение на 94%)
- Telegram: 3 500 → 400 токенов (сокращение на 89%)
- Итого: 23 000 → 6 900 токенов (экономия 70%)
Подход: каждый skill — это небольшая точка входа SKILL.md (15–25 строк) с папками scripts/ и references/, которые загружаются только при необходимости. Один skill, все инструменты — работает в Claude Code, Codex и Cursor через симлинки.
Если вы запускаете несколько MCP-серверов и удивляетесь, почему контекстное окно ощущается тесным, возможно, дело именно в этом.