Ваш AI работал на демке. Production пожирает команду.
Вы построили штуку, которая отлично выглядела на демо. Теперь два инженера нянчат промпты, токены сжигают бюджет, и никто не может понять, что сломалось.
Это не проблема AI. Это проблема системной инженерии. Я их решаю.
Знакомо?
Два инженера чинят промпты вместо того, чтобы доставлять фичи
AI должен был экономить время. Вместо этого он пожирает лучших людей. Они не строят продукт — они сидят с системой, которая должна работать сама.
"На демке работало, в production галлюцинирует"
Разрыв между демо и production — это не проблема промптов. Это отсутствие feedback loop, нет evaluation pipeline, и архитектура, которая не выдерживает реальную вариативность входных данных.
Счет за токены в 10 раз больше бюджета
Закладывали $500/месяц, улетело $5K. Модель делает работу, которую кеширование, роутинг или более простая архитектура решили бы за долю стоимости.
AI сломался. Никто не знает, куда смотреть.
Логи есть, но не говорят ничего. Нет структурированных трейсов, нет метрик оценки, нет способа отличить проблему модели от проблемы данных. Черный ящик вместо системы.
"ChatGPT может — значит и мы тоже можем!"
ChatGPT показал великолепные результаты в браузере. Ваш API в production выдает совершенно другое. Разрыв не в модели — он во всем вокруг модели.
Узнаете хотя бы одну ситуацию? Давайте поговорим. Я решаю именно такие проблемы, системно.
Как я реально помогаю
Я не продаю часы. Я продаю результат. Два формата в зависимости от задачи:
Архитектура AI-систем
Проектирую систему, которая делает ваш AI работающим в production. Не стратегический документ — конкретная архитектура с путем реализации.
Что получите:
- Архитектура с четкими границами компонентов и моделями отказов
- Стратегия observability и evaluation, заложенная с первого дня
- Roadmap интеграции, который уважает ваши существующие системы
- Оценка рисков с конкретным mitigation для каждого риска
Подходит если:
- Демо работает, но production нестабилен или дорог
- Строите AI-продукт с нуля и хотите пропустить дорогие ошибки
- Нужен человек, который честно скажет, что не так с текущей архитектурой
- Legacy-система + AI — ощущение, что обезвреживаете бомбу
Fractional CTO
Постоянный senior engineering judgement без full-time найма. Встраиваюсь в ваш процесс принятия решений и ловлю проблемы до того, как они станут дорогими.
Что получите:
- Архитектурные решения проверяются до того, как в них вложатся
- Критичные технические решения с человеком, который видел, как это ломается
- Review кода и систем с actionable обратной связью, а не академической теорией
- Помощь с наймом: на что смотреть, какие вопросы задавать, какие роли вам реально нужны
Подходит если:
- Стартап без CTO или senior systems-инженера
- Растущая команда принимает архитектурные решения, которые будет дорого отменять
- Строите AI-продукт и нужен опытный advisor, который не будет вам врать
Что говорят клиенты
RAG в нашем чат-боте работал просто отвратительно. Пытались оптимизировать — всё без толку. Я принял сначала Ивана в штыки — на первой сессии он задавал много вопросов, а то что не успели обсудить, попросил заполнить в чеклисте. Пока я это делал, сам уже стал догадываться, что проблема не в RAG, а в том что он просто не нужен для нашей задачи. Мы переделали систему на более простую. Стала работать точнее и дешевле. Главное — нам стало понятно как она работает, куда смотреть если что-то сломается, и как расширять.
Наша команда строила агента для обработки заявок с почтовых ящиков. Сначала всё работало, но потом мы оказались в состоянии постоянной поддержки бота и перепроверки заявок. Хотели отказаться, но пришлось бы нанимать менеджеров. Обратились к Ивану. Он посмотрел систему, пообщался с командой, и через несколько дней принёс «примерный PoC». Этот PoC как есть работает у нас третий месяц практически без нареканий.
Нужно было прикрутить AI к старому бэкенду, которому лет 6. Попробовали сами — большие задержки, непонятно как это будет жить дальше. Иван сразу сказал что так делать нельзя и начал задавать неудобные вопросы. Честно, думал тянет время. Но когда показал схему интеграции — всё встало на свои места. Переписали AI-сервис за месяц. Токены обходятся ~$400/месяц, хотя закладывали три тысячи.
Избранные проекты
Production Agentic AI System @ Monite
Мульти-агентная AI-система для финансовой платформы с многоступенчатым пайплайном, структурным логированием и Schema Guided Reasoning
Технологии: Python, FastAPI, Pydantic, OpenAI, PostgreSQL, PgVector, semantic-router, Kubernetes, SGR
Интеллектуальный пайплайн обработки документов
Async OCR-сервис с CV-препроцессингом и LLM-экстракцией: ручная обработка за 2-3 дня заменена автоматизацией за минуту
Технологии: Python, FastAPI, PydanticAI, PostgreSQL, AWS S3, OpenCV, Docker
AI пайплайн обработки страховых документов
End-to-end автоматическая обработка страховых документов: время обработки с 3-5 дней до менее 10 минут
Технологии: Python, FastAPI, Pydantic, PostgreSQL, Docker, LLM, SGR
Корпоративная AI-платформа для онбординга
Онбординг-платформа на базе RAG: среднее время онбординга с 3 месяцев до 1 месяца
Технологии: Python, FastAPI, langchain, LLM, ChromaDB, fastembed, PostgreSQL
Quint Code — Decision Engineering для AI-агентов
Open-source MCP-инструмент для структурированного принятия решений в AI coding agents. Фреймирование проблем, честное сравнение, решения как контракты.
Технологии: Go, SQLite, FPF, MCP Protocol
Это вы?
Вы — мой идеальный клиент, если:
✓ Tech Lead / Engineering Manager
Ваша команда построила AI-фичу, которая теперь требует больше поддержки, чем весь остальной продукт
✓ Founder с работающим демо
Инвесторы в восторге, но production ломается и вы не можете понять почему
✓ CTO / Technical Director
Нужен человек, который посмотрит на вашу AI-архитектуру свежим взглядом и честно скажет, что не так
Когда стоит обращаться:
- ✓ AI-система в production, но нестабильна — и команда не может её стабилизировать
- ✓ Стоимость токенов вышла из-под контроля и непонятно, где потери
- ✓ Невозможно дебажить AI-сбои — черный ящик
- ✓ Legacy + AI — боитесь, что одно неверное движение сломает всё
- ✓ Команда тонет в поддержке AI вместо доставки фич
- ✓ Нужен независимый review архитектуры перед тем, как коммитить направление
- ✓ Строите с нуля и хотите сделать архитектуру правильно с первого раза
Когда НЕ стоит обращаться:
- ✗ Хотите "волшебный промпт", который всё решит — я занимаюсь инженерией, а не заклинаниями
- ✗ Нужно сделать вчера без оглядки на качество — скорость без архитектуры создает именно те проблемы, которые я потом чиню
- ✗ Вам нужна валидация, а не диагноз — я дам честную оценку, даже если она неудобная
Давайте поговорим
Короткая форма, 2 минуты. Опишите ситуацию. Я отвечу — могу ли помочь и в каком формате.
Или напишите напрямую: zakutnii.ivan@gmail.com
Как это работает
- Discovery Call (30 мин)
Вы описываете ситуацию. Я задаю неудобные вопросы. Смотрим, есть ли fit. - Конкретное предложение
Отправляю план: что сделаю, что получите, сколько стоит. Без размытых ретейнеров. - Работа начинается
Архитектура, реализация, advisory — что требует ситуация. Первый deliverable обычно через 1-2 недели.
Что происходит после звонка?
Если есть fit — отправляю конкретное предложение за 2-3 дня.
Если не могу помочь — скажу честно и порекомендую кого-то, кто может.
P.S. Если не уверены, подходит ли ваша проблема — напишите всё равно. Самые ценные консультации начинаются с «я даже не знаю, что именно не так».