Ваш AI работал на демке. Production пожирает команду.

Вы построили штуку, которая отлично выглядела на демо. Теперь два инженера нянчат промпты, токены сжигают бюджет, и никто не может понять, что сломалось.

Это не проблема AI. Это проблема системной инженерии. Я их решаю.

Оставить заявку


Знакомо?

Два инженера чинят промпты вместо того, чтобы доставлять фичи

AI должен был экономить время. Вместо этого он пожирает лучших людей. Они не строят продукт — они сидят с системой, которая должна работать сама.

"На демке работало, в production галлюцинирует"

Разрыв между демо и production — это не проблема промптов. Это отсутствие feedback loop, нет evaluation pipeline, и архитектура, которая не выдерживает реальную вариативность входных данных.

Счет за токены в 10 раз больше бюджета

Закладывали $500/месяц, улетело $5K. Модель делает работу, которую кеширование, роутинг или более простая архитектура решили бы за долю стоимости.

AI сломался. Никто не знает, куда смотреть.

Логи есть, но не говорят ничего. Нет структурированных трейсов, нет метрик оценки, нет способа отличить проблему модели от проблемы данных. Черный ящик вместо системы.

"ChatGPT может — значит и мы тоже можем!"

ChatGPT показал великолепные результаты в браузере. Ваш API в production выдает совершенно другое. Разрыв не в модели — он во всем вокруг модели.

Узнаете хотя бы одну ситуацию? Давайте поговорим. Я решаю именно такие проблемы, системно.


Как я реально помогаю

Я не продаю часы. Я продаю результат. Два формата в зависимости от задачи:

Архитектура AI-систем

Проектирую систему, которая делает ваш AI работающим в production. Не стратегический документ — конкретная архитектура с путем реализации.

Что получите:

Подходит если:


Fractional CTO

Постоянный senior engineering judgement без full-time найма. Встраиваюсь в ваш процесс принятия решений и ловлю проблемы до того, как они станут дорогими.

Что получите:

Подходит если:


Что говорят клиенты

RAG в нашем чат-боте работал просто отвратительно. Пытались оптимизировать — всё без толку. Я принял сначала Ивана в штыки — на первой сессии он задавал много вопросов, а то что не успели обсудить, попросил заполнить в чеклисте. Пока я это делал, сам уже стал догадываться, что проблема не в RAG, а в том что он просто не нужен для нашей задачи. Мы переделали систему на более простую. Стала работать точнее и дешевле. Главное — нам стало понятно как она работает, куда смотреть если что-то сломается, и как расширять.

— Антон, CTO

Наша команда строила агента для обработки заявок с почтовых ящиков. Сначала всё работало, но потом мы оказались в состоянии постоянной поддержки бота и перепроверки заявок. Хотели отказаться, но пришлось бы нанимать менеджеров. Обратились к Ивану. Он посмотрел систему, пообщался с командой, и через несколько дней принёс «примерный PoC». Этот PoC как есть работает у нас третий месяц практически без нареканий.

— Елена, Head of Product, e-comm платформа

Нужно было прикрутить AI к старому бэкенду, которому лет 6. Попробовали сами — большие задержки, непонятно как это будет жить дальше. Иван сразу сказал что так делать нельзя и начал задавать неудобные вопросы. Честно, думал тянет время. Но когда показал схему интеграции — всё встало на свои места. Переписали AI-сервис за месяц. Токены обходятся ~$400/месяц, хотя закладывали три тысячи.

— Нуржан, Tech Lead

Все отзывы →


Избранные проекты

Production Agentic AI System @ Monite

Мульти-агентная AI-система для финансовой платформы с многоступенчатым пайплайном, структурным логированием и Schema Guided Reasoning

Технологии: Python, FastAPI, Pydantic, OpenAI, PostgreSQL, PgVector, semantic-router, Kubernetes, SGR

Интеллектуальный пайплайн обработки документов

Async OCR-сервис с CV-препроцессингом и LLM-экстракцией: ручная обработка за 2-3 дня заменена автоматизацией за минуту

Технологии: Python, FastAPI, PydanticAI, PostgreSQL, AWS S3, OpenCV, Docker

AI пайплайн обработки страховых документов

End-to-end автоматическая обработка страховых документов: время обработки с 3-5 дней до менее 10 минут

Технологии: Python, FastAPI, Pydantic, PostgreSQL, Docker, LLM, SGR

Корпоративная AI-платформа для онбординга

Онбординг-платформа на базе RAG: среднее время онбординга с 3 месяцев до 1 месяца

Технологии: Python, FastAPI, langchain, LLM, ChromaDB, fastembed, PostgreSQL

Quint Code — Decision Engineering для AI-агентов

Open-source MCP-инструмент для структурированного принятия решений в AI coding agents. Фреймирование проблем, честное сравнение, решения как контракты.

Технологии: Go, SQLite, FPF, MCP Protocol

Все проекты →


Это вы?

Вы — мой идеальный клиент, если:

Tech Lead / Engineering Manager
Ваша команда построила AI-фичу, которая теперь требует больше поддержки, чем весь остальной продукт

Founder с работающим демо
Инвесторы в восторге, но production ломается и вы не можете понять почему

CTO / Technical Director
Нужен человек, который посмотрит на вашу AI-архитектуру свежим взглядом и честно скажет, что не так


Когда стоит обращаться:


Когда НЕ стоит обращаться:


Давайте поговорим

Оставить заявку

Короткая форма, 2 минуты. Опишите ситуацию. Я отвечу — могу ли помочь и в каком формате.

Или напишите напрямую: zakutnii.ivan@gmail.com


Как это работает

  1. Discovery Call (30 мин)
    Вы описываете ситуацию. Я задаю неудобные вопросы. Смотрим, есть ли fit.
  2. Конкретное предложение
    Отправляю план: что сделаю, что получите, сколько стоит. Без размытых ретейнеров.
  3. Работа начинается
    Архитектура, реализация, advisory — что требует ситуация. Первый deliverable обычно через 1-2 недели.

Что происходит после звонка?

Если есть fit — отправляю конкретное предложение за 2-3 дня.

Если не могу помочь — скажу честно и порекомендую кого-то, кто может.


P.S. Если не уверены, подходит ли ваша проблема — напишите всё равно. Самые ценные консультации начинаются с «я даже не знаю, что именно не так».

Назначить звонок