Консультации по AI Systems Engineering

Ваш AI работал на демке, развалился в production?

Помогаю техлидам и фаундерам запускать AI-системы которые реально работают.

Оставить заявку →


Знакомые проблемы?

AI-система требует постоянных нянек

Два разработчика только чинят промпты вместо фич. AI должен был экономить время, а жрет ресурсы команды.

"То работает, то нет"

На демке работало отлично, в production галлюцинирует. Система как лотерея — повезет/не повезет.

Токены жрут весь бюджет

Закладывали $500/месяц на токены, улетело $5K. Не понятно как оптимизировать без потери качества.

Невозможно дебажить

AI сломался, не знаем где искать проблему. Логи есть, толку ноль. Черный ящик вместо системы.

"ChatGPT может = мы можем"

ChatGPT показал отличные результаты, но API в production выдает совсем другое. Ожидания не совпали с реальностью.

Узнаете хоть одну из этих ситуаций? Я помогаю решать именно такие проблемы — системно, без танцев с бубном.


Как я помогаю

Два формата работы под разные задачи:

AI Systems Consulting

Проектирую архитектуру AI-систем, которые работают в production. От initial design до implementation strategy.

Что получите:

Подходит если:


Technical Advisory

Fractional CTO / Technical Advisor для стартапов. Регулярная техническая экспертиза без найма full-time CTO.

Что получите:

Подходит если:


Отзывы клиентов

RAG в нашем чат-боте работал просто отвратительно. Пытались по всякому пытались оптимизировать — все без толку. Я принял сначала Ивана в штыки – на первой же сессии он задавал много вопросов, а то что мы не успели обсудить он попросил меня заполнить как ответы в чеклисте. Пока я это делал сам уже стал догадываться, что проблема не в RAG, а в том что он просто не нужен для нашей задачи. В дальнейшей работе с Иваном мы переделали систему на более простую. В результате она стала работать точнее (судя по тестам) и стала дешевле в обслуживании. Главное — нам стало понятно как она работает, куда смотреть если что-то сломается, и как систему расширять.

— Антон, CTO

Наша команда строила агента для обработки заявок клиентов с почтовых ящиков. Сначала все работало нормально, но потом мы обнаружили себя в состоянии постоянной поддержки самого бота и перепроверки сформированных заявок. Хотели уже было отказаться от него отказаться, но пришлось бы нанимать больше менеджеров по работе с клиентами. Мы обратились за консультацией к Ивану. Иван посмотрел на нашу систему, пообщался с командой, и через несколько дней принес, как он скромно сказал - "примерный PoC как оно должно работать." Этот PoC как есть у нас третий месяц работает практически без нареканий.

— Елена, Head of Product, e-comm платформа

Нам нужно было прикрутить AI к старому бэкенду, которому лет 6. Мы попробовали сами, но работало со слишком большими задержками на запросах, ну и вообще непонятно было как это дальше будет жить. Иван сразу сказал что так делать нельзя, и начал задавать неудобные вопросы. Честно, я думал он просто тянет время. Но когда он показал схему как должна быть интеграция — всё встало на свои места. Мы переписали AI сервис за месяц, и сейчас система работает стабильно. Токены обходятся примерно в $400/месяц, хотя закладывали в бюджет на это нагрузку от трех тысяч. Мне понравилось то что Иван вокруг его изначальной схемы расписал толковую документацию.

— Нуржан, Tech Lead

Все отзывы →


Проекты

Production Agentic AI System @ Monite

Мульти-агентная AI система для финансовой платформы с многоступенчатым пайплайном, структурным логированием и Schema Guided Reasoning

Технологии: Python, FastAPI, Pydantic, OpenAI, PostgreSQL, PgVector, semantic-router, Kubernetes, SGR

AI пайплайн обработки страховых документов

End-to-end система автоматической обработки страховых документов с NLP, сокращающая время обработки заявлений с 3-5 дней до <10 минут

Технологии: Python, FastAPI, Pydantic, PostgreSQL, Docker, LLM, SGR

Корпоративная AI-платформа для онбординга и обучения сотрудников

Интеллектуальная онбординг-платформа на базе RAG с evidence-proved практиками обучения, сократившая среднее время онбординга с 3 до 1 месяца

Технологии: Python, FastAPI, langchain, LLM, ChromaDB, fastembed, PostgreSQL

Все проекты →


Для кого это

Вы — мой идеальный клиент, если:

Tech Lead или Engineering Manager
Строите AI-систему в команде, нужна экспертиза

Founder AI-стартапа
Demo работает, production ломается

CTO/Technical Director
Нужна независимая экспертиза архитектуры


Когда стоит обращаться:


Когда НЕ стоит обращаться:


Связаться

Оставить заявку →

Заполните короткую форму (2 минуты), опишите вашу ситуацию. Я пришлю варианты форматов работы и доступное время для discovery call.

Или напишите напрямую: zakutnii.ivan@gmail.com


Как мы будем работать

  1. Discovery Call (бесплатно, 30 минут)
    Обсуждаем вашу ситуацию, смотрим подходим ли мы друг другу
  2. Scope & Proposal
    Определяем scope работы, формат, стоимость
  3. Работаем
    Консультирование или advisory — в зависимости от задачи

Что дальше?

Оставьте заявку через форму или напишите на почту, опишите кратко ситуацию (2-3 предложения), и мы договоримся о discovery call.


— Иван Закутний
AI Systems Engineer
staff engineer @ octa


P.S. Если не уверены, подходит ли вам моя помощь — напишите всё равно. Я честно скажу если не смогу помочь или порекомендую кого-то другого.