Консультации по AI Systems Engineering
Ваш AI работал на демке, развалился в production?
Помогаю техлидам и фаундерам запускать AI-системы которые реально работают.
Знакомые проблемы?
AI-система требует постоянных нянек
Два разработчика только чинят промпты вместо фич. AI должен был экономить время, а жрет ресурсы команды.
"То работает, то нет"
На демке работало отлично, в production галлюцинирует. Система как лотерея — повезет/не повезет.
Токены жрут весь бюджет
Закладывали $500/месяц на токены, улетело $5K. Не понятно как оптимизировать без потери качества.
Невозможно дебажить
AI сломался, не знаем где искать проблему. Логи есть, толку ноль. Черный ящик вместо системы.
"ChatGPT может = мы можем"
ChatGPT показал отличные результаты, но API в production выдает совсем другое. Ожидания не совпали с реальностью.
Узнаете хоть одну из этих ситуаций? Я помогаю решать именно такие проблемы — системно, без танцев с бубном.
Как я помогаю
Два формата работы под разные задачи:
AI Systems Consulting
Проектирую архитектуру AI-систем, которые работают в production. От initial design до implementation strategy.
Что получите:
- Архитектурный план с четкими границами компонентов
- Стратегию тестирования и observability
- Roadmap интеграции с существующими системами
- Оценку рисков и mitigation plan
Подходит если:
- Строите AI-продукт с нуля
- Переделываете demo в production
- Нужна независимая экспертиза архитектуры
- Legacy система + AI = страх сломать
Technical Advisory
Fractional CTO / Technical Advisor для стартапов. Регулярная техническая экспертиза без найма full-time CTO.
Что получите:
- Strategic technical guidance
- Помощь в критических технических решениях
- Review архитектуры и code
- Участие в hiring и team building
Подходит если:
- Стартап без CTO/Technical Lead
- Нужна регулярная техническая экспертиза
- Строите AI-продукт, нужен experienced advisor
Отзывы клиентов
RAG в нашем чат-боте работал просто отвратительно. Пытались по всякому пытались оптимизировать — все без толку. Я принял сначала Ивана в штыки – на первой же сессии он задавал много вопросов, а то что мы не успели обсудить он попросил меня заполнить как ответы в чеклисте. Пока я это делал сам уже стал догадываться, что проблема не в RAG, а в том что он просто не нужен для нашей задачи. В дальнейшей работе с Иваном мы переделали систему на более простую. В результате она стала работать точнее (судя по тестам) и стала дешевле в обслуживании. Главное — нам стало понятно как она работает, куда смотреть если что-то сломается, и как систему расширять.
Наша команда строила агента для обработки заявок клиентов с почтовых ящиков. Сначала все работало нормально, но потом мы обнаружили себя в состоянии постоянной поддержки самого бота и перепроверки сформированных заявок. Хотели уже было отказаться от него отказаться, но пришлось бы нанимать больше менеджеров по работе с клиентами. Мы обратились за консультацией к Ивану. Иван посмотрел на нашу систему, пообщался с командой, и через несколько дней принес, как он скромно сказал - "примерный PoC как оно должно работать." Этот PoC как есть у нас третий месяц работает практически без нареканий.
Нам нужно было прикрутить AI к старому бэкенду, которому лет 6. Мы попробовали сами, но работало со слишком большими задержками на запросах, ну и вообще непонятно было как это дальше будет жить. Иван сразу сказал что так делать нельзя, и начал задавать неудобные вопросы. Честно, я думал он просто тянет время. Но когда он показал схему как должна быть интеграция — всё встало на свои места. Мы переписали AI сервис за месяц, и сейчас система работает стабильно. Токены обходятся примерно в $400/месяц, хотя закладывали в бюджет на это нагрузку от трех тысяч. Мне понравилось то что Иван вокруг его изначальной схемы расписал толковую документацию.
Проекты
Production Agentic AI System @ Monite
Мульти-агентная AI система для финансовой платформы с многоступенчатым пайплайном, структурным логированием и Schema Guided Reasoning
Технологии: Python, FastAPI, Pydantic, OpenAI, PostgreSQL, PgVector, semantic-router, Kubernetes, SGR
AI пайплайн обработки страховых документов
End-to-end система автоматической обработки страховых документов с NLP, сокращающая время обработки заявлений с 3-5 дней до <10 минут
Технологии: Python, FastAPI, Pydantic, PostgreSQL, Docker, LLM, SGR
Корпоративная AI-платформа для онбординга и обучения сотрудников
Интеллектуальная онбординг-платформа на базе RAG с evidence-proved практиками обучения, сократившая среднее время онбординга с 3 до 1 месяца
Технологии: Python, FastAPI, langchain, LLM, ChromaDB, fastembed, PostgreSQL
Для кого это
Вы — мой идеальный клиент, если:
✓ Tech Lead или Engineering Manager
Строите AI-систему в команде, нужна экспертиза
✓ Founder AI-стартапа
Demo работает, production ломается
✓ CTO/Technical Director
Нужна независимая экспертиза архитектуры
Когда стоит обращаться:
- ✓ AI-система нестабильна в production
- ✓ Нужно спроектировать AI-систему с нуля
- ✓ Токены жрут бюджет, нужна оптимизация
- ✓ Нет observability — невозможно дебажить
- ✓ Legacy + AI — боитесь сломать работающую систему
- ✓ Нужен independent review архитектуры
- ✓ Команда тонет в поддержке AI вместо разработки фич
Когда НЕ стоит обращаться:
- ✗ Ищете "волшебный промпт" который все решит
- ✗ Нужны quick hacks — я про правильную архитектуру
- ✗ Не готовы инвестировать в качество системы
Связаться
Заполните короткую форму (2 минуты), опишите вашу ситуацию. Я пришлю варианты форматов работы и доступное время для discovery call.
Или напишите напрямую: zakutnii.ivan@gmail.com
Как мы будем работать
- Discovery Call (бесплатно, 30 минут)
Обсуждаем вашу ситуацию, смотрим подходим ли мы друг другу - Scope & Proposal
Определяем scope работы, формат, стоимость - Работаем
Консультирование или advisory — в зависимости от задачи
Что дальше?
Оставьте заявку через форму или напишите на почту, опишите кратко ситуацию (2-3 предложения), и мы договоримся о discovery call.
— Иван Закутний
AI Systems Engineer
staff engineer @ octa
P.S. Если не уверены, подходит ли вам моя помощь — напишите всё равно. Я честно скажу если не смогу помочь или порекомендую кого-то другого.