Интернет и медиа

Пустышка под капотом: как ИИ-сервисы зарабатывают на незнании архитектуры нейросетей и спасает ли модульность — 18.03.26 08:30

Пустышка под капотом: как ИИ-сервисы зарабатывают на незнании архитектуры нейросетей и спасает ли модульность - 18.03.26 08:30

ИИ-юрист за 990 руб/мес. Анализирует договоры, находит статьи закона, составляет документы. Такие предложения есть и в Telegram-ботах, и на отдельных сайтах.

Звучит как будущее. Но если разобраться, как устроены эти сервисы изнутри, становится понятно: либо цена врёт, либо качество.

Дальше — конкретные цифры.

Три понятия, без которых не разобраться

Токен — единица текста, которую обрабатывает ИИ. Для русского языка один токен, примерно, 2-3 символа. Слово «договор» — это 3-4 токена. Всё, что ИИ читает и пишет, измеряется в токенах.

Обмен — одно сообщение пользователя плюс один ответ агента. Задал вопрос, получил ответ — один обмен.

API — программный интерфейс. Когда вы пользуетесь ИИ через браузер — вы общаетесь с моделью напрямую. Когда компания строит свой сервис — она подключается к модели через API. Разница, примерно, как между тем, чтобы самому ездить на такси, и тем, чтобы запустить таксопарк: механика одна, экономика — совершенно другая.

Что происходит, когда юрист задаёт вопрос

Со стороны просто: написал — получил ответ. Но под капотом происходит гораздо больше.

ИИ-модель сама по себе — не юрист. Без специальных правил она будет уверенно называть несуществующие статьи закона, путать подсудность и ссылаться на отменённые нормы. Это не баг — это стандартное поведение любой языковой модели без инструкций.

Чтобы модель работала как юрист, ей нужен агент — набор правил, протоколов и чек-листов, в нем также должна быть учтена механика работы самой LLM: ее границы и пограничные состояния, без этого агент не будет работать правильно. Это важно понимать. Вот из чего состоит реальный юридический агент (конкретный пример – мой агент по российскому праву на базе Claude):

Маршрутизатор (главный файл агента) определяет, какая отрасль права нужна — около 2 700 токенов. Базовые правила (другой файл агента) задают протоколы поиска, проверку актуальности норм, градацию надёжности — около 8 000 токенов. Дальше – чек-лист: обязательная проверка перед каждым ответом (всё ли указано, нет ли ошибок), ещё 2 600 токенов. И отраслевой файл со спецификой конкретной области — 1 800 токенов. Итого: около 15 100 токенов правил. Каждый запрос.

Зачем всё это? Без маршрутизатора модель не поймёт, что вопрос про увольнение — это трудовое право, а не гражданское. Без базовых правил она не станет проверять актуальность статей, а «вспомнит» что-то из обучения — возможно, устаревшее. Без чек-листа пропустит предупреждения о сроках давности или подсудности.

Теперь добавим то, что приходит от самого юриста. Договор на 8 страниц — около 5 800 токенов. Вопрос юриста — около 350 токенов. История предыдущих сообщений — около 800 токенов. Итого от юриста: около 6 900 токенов.

Ещё один скрытый расход — результаты поиска. Агент обязан проверять актуальность каждой нормы. 2-3 поисковых запроса за обмен, каждый возвращает результаты, которые тоже нужно «прочитать» — ещё около 10 000 токенов.

Ответ агента — развёрнутый юридический анализ с нормами и рекомендациями: около 3 500 токенов. Плюс внутренние рассуждения модели (она выстраивает логику ответа перед тем, как его написать): ещё около 5 000 токенов. Они тоже оплачиваются.

Один обмен в сумме: входящие (правила + документ + вопрос + история + поиск) — около 32 000 токенов, исходящие (ответ + рассуждения) — около 8 500 токенов. Всего за один обмен — около 40 500 токенов.

Сколько обменов в рабочий день

Компания Clio ежегодно публикует исследование юридической отрасли — Legal Trends Report. По данным за 2025 год: средний utilization rate (доля рабочего дня на оплачиваемую профессиональную работу) составляет 38% — около 3 ч из восьми.

Не все 3 ч юрист проведёт в диалоге с ИИ. Часть времени — встречи, переговоры, суд. Консервативная оценка: 1,5-2 ч активной работы с агентом в день. Да, исследование Clio — про США. Российских данных нет. Но порядок цифр вряд ли сильно отличается. При среднем времени на один обмен около 4-5 мин — примерно 25 обменов в день.

25 обменов в день, 22 рабочих дня = 550 обменов в месяц.

Считаем деньги

Цены Claude API на март 2026 года (за миллион токенов).

Opus 4.6 — флагман, лучшая точность и сложные рассуждения: $5 за входящие, $25 за исходящие. Sonnet 4.6 — средний класс, хороший баланс цена/качество: $3 за входящие, $15 за исходящие. Haiku 4.5 — бюджетный, быстрый, но менее точный: $1 за входящие, $5 за исходящие.

Курс доллара ЦБ РФ на середину марта 2026 — около 80 рублей.

Считаем на Opus 4.6, без оптимизаций.

550 обменов по 32 000 входящих = 17 600 000 входящих токенов в месяц. 550 обменов по 8 500 исходящих = 4 675 000 исходящих токенов в месяц.

Входящие: 17,6 млн токенов по $5 за миллион = $88, то есть 7 040 рублей. Исходящие: 4,675 млн токенов по $25 за миллион = $117, то есть 9 360 рублей.

Итого API: $205, то есть 16 400 рублей в месяц.

Это чистая себестоимость токенов для одного юриста на лучшей модели. Без разработки, серверов, поддержки и прибыли компании.

Если взять модель подешевле: Sonnet 4.6 — около 9 800 рублей в месяц, примерно 18 рублей за обмен. Haiku 4.5 — около 3 300 рублей в месяц, примерно 6 рублей за обмен.

Haiku в 5 раз дешевле. Но это не та же модель в компактном корпусе — это принципиально другой уровень рассуждений. Разница между Opus и Haiku в юридическом контексте примерно как между опытным юристом и стажёром, который вчера прочитал учебник: стажёр знает термины, но не понимает нюансов. Для простых справок — достаточно. Для анализа сложного договора с пересечением отраслей — опасно. Поэтому для юридической работы — только Opus.

Кэширование: экономия, которая работает не всегда

Правила агента одинаковые в каждом запросе — можно закэшировать и сэкономить 90%? Нет. Вот почему.

Первый запрос — запись в кэш, стоит на 25% дороже обычного. Все следующие, пока кэш живой — чтение, стоит 10% от обычной цены.

Ключевое ограничение: кэш живёт 5 минут. Каждый новый запрос продлевает его ещё на 5 минут. Юрист непрерывно работает — кэш живёт и экономит. Отвлёкся на звонок на 6 минут — кэш умер, следующий запрос снова полная цена плюс 25% за запись. Но можно реализовать через Keep-alive пинг кэша (Бекэнд системы автоматически отправляет в API пустой или минимальный запрос каждые 4.5 минуты, продлевая жизнь) — это даст экономию порядка $20 в месяц.

Также можно снизить себестоимость за счет гибридной маршрутизации, т.е. какие-то простые запросы, например. Определение отрасли права, можно поручить более дешевой модели (API это позволяет, в отличии от Pro). Но оператор (юрист) должен сам в каждом случае уметь определять надо ли переключаться для данной задачи на менее умную модель. Поэтому тут экономия – спорный вопрос.

Есть часовой кэш — живёт 60 минут, но запись стоит в 2 раза дороже. Для юриста, который чередует работу с ИИ и другие задачи, может быть выгоднее.

И ещё: кэшируются только правила агента — те самые 15 100 токенов, которые одинаковы в каждом запросе. Документ, вопрос, результаты поиска, история — всегда по полной цене. Кэш экономит только на 47% входящих токенов. Остальные 53% — некэшируемые.

Реальная экономия при типичной работе (5 сессий в день по 5 обменов): счёт снижается с $205 до $177 в месяц. Это 14%, а не 90%.

Модульность — зачем она нужна

Юридический агент устроен модульно. Есть базовые правила (нужны всегда) и отраслевые файлы: гражданское, трудовое, уголовное, арбитраж и так далее. Если загрузить всё сразу — модель получит около 52 000 токенов правил вместо 15 000. Это в 3,5 раза дороже на входящих токенах. И что важнее — очень сильно размывает внимание модели.

В браузерной подписке Claude (Pro) файлы агента лежат отдельно от диалога. Модель видит только маршрутизатор — около 2 700 токенов. Когда юрист задаёт вопрос, модель сама определяет: «Это трудовой спор — мне нужен файл по трудовому праву». И читает только его. Остальные отрасли лежат рядом, но не загружаются. Экономия токенов плюс точность: модель работает с компактным набором правил, а не пытается удержать в голове все отрасли одновременно.

С октября 2025 года Anthropic добавила в API поддержку Skills — тот же механизм. Разработчик загружает агента как навык, и модель через API получает доступ к файловой системе. Но есть разница: в API на один запрос можно подключить максимум 8 навыков, в Pro такого жёсткого лимита нет. Плюс для работы Skills через API нужна вычислительная среда — дополнительные $0,05 в час.

А если строить без Skills, «по-старому»? Неприятный выбор: либо загружать все файлы в каждый запрос (дорого и неточно), либо самому писать логику маршрутизации. Но чтобы понять, какие отрасли затронуты, нужно сначала прочитать документ. А чтобы прочитать документ правильно, нужны правила агента. Замкнутый круг.

Модульная архитектура — не «красивая упаковка», а инженерная необходимость. Без неё либо дороже, либо хуже.

Длинные диалоги — невидимый враг точности

Есть проблема, которую кэш не решает. И которую вообще не видно в ценах на токены.

По мере роста диалога накапливается история переписки. На первом вопросе правила агента занимают около 47% входящих токенов. На десятом вопросе история выросла, и правила занимают уже меньшую долю контекста.

Модель продолжает видеть правила. Но её внимание распределяется по всему объёму текста. Это хорошо изученный феномен: исследование группы Стэнфордского университета «Lost in the Middle» (2023) показало, что языковые модели хуже работают с информацией в середине длинного контекста. Правила, которые были в начале, постепенно теряют влияние.

В юридических вопросах это конкретно: на пятнадцатом вопросе в одном диалоге модель может «забыть» проверить актуальность нормы или пропустить чек-лист. Не потому что правила исчезли — потому что утонули в объёме.

Правильный подход: каждая задача — отдельный диалог. Анализ договора — один. Составление иска — другой. Консультация по вопросу — третий. Так правила агента всегда занимают значительную часть контекста.

Это увеличивает расходы: в каждом новом диалоге правила загружаются заново. Но альтернатива — экономия на токенах ценой точности — в юридических вопросах неприемлема.

Сколько должна стоить подписка

Себестоимость одного юриста на Opus 4.6: токены API (без кэша) — около 16 400 рублей (с учетом оптимизации можно снизить до 12500 руб), вычислительная среда для работы с файлами — около 180 рублей. Итого себестоимость API: около 12 700 рублей в месяц.

Это чистый API. К нему нужно добавить разработку и поддержку сервиса, обновление агента при нововведениях со стороны разработчиков модели, техническую поддержку, прибыль.

При стандартном для SaaS-продуктов коэффициенте (себестоимость умножить на 2) минимальная подписка на юридического ИИ-агента на Opus — от 25 000 рублей в месяц.

И это я привел стоимость для средних задач. Для больших, серьезных – требуется декомпозиция (распределение ролей и назначение цифровых сотрудников), расходы увеличатся раза в 2 как минимум. Представляете, сколько должна стоить месячная подписка?

Что значит «дешёвый ИИ-юрист»

Когда предлагают ИИ-юриста за 990 или 2 000 рублей в месяц, объяснений ровно четыре.

Первое — слабая модель. Вместо флагмана используется бюджетная. Она дешевле в 5 раз, но и рассуждает проще. Для вопроса «какой срок исковой давности по договору поставки» — справится. Для «проанализируй этот договор, найди все риски для заказчика, проверь соответствие 44-ФЗ» — начнёт пропускать нюансы.

Второе — нет правил агента. Самый распространённый способ экономии. 15 000 токенов правил загружаются в каждый запрос — это около 25% всех входящих. Убери их — себестоимость снижается. Но модель без правил — это модель без чек-листа, без протокола проверки норм, без обязательного поиска актуальных редакций. Она просто «вспоминает» право из данных обучения. А данные обучения — это интернет со всеми его ошибками и устаревшими текстами.

Третье — жёсткие лимиты. 10 вопросов в день. Или 100 в месяц. При нормативных 550 обменах это 18% от полноценного инструмента. Остальные 82% времени юрист работает по-старому.

Четвёртое — убыточная модель. Стартапы иногда осознанно продают ниже себестоимости ради базы пользователей. Это работает ровно до тех пор, пока не закончатся инвестиции. Дальше — либо цены вырастут в разы, либо сервис закроется.

Ни один из этих вариантов не даёт полноценного юридического инструмента за заявленную цену.

Это касается не только юристов

Медицинские консультации — агент должен знать протоколы диагностики, лекарственные взаимодействия, актуальные рекомендации. Объём правил не меньше, требования к точности — выше.

Финансовое консультирование — налоговое право, инвестиционные ограничения, валютное регулирование. Правила меняются ещё чаще, стоимость ошибки — прямые финансовые потери.

Инженерные расчёты — строительные нормы, допуски, требования безопасности. Здесь ошибка — не штраф. Здесь ошибка — риск для жизни.

Принцип один: чем выше стоимость ошибки — тем дороже инструмент, который ошибается редко. Это не маркетинг. Это арифметика.

Каналы в Telegram, MAX

Источник

Теги

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть
Закрыть