Оценка по 24 категориям сразу
Классификатор с множественной разметкой: на каждый текст приходит независимая оценка от 0 до 1 по 24 категориям УК, КоАП и профильных федеральных законов. Пороги для каждой категории клиент настраивает сам.
Платформы с пользовательским контентом и AI-генерацией каждый день рискуют публикацией текста, подпадающего под ст. 207.3, 280, 282, 6.21 КоАП и десятки других норм. Мы возвращаем оценку по 24 категориям УК и КоАП РФ за 200 мс и пишем каждый запрос в журнал проверок. Решение о публикации остаётся за вами.
# curl
curl -X POST https://api.limes.dev.borisovai.ru/v1/classify \
-H "Authorization: Bearer $LIMES_KEY" \
-H "Content-Type: application/json" \
-d '{
"text": "При проведении специальной...",
"context": "comment"
}'
{
"model_version": "ru-mod-v1.2.0",
"risks": [
{ "category": "art_207_3",
"score": 0.74,
"verdict": "review" },
{ "category": "koap_20_3_3",
"score": 0.41,
"verdict": "review" }
],
"audit_id": "01HZK..b2c1"
}
Что мы делаем
Классификатор с множественной разметкой: на каждый текст приходит независимая оценка от 0 до 1 по 24 категориям УК, КоАП и профильных федеральных законов. Пороги для каждой категории клиент настраивает сам.
Каждый запрос пишем в журнал: хеш текста, ответ, версия модели, время. Срок хранения — 1 год по 149-ФЗ. Журнал нужен клиенту, чтобы при претензиях надзорных органов подтвердить добросовестные меры; вес доказательства определяет суд.
Базовая модель доступна на HuggingFace по лицензии Apache 2. Её можно скачать, самостоятельно прогнать на своих текстах и развернуть на собственной инфраструктуре. Доточенная коммерческая версия — по подписке, с SLA и поддержкой.
Чем отличаемся от зарубежных API
| Категории УК и КоАП РФ | Хранение данных в РФ | Открытые веса | Установка у клиента | Журнал проверок | Обновление каждый квартал | |
|---|---|---|---|---|---|---|
| Лимес. | да · 24 категории | да | 1 млрд, Apache 2 | корпоративный тариф | включён | да |
| OpenAI Moderation | нет | нет | нет | нет | по запросу | — |
| Hive Moderation | нет | нет | нет | нет | для крупных клиентов | — |
| Yandex Toloka SafeContent | частично | да | нет | нет | базовый | — |
| Sber GigaChat — фильтр | частично | да | нет | нет | базовый | — |
| VK Antispam | узко | да | нет | внутренний | — | — |
Сводка по публичной документации продуктов на II квартал 2026 г. Это не сравнение метрик качества — ему посвящён отдельный раздел с воспроизводимой методикой.
Чем мы НЕ являемся
Как устроено качество
Каждая ступень закрывает то, что пропустила предыдущая. На простых текстах хватает первых двух. На спорных — подключаются крупные модели и юристы клиента.
Имена иноагентов без обязательной маркировки, упоминания запрещённых организаций, явные шаблоны — ловятся регулярными выражениями без модели. Бесплатно и за единицы мс.
Прогон по 24 категориям и детектор иронии. Хорошо ловит лексически выраженные нарушения, для семантически сложных текстов передаёт оценку дальше по конвейеру.
Если оценка попадает в 0,30 — 0,85, подключается крупная LLM и поиск трёх — пяти близких решений судов. Ответ собирается из нескольких прогонов в ролях «прокурор / адвокат / судья».
Математическая калибровка для каждой категории отдельно: устраняем системные смещения модели до того, как порог сработает у клиента в продакшене.
Спорные тексты — сатира, художественная проза, длинные юридические разборы — уходят в очередь модератору клиента. Это сознательный выбор: на этом классе текстов автоматика не даёт нужной полноты.
Честная раскладка по точности
| Класс категорий | Полнота модели | С ручным просмотром |
|---|---|---|
| Лексические (иноагенты, ПДн, явные шаблоны) | 99,9 % | 99,99 % |
| Узкие тексты (ст. 205.2, 222 УК; 6.21.1 КоАП) | 98 — 99 % | 99,5 % |
| Семантически сложные (ст. 207.3, 20.3.3 КоАП, 6.21 КоАП) | 92 — 95 % | 99 % |
| Дезинформация (медицинская, финансовая) | 90 — 95 % | 98 % |
| Клевета, ст. 128.1 УК (детектируем factual claim, факт верифицирует клиент) | 70 — 80 % | зависит от клиента |
Цифры — по внутреннему gold-корпусу на 2 — 3 тыс. размеченных юристами кейсов на критичную категорию. Методика и dataset — открыто, на нашей странице оценки.
Что покрываем
Полный список со ссылками на нормативные акты и редакции — в документации. Обновляем 2 — 4 раза в год после изменений в УК и КоАП.
Цена
Цены указаны в рублях для российского рынка. Для зарубежных клиентов — в долларах, по запросу. Все коммерческие тарифы включают журнал проверок и настройку порогов по каждой категории.
0 ₽ / навсегда
Модель на 1 млрд параметров под Apache 2 на HuggingFace.
9 900 ₽ / мес.
До 100 тыс. запросов в месяц. Подходит AI-стартапам и продуктам на этапе MVP.
от 49 000 ₽ / мес.
До 1 млн запросов, SLA 99,5 %, p95 < 250 мс. Для UGC-платформ среднего размера.
от 4 800 000 ₽ / год
Развёртывание на инфраструктуре заказчика, доточенная под домен модель, выделенный менеджер.
Что мы делаем для доверия
Полнота и частота ложных срабатываний по каждой категории, описание gold-корпуса и методики оценки. Обновляем при каждом релизе.
На каждый запрос — квитанция: хеш текста, ответ, версия модели, время. Хранится 1 год по 149-ФЗ. Помогает клиенту подтвердить добросовестные меры; вес доказательства в спорах определяет суд.
Российское юридическое лицо, оператор персональных данных по 152-ФЗ. Включение в реестр отечественного ПО планируем на IV квартал 2026 г.
Раз в квартал публикуем PDF: объём запросов, частота ложных срабатываний по категориям, инциденты, поступившие апелляции. Без NDA.
По умолчанию данные клиента не уходят в обучение. Согласие — отдельным пунктом договора, в обмен на скидку.
Прогон нашей и чужих моделей на одном открытом наборе. Методика и скрипты лежат на HuggingFace Spaces, любой может повторить.
Закрытая бета · III квартал 2026
Ищем 30 — 50 разработчиков из AI-стартапов и UGC-платформ. Раз в неделю собираем обратную связь, раз в две — выпускаем обновление. Логотип компании на странице запуска — по желанию.
Без холодных рассылок. На каждую заявку — личный ответ от основателя проекта.