Все проекты
← Все проекты

AI-корректор русского языка

Telegram Mini App NLP / LLM Образование

Интеллектуальный помощник для проверки и улучшения текста на русском языке: орфография, пунктуация, стилистика, перефразирование — всё на базе современных LLM.

✍️ Обзор проекта

146M
Носителей русского языка
₽8.2B
Рынок EdTech РФ (2025)
27%
Рост спроса на AI-writing

Проблема

Миллионы русскоязычных пользователей ежедневно пишут тексты: студенты (курсовые, дипломы), предприниматели (коммерческие предложения, деловая переписка), копирайтеры, журналисты, блогеры. Существующие инструменты (орфография в Word, Grammarly для английского) либо не покрывают русский язык, либо проверяют только орфографию, игнорируя стилистику, пунктуацию и перефразирование. Орфо — единственный заметный российский сервис, но он работает через веб-сайт и не интегрирован в мессенджеры, где люди пишут больше всего.

Решение

Telegram Mini App «AI-корректор» — карманный редактор русского языка: вставил текст → получил исправленную версию с пояснениями каждой правки. Три режима: «Быстрая проверка» (орфография + пунктуация за 2 сек), «Глубокий анализ» (стилистика + перефразирование за 5 сек), «Режим редактора» (пошаговое применение правок с выбором варианта). Поддержка всех типов текстов: деловой, научный, публицистический, разговорный. Объяснение каждой ошибки — обучающий эффект.

Ключевые преимущества

Скорость Проверка за 2-5 секунд
Обучение Пояснения к каждой правке
3 режима От быстрой проверки до редактуры
Контекст Адаптация под стиль текста

💰 Юнит-экономика

Доходная часть

ARPU (Free)₽0
ARPU (Pro, мес.)₽199
ARPU (Team, мес.)₽599
Средний ARPU (взвеш.)₽142
Conversion Free→Pro7%
Conversion Free→Team1.5%

Расходная часть

CAC (ТГ-каналы)₽180
CAC (органика)₽45
CAC (взвешенный)₽115
COGS (LLM API/запрос)₽0.15
COGS (на платящего/мес)₽28
Support cost₽12/мес
₽1 704
LTV (12 мес)
14.8x
LTV / CAC
0.8 мес
Окупаемость CAC

Монетизация

Free
₽0
3 проверки/день
Только орфография
Pro
₽199/мес
Безлимит проверок
Все режимы + история
Team
₽599/мес
5 пользователей
API + стиль-гайд

🏗️ Архитектура

Frontend
Telegram Mini App
React + TipTap Editor
Diff-view для правок
Backend
Python + FastAPI
PostgreSQL + Redis
Celery для очередей
LLM Pipeline
GPT-4o-mini (быстро)
GPT-4o (глубоко)
Fallback: YandexGPT
Правила
Словарь Зализняка
Орфо-эпический словарь
Правила Розенталя
Аналитика
Типичные ошибки
Прогресс пользователя
Персональный словарь

Стек технологий

Python 3.12 FastAPI React 19 TipTap PostgreSQL Redis Celery Docker OpenAI API YandexGPT

Инфраструктура

VPS (Selectel/Yandex Cloud) — 4 vCPU, 8GB RAM (LLM-задачи требовательнее). Docker Compose. Nginx + SSL. CI/CD: GitHub Actions. Кэширование ответов LLM в Redis для идентичных запросов (экономия до 40% на API). Мониторинг: Sentry для ошибок, Prometheus для метрик. Rate limiting: 10 запросов/мин для Free, безлимит для Pro.

🔄 Пользовательский флоу

1

Открытие бота

Пользователь находит @AiCorrectorBot в Telegram. Нажимает «Start» → приветственное сообщение с примером: «Отправьте текст, и я проверю его за 2 секунды».

2

Ввод текста

Пользователь вставляет или набирает текст (до 10 000 символов Pro, 2 000 Free). Либо пересылает сообщение из другого чата — бот проверит текст пересланного сообщения.

3

Выбор режима проверки

Inline-кнопки: «Быстрая» (орфография+пунктуация, 2 сек), «Глубокая» (стилистика+перефраз, 5 сек), «Редактор» (пошаговые правки с выбором). Free — только быстрая.

4

Результат проверки

Diff-view: исходный текст с подсвеченными ошибками + исправленная версия. Каждая правка — кликабельная с пояснением: «Запятая перед "чтобы" нужна, потому что...». Обучающий компонент.

5

Применение и экспорт

Кнопка «Скопировать исправленный текст» или «Применить выборочно» (в режиме редактора). Экспорт в PDF с пометками для преподавателей.

6

Обучение и аналитика

Профиль: «Частые ошибки», «Прогресс за месяц», «Рекомендации». Геймификация: достижение «Мастер пунктуации» при 100 текстах без ошибок в запятых.

📊 Финансовая модель (3 года)

Показатель Год 1 Год 2 Год 3
Пользователи (конец года) 18 000 85 000 320 000
Платящие пользователи 1 530 7 225 27 200
ARR (годовой recurring доход) ₽2.6M ₽12.3M ₽46.3M
Операционные расходы ₽3.5M ₽7.8M ₽18.5M
LLM API затраты ₽0.8M ₽2.1M ₽5.2M
Маркетинг ₽1.2M ₽3.5M ₽7.8M
EBITDA -₽2.9M -₽1.1M +₽14.8M
Маржинальность EBITDA -112% -9% 32%
Накопленный баланс -₽2.9M -₽4.0M +₽10.8M

Динамика выручки и EBITDA

Год 1
Год 2
Год 3
Выручка
EBITDA

Ключевые допущения

Conversion Free→Paid: 8.5% (выше среднего для EdTech). Churn: 6%/мес (год 1), 4%/мес (год 2-3). LLM-затраты оптимизируются через кэширование (-40%), batch-обработку и transition на более дешёвые модели (GPT-4o-mini для 80% запросов). Основные каналы: Telegram-каналы о русском языке, студенческие чаты, SEO-статьи «как проверить текст на ошибки».

🛡️ 5 Аксиом ОСР v7.0 — Антихрупкая разработка

1. Контекстная Энтропия (Context Entropy)

Любой контекст деградирует со временем — модели LLM устаревают, правила языка меняются.

Директива 1: LLM-модели обновляются провайдером без предупреждения — prompt-шаблоны версифицируются, при изменении ответа автоматически откатываются к предыдущей версии.
Директива 2: Правила русского языка эволюционируют — база правил обновляемая, с A/B тестированием новых норм до продакшена.
Директива 3: Пользовательский контекст (частые ошибки) пересчитывается ежемесячно — старые паттерны удаляются, чтобы не зашумлять рекомендации.

2. Механическая Истина (Mechanical Truth)

Истина только та, которую можно проверить механически.

Директива 4: Каждое исправление LLM верифицируется через правила (словарь + грамматика) — модель может ошибиться, правило — нет.
Директива 5: Рate-калькулятор проверяет, что исправлённый текст действительно лучше исходного (меньше ошибок по правилам).
Директива 6: E2E тесты: 10 000 пар «исходный → правильный» текст. Если LLM-ответ не совпадает с эталоном более чем на 15% — алерт.

3. Граничное Разрушение (Boundary Decay)

Границы модулей размываются без принудительного контроля.

Директива 7: LLM-сервис изолирован от основного бэкенда через REST API — смена провайдера (OpenAI → YandexGPT) не влияет на приложение.
Директива 8: Модуль правил (словари) отделён от LLM-pipeline — правила работают даже когда LLM недоступен.
Директива 9: Контракт между frontend (Mini App) и backend зафиксирован в OpenAPI — любые изменения проходят через schema registry.

4. Обратимость (Reversibility)

Каждое действие должно быть обратимым.

Директива 10: Каждый новый prompt для LLM проходит через feature flag — если качество падает, откат за 30 секунд.
Директива 11: Пользователь может отменить любое исправление — исходный текст всегда доступен в истории.
Директива 12: Канареечные деплои: 5% трафика на новую версию LLM-pipeline, автопереключение при росте ошибок.

5. Неизменность Состояния (State Immutability)

Состояние — неизменяемая последовательность событий.

Директива 13: Все проверки текста append-only — лог правок невозможно изменить, только дополнить новыми.
Директива 14: Снапшот профиля пользователя (частые ошибки, прогресс) на каждую проверку — аналитика строится на immutable данных.
Директива 15: CQRS для разделения записи (отправка текста) и чтения (история проверок) — независимое масштабирование.

🗺️ Roadmap реализации

Фаза 1: MVP (месяц 1-2)

Telegram Bot + проверка текста Запланировано
Быстрая проверка (орфография+пунктуация) Запланировано
Diff-view результатов Запланировано

Фаза 2: Pro-функционал (месяц 3-4)

Глубокий анализ + перефразирование Запланировано
Подписки + оплата Запланировано
Режим редактора (пошаговые правки) Запланировано

Фаза 3: Обучение и аналитика (месяц 5-8)

Профиль «Частые ошибки» + прогресс Запланировано
Team-тариф + API Запланировано
Геймификация и достижения Запланировано

Фаза 4: Экосистема (месяц 9-12)

Браузерное расширение Запланировано
Интеграция с MS Word / Google Docs Запланировано
Кастомные стиль-гайды для компаний Запланировано