AI-корректор русского языка

✍️ Обзор проекта

146M

Носителей русского языка

₽8.2B

Рынок EdTech РФ (2025)

27%

Рост спроса на AI-writing

Проблема

Миллионы русскоязычных пользователей ежедневно пишут тексты: студенты (курсовые, дипломы), предприниматели (коммерческие предложения, деловая переписка), копирайтеры, журналисты, блогеры. Существующие инструменты (орфография в Word, Grammarly для английского) либо не покрывают русский язык, либо проверяют только орфографию, игнорируя стилистику, пунктуацию и перефразирование. Орфо — единственный заметный российский сервис, но он работает через веб-сайт и не интегрирован в мессенджеры, где люди пишут больше всего.

Решение

Telegram Mini App «AI-корректор» — карманный редактор русского языка: вставил текст → получил исправленную версию с пояснениями каждой правки. Три режима: «Быстрая проверка» (орфография + пунктуация за 2 сек), «Глубокий анализ» (стилистика + перефразирование за 5 сек), «Режим редактора» (пошаговое применение правок с выбором варианта). Поддержка всех типов текстов: деловой, научный, публицистический, разговорный. Объяснение каждой ошибки — обучающий эффект.

Ключевые преимущества

Скорость Проверка за 2-5 секунд

Обучение Пояснения к каждой правке

3 режима От быстрой проверки до редактуры

Контекст Адаптация под стиль текста

💰 Юнит-экономика

Доходная часть

ARPU (Free)	₽0
ARPU (Pro, мес.)	₽199
ARPU (Team, мес.)	₽599
Средний ARPU (взвеш.)	₽142
Conversion Free→Pro	7%
Conversion Free→Team	1.5%

Расходная часть

CAC (ТГ-каналы)	₽180
CAC (органика)	₽45
CAC (взвешенный)	₽115
COGS (LLM API/запрос)	₽0.15
COGS (на платящего/мес)	₽28
Support cost	₽12/мес

₽1 704

LTV (12 мес)

14.8x

LTV / CAC

0.8 мес

Окупаемость CAC

Монетизация

Free

₽0

3 проверки/день
Только орфография

Pro

₽199/мес

Безлимит проверок
Все режимы + история

Team

₽599/мес

5 пользователей
API + стиль-гайд

🏗️ Архитектура

Frontend

Telegram Mini App
React + TipTap Editor
Diff-view для правок

Backend

Python + FastAPI
PostgreSQL + Redis
Celery для очередей

↓

LLM Pipeline

GPT-4o-mini (быстро)
GPT-4o (глубоко)
Fallback: YandexGPT

Правила

Словарь Зализняка
Орфо-эпический словарь
Правила Розенталя

Аналитика

Типичные ошибки
Прогресс пользователя
Персональный словарь

Стек технологий

Python 3.12 FastAPI React 19 TipTap PostgreSQL Redis Celery Docker OpenAI API YandexGPT

Инфраструктура

VPS (Selectel/Yandex Cloud) — 4 vCPU, 8GB RAM (LLM-задачи требовательнее). Docker Compose. Nginx + SSL. CI/CD: GitHub Actions. Кэширование ответов LLM в Redis для идентичных запросов (экономия до 40% на API). Мониторинг: Sentry для ошибок, Prometheus для метрик. Rate limiting: 10 запросов/мин для Free, безлимит для Pro.

🔄 Пользовательский флоу

Открытие бота

Пользователь находит @AiCorrectorBot в Telegram. Нажимает «Start» → приветственное сообщение с примером: «Отправьте текст, и я проверю его за 2 секунды».

Ввод текста

Пользователь вставляет или набирает текст (до 10 000 символов Pro, 2 000 Free). Либо пересылает сообщение из другого чата — бот проверит текст пересланного сообщения.

Выбор режима проверки

Inline-кнопки: «Быстрая» (орфография+пунктуация, 2 сек), «Глубокая» (стилистика+перефраз, 5 сек), «Редактор» (пошаговые правки с выбором). Free — только быстрая.

Результат проверки

Diff-view: исходный текст с подсвеченными ошибками + исправленная версия. Каждая правка — кликабельная с пояснением: «Запятая перед "чтобы" нужна, потому что...». Обучающий компонент.

Применение и экспорт

Кнопка «Скопировать исправленный текст» или «Применить выборочно» (в режиме редактора). Экспорт в PDF с пометками для преподавателей.

Обучение и аналитика

Профиль: «Частые ошибки», «Прогресс за месяц», «Рекомендации». Геймификация: достижение «Мастер пунктуации» при 100 текстах без ошибок в запятых.

📊 Финансовая модель (3 года)

Показатель	Год 1	Год 2	Год 3
Пользователи (конец года)	18 000	85 000	320 000
Платящие пользователи	1 530	7 225	27 200
ARR (годовой recurring доход)	₽2.6M	₽12.3M	₽46.3M
Операционные расходы	₽3.5M	₽7.8M	₽18.5M
LLM API затраты	₽0.8M	₽2.1M	₽5.2M
Маркетинг	₽1.2M	₽3.5M	₽7.8M
EBITDA	-₽2.9M	-₽1.1M	+₽14.8M
Маржинальность EBITDA	-112%	-9%	32%
Накопленный баланс	-₽2.9M	-₽4.0M	+₽10.8M

Динамика выручки и EBITDA

Год 1

Год 2

Год 3

Выручка

EBITDA

Ключевые допущения

Conversion Free→Paid: 8.5% (выше среднего для EdTech). Churn: 6%/мес (год 1), 4%/мес (год 2-3). LLM-затраты оптимизируются через кэширование (-40%), batch-обработку и transition на более дешёвые модели (GPT-4o-mini для 80% запросов). Основные каналы: Telegram-каналы о русском языке, студенческие чаты, SEO-статьи «как проверить текст на ошибки».

🛡️ 5 Аксиом ОСР v7.0 — Антихрупкая разработка

1. Контекстная Энтропия (Context Entropy)

Любой контекст деградирует со временем — модели LLM устаревают, правила языка меняются.

Директива 1: LLM-модели обновляются провайдером без предупреждения — prompt-шаблоны версифицируются, при изменении ответа автоматически откатываются к предыдущей версии.

Директива 2: Правила русского языка эволюционируют — база правил обновляемая, с A/B тестированием новых норм до продакшена.

Директива 3: Пользовательский контекст (частые ошибки) пересчитывается ежемесячно — старые паттерны удаляются, чтобы не зашумлять рекомендации.

2. Механическая Истина (Mechanical Truth)

Истина только та, которую можно проверить механически.

Директива 4: Каждое исправление LLM верифицируется через правила (словарь + грамматика) — модель может ошибиться, правило — нет.

Директива 5: Рate-калькулятор проверяет, что исправлённый текст действительно лучше исходного (меньше ошибок по правилам).

Директива 6: E2E тесты: 10 000 пар «исходный → правильный» текст. Если LLM-ответ не совпадает с эталоном более чем на 15% — алерт.

3. Граничное Разрушение (Boundary Decay)

Границы модулей размываются без принудительного контроля.

Директива 7: LLM-сервис изолирован от основного бэкенда через REST API — смена провайдера (OpenAI → YandexGPT) не влияет на приложение.

Директива 8: Модуль правил (словари) отделён от LLM-pipeline — правила работают даже когда LLM недоступен.

Директива 9: Контракт между frontend (Mini App) и backend зафиксирован в OpenAPI — любые изменения проходят через schema registry.

4. Обратимость (Reversibility)

Каждое действие должно быть обратимым.

Директива 10: Каждый новый prompt для LLM проходит через feature flag — если качество падает, откат за 30 секунд.

Директива 11: Пользователь может отменить любое исправление — исходный текст всегда доступен в истории.

Директива 12: Канареечные деплои: 5% трафика на новую версию LLM-pipeline, автопереключение при росте ошибок.

5. Неизменность Состояния (State Immutability)

Состояние — неизменяемая последовательность событий.

Директива 13: Все проверки текста append-only — лог правок невозможно изменить, только дополнить новыми.

Директива 14: Снапшот профиля пользователя (частые ошибки, прогресс) на каждую проверку — аналитика строится на immutable данных.

Директива 15: CQRS для разделения записи (отправка текста) и чтения (история проверок) — независимое масштабирование.

🗺️ Roadmap реализации

Фаза 1: MVP (месяц 1-2)

Telegram Bot + проверка текста Запланировано

Быстрая проверка (орфография+пунктуация) Запланировано

Diff-view результатов Запланировано

Фаза 2: Pro-функционал (месяц 3-4)

Глубокий анализ + перефразирование Запланировано

Подписки + оплата Запланировано

Режим редактора (пошаговые правки) Запланировано

Фаза 3: Обучение и аналитика (месяц 5-8)

Профиль «Частые ошибки» + прогресс Запланировано

Team-тариф + API Запланировано

Геймификация и достижения Запланировано

Фаза 4: Экосистема (месяц 9-12)

Браузерное расширение Запланировано

Интеграция с MS Word / Google Docs Запланировано

Кастомные стиль-гайды для компаний Запланировано