SitoApp — AI-ассистент для извлечения задач из Telegram
- Фрилансер с 10 клиентами теряет 2-3 задачи каждую неделю.
- Руководитель команды из 15 человек не помнит, кто что взял на себя.
- Менеджер по продажам с 30 контактами упускает 3 возможности допродаж за месяц.
- Todoist и Notion требуют ручного переноса задач из мессенджера.
Приложение загружает сообщения из Telegram, вырезает персональные данные (телефоны, адреса, паспорта) и отправляет обезличенный текст в ИИ-модель. Модель определяет: кто взял задачу, какой срок, что именно нужно сделать. Результат — список задач с привязкой к диалогам и собеседникам.
Переписки содержат данные клиентов, сотрудников, финансовые детали. Передавать их на внешний сервер — риск утечки даже при шифровании. Поэтому мы выбрали полностью локальную обработку: интерфейс на Electron, серверная часть на Python, база данных SQLite — всё работает на компьютере пользователя, без облачного хранилища.

Перед каждым обращением к ИИ система заменяет личную информацию на псевдонимы. Телефоны превращаются в [PHONE], имена — в «Собеседник 1», «Собеседник 2», адреса — в [ADDRESS]. Модель получает только обезличенный текст и временные метки. После обработки псевдонимы разворачиваются обратно — локально, без передачи на сервер.

Первая версия инструкции для ИИ — «Извлеки задачи из диалога» — давала 62% точности. Модель путала намерение с обещанием, придумывала несуществующие задачи, неверно определяла исполнителя. Каждая четвёртая найденная задача оказывалась ложной.

«Капец, отчёт надо сделать» — это задача или эмоции? «Надо бы обсудить» — «Ага, надо будет» — обязательство или вежливость? Мы разобрали десятки подобных ситуаций и вывели правило: задача — это обязательство конкретного человека выполнить действие со сроком (явным или подразумеваемым). Под каждый спорный случай написали автоматический тест.

Самая дорогая модель (GPT-4o) даёт лучшее качество, но обработка 100 диалогов обходится в $1.60. Для задачи извлечения данных это избыточно. Мы протестировали четыре модели и выбрали связку DeepSeek v3 + Qwen 2.5 — 90% качества за 3% стоимости. Дополнительно сжали формат сообщений и упростили проверки результатов, что сократило расходы ещё в 2.5 раза.

- Точность извлечения задач — 97% (было 62%).
- Ложные срабатывания — менее 5% (было 23%).
- 94+ автотеста на пограничные случаи ИИ-модели.
- Обработка 100 диалогов за $0.11 и 1.9 секунды на диалог.
- 100% локальная обработка персональных данных.
- Экономия 5-8 часов в неделю по отзывам первых пользователей.
технологий