AI Assistant десктопное приложение для помощи в деловых переговоровах через средства связи по типу Zoom, Skype, Teams и пр, разработанное на Python с использованием PyQt6. Приложение автоматически распознаёт вопросы в речи и предоставляет краткие, точные ответы с помощью локальной LLM модели.
- Автоматическое распознавание вопросов: приложение анализирует речь в реальном времени и определяет, задаётся ли вопрос.
- Три режима работы:
- Ручной ввод
- Только прослушивание (транскрипция)
- Автоответы на вопросы
- Поддержка нескольких языков: автоматическое определение языка (русский, английский и др.)
- Локальная обработка: все данные обрабатываются на устройстве, без отправки в облако
- Гибкие настройки: аудио, модель, интерфейс, горячие клавиши
- История диалогов: автоматическое сохранение и экспорт сессий
- Мониторинг производительности: отслеживание скорости генерации, использования памяти и других метрик
Приложение построено по модульному принципу с чётким разделением:
core/ - Ядро приложения (аудио, LLM, STT)
├── audio_capture.py - Захват аудио (микрофон/системный звук)
├── llm_engine.py - Движок LLM (на основе llama.cpp)
├── transcriber.py - Speech-to-Text (на основе Whisper)
├── vad_detector.py - Детектор речи (VAD)
└── config.py - Конфигурация
threads/ - Потоки выполнения
├── audio_thread.py - Поток аудио захвата
├── llm_thread.py - Поток генерации ответов
├── stt_thread.py - Поток транскрибации
ui/ - Пользовательский интерфейс
├── main_window.py - Главное окно
├── settings_dialog.py - Диалог настроек
├── model_downloader.py - Загрузчик моделей
└── ... - Другие компоненты UI
utils/ - Вспомогательные утилиты
├── history_manager.py - Управление историей
├── statistics_manager.py - Сбор статистики
├── question_detector.py - Детектор вопросов
└── ... - Другие утилиты
models/ - Модели (не включены в репозиторий)
resources/ - Ресурсы (иконки, стили)
- Python 3.12+
- PyQt6 графический интерфейс
- Whisper распознавание речи
- llama.cpp выполнение LLM моделей
- Qwen2.5-3B-Instruct модель ИИ (3B параметров, GGUF квантованная)
- webrtcvad детектор активности голоса
- qdarktheme тёмная тема (опционально)
- Windows 10/11 (основная платформа)
- Python 3.12 или выше
- RAM: минимум 4 ГБ (рекомендуется 8+ ГБ)
- Свободное место: ~2.5 ГБ для модели
- Можно установить в режиме разработчика (клонировав репо)
- Доступна также сборка для Windows (установщик .exe).
- Клонируйте репозиторий:
git clone https://github.com/yourusername/ai-assistant.git
cd ai-assistant- Установите зависимости:
pip install -r requirements.txt- Загрузите модель:
- Запустите приложение
- Перейдите в Настройки → Модель → Скачать модель
- Или вручную скачайте
qwen2.5-3b-instruct-q4_k_m.ggufв папку%LOCALAPPDATA%\AI Assistant\models\
- Запустите приложение:
python main.py- Настройте параметры:
- Выберите режим работы
- Настройте аудиоустройство
- Укажите путь к модели (если не скачана автоматически)
- Начните работу:
- В режиме "Авто" приложение будет автоматически отвечать на вопросы
- В режиме "Прослушивание" только транскрибировать речь
- В режиме "Ручной" вводить вопросы вручную
- Скачайте AIAssistant_Setup.exe (архив .zip в разделе release) из раздела релизов
- Запустите установщик и следуйте инструкциям
- Запустите AI Assistant
- Дождитесь автоматической загрузки моделей (~2-3 ГБ, однократно)
- Начните пользоваться. Если что-то не так, сообщите мне.
Приложение поддерживает гибкую настройку через интерфейс:
- Общие: режим, горячие клавиши, автозапуск
- Модель: путь к файлу, параметры генерации
- Генерация: температура, длина ответа, стоп-секвенсы
- Интерфейс: тема, прозрачность, размер окна
- Аудио: устройство, уровень чувствительности, VAD
- Трей: поведение в системном трее
Ctrl+Spaceпереключение режима прослушиванияCtrl+Enterотправить вопрос (в ручном режиме)Ctrl+Shift+Qбыстрый ввод вопросаCtrl+Shift+Sпоказать статистикуCtrl+Shift+Hпросмотр истории
python main.py- Поместите GGUF файл в папку моделей
- Обновите
HF_REPO_ID,HF_FILENAMEвcore/config.py - При необходимости измените
n_gpu_layersдля использования GPU
Симптомы:
OSError: [WinError 1114] Произошел сбой в программе инициализации библиотеки динамической компоновки (DLL).Error loading "...\torch\lib\c10.dll" or one of its dependencies.
Решение:
- Убедитесь, что установлены Visual C++ Redistributables:
- Если используете сборку через PyInstaller, проверьте
build.spec:# Добавьте в hiddenimports: hiddenimports=['torch', 'torch._C']
- Альтернативное решение используйте версию приложения для запуска из исходников:
python main.py
- Проверьте права доступа к микрофону в настройках Windows:
Параметры → Конфиденциальность → Микрофон
- Убедитесь, что доступно минимум 8 ГБ свободной оперативной памяти.
Проверьте наличие:
- Свободного места на диске (рекомендуется не менее 3 ГБ)
- Стабильного интернет-соединения
Если приложение продолжает висеть в диспетчере задач после закрытия:
- Откройте Диспетчер задач (
Ctrl+Shift+Esc) - Найдите процесс AIAssistant.exe или Python.exe
- Нажмите "Снять задачу"
- Улучшение работы модуля Whisper для более быстрой транскрипции
- Оптимизация захвата и обработки аудио
- Снижение использования оперативной памяти
- Поддержка дополнительных языков
- Интеграция с календарями и системами видеоконференций
- Экспорт истории в различные форматы
- Поддержка более крупных и точных моделей
- Возможность использования GPU для ускорения генерации
- Тонкая настройка моделей под специфические задачи
- Поддержка Linux и macOS
MIT License

