Голосовой ассистент на русском языке с использованием OpenAI GPT-4o-realtime-preview через Realtime API.
- 🎙️ Голосовое общение в реальном времени через WebRTC
- 🔊 Синтез речи в реальном времени
- ⚡ Минимальная задержка благодаря Realtime API
🅰️ Современный шрифт Overpass из Google Fonts для всего интерфейса
В проекте используется шрифт Overpass из Google Fonts, подключённый через next/font/google и интегрированный с Tailwind CSS:
- Импортируется в
app/layout.tsx
:import { Overpass } from "next/font/google"; const overpass = Overpass({ subsets: ["latin"], variable: "--font-overpass", display: "swap", });
- В Tailwind (
tailwind.config.ts
):fontFamily: { 'sans': ['var(--font-overpass)', ...defaultTheme.fontFamily.sans], // ... },
- Весь интерфейс использует класс
font-sans
.
- Клонируйте репозиторий:
git clone https://github.com/yourusername/speech-to-speech-assistant.git
cd speech-to-speech-assistant
- Установите зависимости:
npm install
# или
yarn install
# или
pnpm install
- Создайте файл
.env.local
в корне проекта и добавьте свой API ключ OpenAI:
OPENAI_API_KEY=ваш_ключ_api_openai
Запустите приложение в режиме разработки:
npm run dev
# или
yarn dev
# или
pnpm dev
Откройте http://localhost:3000 в вашем браузере.
- Нажмите кнопку "Начать разговор"
- Дождитесь подключения к Realtime API
- Нажмите на кнопку микрофона, чтобы начать говорить
- Ассистент ответит вам голосом в реальном времени
- Next.js 14
- React
- OpenAI Realtime API (GPT-4o-realtime-preview)
- WebRTC
- Tailwind CSS
- Framer Motion
- Google Fonts (Overpass)
Realtime API - это новый API от OpenAI, который позволяет создавать приложения с минимальной задержкой для голосового общения в реальном времени. Он использует WebRTC для передачи аудио напрямую между клиентом и моделью, что обеспечивает более естественное общение.
MIT