Vision Bridge は、Google Cloud AI Hackathon 2024 で開発されたプロジェクトで、最新の AI 技術を活用して視覚障がい者の日常生活をサポートする革新的なアシスタントアプリケーションです。
- リアルタイム環境認識: AI による周囲の状況分析と音声フィードバック
- ナビゲーション支援: 音声ガイドによる目的地までの最適ルート案内
- オブジェクト・テキスト認識: 物体や文字の詳細情報を音声で提供
- 音声コマンド操作: 直感的な音声指示によるアプリ制御
- フロントエンド: Next.js, React, TypeScript
- バックエンド: Node.js, Express
- AI/ML: Google Cloud Vertex API (Gemini), Speech-to-Text, Text-to-Speech
- 自然言語処理: DialogFlow CX (Generator 使用)
- 地図サービス: Google Maps API
- インフラ: Google Cloud Platform (Cloud Run, Cloud Functions)
- CI/CD: Google Cloud Build
-
リポジトリをクローン:
git clone https://github.com/yuting0624/VisionBridge.git
-
プロジェクトディレクトリに移動:
cd VisionBridge
-
依存関係をインストール:
npm install
-
環境変数を設定:
cp .env.template .env
-
ローカルでの実行:
npm run dev
- アプリを起動し、音声コマンド「ヘルプ」で使用方法を確認できます。
- カメラを起動し、周囲の環境分析を開始します。
- 音声コマンドで目的地を設定し、ナビゲーションを開始します。
プロジェクトへの貢献を歓迎します! 新機能の提案、バグ報告、ドキュメントの改善など、どんな形での貢献も大歓迎です。
このプロジェクトは MIT ライセンスの下で公開されています。詳細はLICENSEファイルをご覧ください。
Vision Bridge は Google Cloud AI ハッカソンへの提出作品です。
このプロジェクトは、AI 技術を通じてより包括的な社会の実現を目指しています。