Skip to content

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。

License

Notifications You must be signed in to change notification settings

yeahhe365/gemini-nexus

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Gemini Nexus Logo

Gemini Nexus

🚀 赋予浏览器原生 AI 灵魂:深度集成 Google Gemini 的全能助手

Gemini Chrome Extension Vite

TypeScript JavaScript License


🌟 项目简介

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。


⚙️ 多驱动核心对比 (services/providers)

项目内置了三种驱动方案,通过代码逻辑动态适配不同的使用场景:

驱动方案 逻辑入口 支持模型 核心优势 使用前提
Web Client web.js Gemini 3 系列 完全免费,支持联网插件 需保持 Google 账号登录
Official API official.js Pro/Flash 预览版 极速响应,原生支持 Thinking 模式 需 Google AI Studio Key
OpenAI Compatible openai_compatible.js GPT/Claude 等 高扩展性,支持中转接口 需第三方服务密钥

🤖 浏览器控制 (MCP) 能力集

基于 background/control/ 模块实现,AI 可以执行复杂的 Agent 任务:

分类 核心指令 代码实现逻辑
导航控制 navigate_page, new_page 调用 chrome.tabs 进行页面生命周期管理
页面交互 click, fill, drag 基于 Accessibility Tree 生成 UID 进行精准操控
数据观测 take_snapshot, get_logs 实时提取 DOM 结构、控制台日志及网络请求
脚本执行 evaluate_script 在网页 Context 中运行自定义 JavaScript

以下是为您翻译的中文内容:

外部 MCP 工具(远程服务器)

Gemini Nexus 可以选择连接到外部 MCP 服务器(通过 SSE可流式传输的 HTTPWebSocket),并在现有的工具循环(Tool Loop)中执行其工具。

推荐方案:使用本地代理(支持 stdio 服务器)

由于 Chrome 扩展程序无法直接运行基于 stdio 的 MCP 服务器,推荐的设置方案是运行一个本地代理(例如 MCP SuperAssistant Proxy)。在代理中配置您的 MCP 服务器(包括 stdio 服务器),然后将 Gemini Nexus 连接到该代理端点。

常见的代理端点如下:

  • SSE: http://127.0.0.1:3006/sse
  • 可流式传输的 HTTP: http://127.0.0.1:3006/mcp
  • WebSocket: ws://127.0.0.1:3006/mcp

设置步骤

  1. 启动您的 MCP 代理并在其中配置好 MCP 服务器。

  2. 设置 (Settings) → 连接 (Connection) → 外部 MCP 工具 (External MCP Tools) 中:

    • 启用“外部 MCP 工具” (Enable External MCP Tools)。
    • 选择一个活动服务器 (Active Server)(您可以保存多个服务器条目并根据需要切换)。
    • 选择传输协议并设置服务器 URL(SSE / 可流式传输的 HTTP / WebSocket)。
    • 点击测试连接 (Test Connection) 和刷新工具 (Refresh Tools)。
  3. 可选(当工具较多时推荐):将公开工具 (Expose Tools) 设置为仅限选定工具 (Selected tools only),然后仅启用您希望模型查看/使用的工具。

  4. 开始正常对话;当模型需要使用工具时,它会输出一个如下所示的 JSON 工具块:

    { "tool": "工具名称", "args": { "键": "" } }

✨ 核心功能亮点

  • 💬 智能侧边栏:基于 sidePanel API,提供毫秒级唤起的对话空间,支持全文搜索历史记录。
  • 🪄 划词工具栏:注入 Content Script,选中文字即刻进行翻译、总结、重写,支持一键回填表单。
  • 🖼️ 图像 AI 处理
    • OCR & 截图翻译:集成 Canvas 裁剪技术,框选图片区域即刻提取文字并翻译。
    • 浮窗探测:自动识别网页图片并生成悬浮 AI 分析按钮。
    • 水印消除:内置 watermark_remover.js 算法,显著提升生成图像的可视化质量。
  • 🛡️ 安全渲染:所有 Markdown、LaTeX 公式及代码块均在 sandbox 隔离环境中渲染,确保主页面安全。

❤️ 赞助与支持

如果您觉得 Gemini Nexus 提升了您的工作效率,欢迎请开发者喝杯咖啡,支持项目的持续维护!☕

赞赏通道(爱发电): https://afdian.com/a/gemini-nexus

afdian-yeahhe

扫描上方二维码或 点击此处 前往爱发电支持我


🚀 快速开始

安装步骤

  1. Releases 下载最新 ZIP 包并解压。
  2. Chrome 访问 chrome://extensions/,右上角开启 “开发者模式”
  3. 点击 “加载已解压的扩展程序”,选择解压后的文件夹即可。

技术栈

  • 构建工具:Vite + TypeScript
  • 架构协议:Chrome MV3 + Browser Control Protocol
  • 核心库:Marked.js, KaTeX, Highlight.js

📄 许可证

本项目基于 MIT License 开源。

About

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages