DeepWiki 使用 Next.js 构建,站点的 RSC 响应中已经包含了完整的 Markdown 内容。
项目通过拦截 RSC 请求的方式直接获取站点 md 文本。
RSC 拦截
- 拦截 RSC 请求
- 提取 Markdown 内容
爬虫爬取(对比)
- 访问网页
- 下载 HTML
- 解析 DOM
- HTML 转换为 Markdown
- 路由
- ...
# 安装 Python 依赖
uv sync
# 安装 Playwright 浏览器
python -m playwright install chromiumpython -m src.interface.cli wiki \
"https://deepwiki.com/username/repository" \
-o "/path/to/output"| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
-o |
string | ✅ | 输出目录路径 |
- Fork 本仓库
- 创建功能分支 (
git checkout -b feature/amazing-feature) - 提交更改 (
git commit -m 'Add some amazing feature') - 推送到分支 (
git push origin feature/amazing-feature) - 开启 Pull Request