Skip to content

heihuo000/xunlan

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PVF Format Classifier

🚀 基于MiniMind的PVF文件格式规范性分类器

一个专门用于检测DNF游戏PVF文件格式是否符合规范的深度学习模型,基于轻量化的MiniMind语言模型构建。

License: MIT Python 3.8+ PyTorch

✨ 特性

  • 🎯 高准确率: 验证集准确率达到88.12%
  • 💾 轻量化: 仅256维隐藏层,适合2G显存环境
  • 快速推理: 毫秒级格式检测
  • 🔧 易于使用: 支持单文件、批量、交互三种检测模式
  • 📊 详细反馈: 提供置信度、概率分布和修改建议

🎯 应用场景

  • DNF私服开发中的PVF文件格式验证
  • 游戏MOD制作时的格式规范检查
  • 批量PVF文件质量检测
  • 自动化PVF文件格式修复

🚀 快速开始

环境要求

Python 3.8+
PyTorch 2.0+
transformers

安装

git clone https://github.com/yourusername/pvf-format-classifier.git
cd pvf-format-classifier
pip install -r requirements.txt

使用方法

1. 检查单个文件

python pvf_format_checker.py --file path/to/your/file.equ

2. 批量检查目录

python pvf_format_checker.py --dir path/to/your/directory

3. 交互模式

python pvf_format_checker.py --interactive

示例输出

📄 文件: test_sword_001.equ
📊 状态: 规范
🎯 置信度: 0.7987
📈 概率分布: 不规范=0.2013, 规范=0.7987
✅ 格式规范

📋 格式规范

规范格式特征

  • 字符串值使用反引号包裹:
  • 正确的缩进格式
  • 标准的PVF语法结构

不规范格式特征

  • 缺少反引号包裹
  • 错误的缩进或多余制表符
  • 语法结构不完整

🏗️ 项目结构

pvf-format-classifier/
├── model/                    # 模型相关文件
│   ├── model_minimind.py    # 模型定义
│   ├── tokenizer.json       # 分词器
│   └── tokenizer_config.json
├── dataset/                  # 数据集处理
│   └── pvf_cls_dataset.py   # 数据集类
├── examples/                 # 示例文件
│   ├── valid_pvf_samples/   # 规范格式示例
│   └── invalid_pvf_samples/ # 不规范格式示例
├── weights/                  # 预训练权重
│   └── pvf_cls_256.pth      # 模型权重文件
├── pvf_format_checker.py    # 主要检测脚本
├── test_classifier.py       # 测试脚本
├── requirements.txt         # 依赖包
└── README.md               # 项目文档

🔧 技术细节

模型架构

  • 基础模型: MiniMind生成式语言模型
  • 分类头: 线性层 + Softmax
  • 参数量: ~2M (轻量化设计)
  • 输入长度: 256 tokens

训练数据

  • 总样本数: 17,370个PVF文件
  • 数据平衡: 正负样本比例1:1
  • 文件类型: .equ、.stk、.skl等

性能指标

  • 验证准确率: 88.12%
  • 训练时间: ~21分钟 (2G显存)
  • 推理速度: <100ms/文件

📊 使用示例

Python API

from pvf_format_checker import PVFFormatChecker

# 初始化检查器
checker = PVFFormatChecker()

# 检查文件
result = checker.check_file("path/to/file.equ")
print(f"格式状态: {result['status']}")
print(f"置信度: {result['confidence']:.4f}")

# 检查文本内容
content = """
[equipment]
    name = `测试剑`
    level = 1
"""
result = checker.check_content(content)

🤝 贡献

欢迎贡献代码!请查看 CONTRIBUTING.md 了解详细信息。

开发设置

git clone https://github.com/yourusername/pvf-format-classifier.git
cd pvf-format-classifier
pip install -r requirements-dev.txt

运行测试

python -m pytest tests/

📄 许可证

本项目采用 MIT 许可证 - 查看 LICENSE 文件了解详情。

🙏 致谢

  • MiniMind - 基础语言模型
  • DNF社区 - 提供PVF格式规范和测试数据

📞 联系方式

如有问题或建议,请提交 Issue


⭐ 如果这个项目对您有帮助,请给个Star支持一下!

About

训练为模型

Resources

License

Contributing

Stars

Watchers

Forks

Packages

No packages published

Languages