数目检查与标准化工具,即 Number Checking & Standardization Tool (NCST),是一款由 Python 编写的用于辅助大量档案数目统计与命名批量标准化的简易小工具。
它可以根据给定格式和档案名单,协助您核对一个文件夹下的所有档案的命名是否符合规范,统计匹配的档案数目是否有误,并将不符合的规范的档案批量格式化以符合规范,即批量标准化。
- 如果没有安装 Python,请在此下载安装 Python,并将 Python 添加至
PATH
环境变量中 - 下载程序包并解压于工作文件夹中
- 在程序目录下找到名单配置文件
config.txt
并打开,按以下规则填写内容:- 第一行内容为
格式文本
(formatter),在此行填写标准格式,并以美元符号$
括住一个标识符来表示一个变量,标识符中不能有空格,如$name$
- 注意:格式文本的匹配规则包含文件扩展名,如果想要匹配任意扩展名,可以使用扩展名通配符
.*
- 注意:格式文本的匹配规则包含文件扩展名,如果想要匹配任意扩展名,可以使用扩展名通配符
- 第二行内容为
列表表头
(headers),在此处定义每一列数据的表头并用空格格式文本
中被引用 - 第三行及之后的内容为
数据列表
,用实际的数据填写好表格中的内容,每一列用空格 - 保存配置文件
- 第一行内容为
- 将要检查的档案全部拷贝到程序目录下的
work
文件夹中,最好先留一份备份 - 找到并运行程序目录下的
NCST.bat
批处理程序,并按程序提示完成后续操作- 程序中支持批量修正档案名和移动无法匹配的档案(默认移动至程序运行环境下的
backup
文件夹)
- 程序中支持批量修正档案名和移动无法匹配的档案(默认移动至程序运行环境下的
- 确认处理无误后拷贝
work
文件夹中所有档案到其他地方,完成
注意:本程序只能对档案名称进行简单识别校对和标准化,不能判断档案内容的情况。
config.txt
:
$num$ $name$ 实验报告1.*
num name
2023001 张三
2023002 李四
2023003 小明
2023004 小红
2023005 王五
2023006 小强
work
文件夹:
2023001 小强 实验报告1.zip
2023002李四实验报告1.doc
2023003+小明+实验报告1.docx
2023004 小红 实验报告1.doc
2023005 王五 实验报告一.docx
impurities.txt
张三 2023001 实验报告1.rar
运行NCST.bat
整理后:
标准化档案:
2023001 张三 实验报告1.rar
2023002 李四 实验报告1.doc
2023003 小明 实验报告1.docx
2023004 小红 实验报告1.doc
2023005 王五 实验报告1.docx
移动不匹配的档案:
2023001 小强 实验报告1.zip
impurities.txt
本案例涉及的文件在
test
文件夹中可以找到。
进入NCST.py
所在目录后按以下命令参数运行程序:
python3 NCST.py <配置文件> <工作路径>
执行以下命令以查询程序版本:
python3 NCST.py -v
python3 NCST.py config.txt work
python3 NCST.py E:\workspace\my_config.txt E:\workspace\my_work