このリポジトリは、総務省が発表している「統計表における機械判読可能なデータの表記方法の統一ルールの策定」に基づき、ファイルがそのルールに則しているかを判定するロジックを記述しています。
ドキュメントはこちら です。
issue, pull request お待ちしています。
pip install git+https://github.com/volare-all/open-data-linter.git
from opendatalinter import OpenDataLinter
file_path = "/path/to/your/file"
with open(file_path, "rb") as f:
data = f.read()
linter = OpenDataLinter(data, file_path)
res = linter.check_1_1() # return LintResult, see vo.py
print(res.is_valid)
print(res.invalid_contents)