NESEG Module Tutorial;
功能:
- 单个名称处理和批量处理;
- 基于两个Excel文件生成neseg需要的词典;
- 待处理文件的预处理;
conda create -n ner python=3
conda activate ner
pip install neseg
neseg -n 中国北京海淀区飞图时代电力科技有限公司 -d workspace\output-dict
neseg -n 中国北京海淀区飞图时代电力科技有限公司 \
-d dict \
-dn dict-country.csv \
-dp dict-province.csv \
-ds dict-city.csv \
-dx dict-county.csv \
-db dict-suffix.csv
pip install -r requirements
jupyter notebook
构建镜像:
// 基于python:3安装notebook构建huhongjun/neseg-turial:notebook
docker build
-f Dockerfile-notebook
-t huhongjun/neseg-turial:notebook .
// 基于python3-notebook-pandas安装neseg构建huhongjun/neseg-tutorial
docker build \
-f Dockerfile \
-t huhongjun/neseg-tutorial .
使用镜像:
docker run -it --rm \
--name py3-neseg-01 \
-p 8888:8888 \
huhongjun/neseg-tutorial \
COMMAND: jupyter notebook --ip 0.0.0.0 --notebook-dir . --allow-root
1. 修改input-dict目录下的字典;
2. 生成字典;
3. 处理数据;
\dict 字典目录,6个文件,可以在notebook中生成
\ipynb
01-QuickStart
02-QuickStart(Batch)
03-词典自动生成
04-供应商对应关系数据处理
05-供应商数据预处理
\workspace
\iput-data
\input-dict
\output-data
\output-dict
main.py