Chinese-Text-Classifier

基于SVM中文文本分类

复旦大学中文语料库，使用15类

语料文件太大，可以在这里下载http://www.nlpir.org/wordpress/

训练时间太长，所以保存了一份模型（总共训练了3个模型，线性核的分类效果最好）

最后使用的接口还没做好，大致就是那个意思了，没时间改了

分两个部分，训练和测试的一步步运行：get_tokens --> to_bunch --> TFIDF_space --> SVM_Predict

也可以直接使用训练好的模型，直接运行use.py，建文件夹F:/Chinese_text_classifier/article/，最后在article文件夹里放要分类的文章(.txt或者.dat之类的)

Name	Name	Last commit message	Last commit date
Latest commit lyric777 Delete 相关管理计划书.md May 24, 2019 8aa4051 · May 24, 2019 History 8 Commits
article	article	Add files via upload	Apr 27, 2019
README.md	README.md	Update README.md	Apr 27, 2019
SVM_Predict.py	SVM_Predict.py	Add files via upload	Apr 27, 2019
TFIDF_space.py	TFIDF_space.py	Add files via upload	Apr 27, 2019
distribution.py	distribution.py	Add files via upload	Apr 27, 2019
get_tokens.py	get_tokens.py	Add files via upload	Apr 27, 2019
to_bunch.py	to_bunch.py	Add files via upload	Apr 27, 2019
use.py	use.py	Rename front_end.py to use.py	Apr 27, 2019

Provide feedback