- 1、文本分类/新闻分类(keras, 清华新闻数据集)
- 2、多标签分类(pytorch, 知乎看山杯数据集)
- 3、情感分析/细粒度情感分析(pytorch, 汽车用户评论数据集)
- 4、命名实体识别/中文命名实体识别(pytorch)
- 1、大规模中文自然语言处理语料:https://github.com/brightmart/nlp_chinese_corpus
- 2、知乎看山杯数据集(多标签分类):https://pan.baidu.com/s/1qUr6IQQn6DzrMlbaAUZslQ 提取码: qbiw
- 3、中文词向量:https://github.com/Embedding/Chinese-Word-Vectors
- 4、AIchallenger细粒度情感分析: https://github.com/nju161250102/AI_challenger/tree/master/data