【源码】基于PyTorch的中文命名实体识别系统

项目简介

本项目是基于PyTorch实现的中文命名实体识别（NER）系统，支持Bert、RoBerta、ernie、albert等模型，具备开箱即用的特点。使用包含8大类别的中文数据集CNER，并将原始数据转换为csv格式，方便统计和处理。

确保已安装Python和必要的依赖库，如PyTorch、Flask等。

若使用默认数据集，无需额外操作。
若要使用自己的数据集：
在data目录下建立和med_data一样的文件夹，包含train.csv、test.csv、dev.csv、label2id.json。
在config.py中修改dir_name。

运行以下命令进行模型训练： sh python train.py 训练完成后，会在data/med_data目录下生成正确率和loss曲线。

运行以下命令，在终端输入文本进行预测： sh python infer.py 需注意，infer.py中的参数需要重新配置，且该文件不依赖其他文件。

运行以下命令对test.csv文件进行整体测试： sh python test.py 测试结果会保存为data/med_data/test_data_predict.csv。

运行以下命令启动Flask API： sh python api.py 打开127.0.0.1:5000即可查看。

点击下载 【提取码: 4003】【解压密码: www.makuang.net】