项目简介
本项目利用深度学习技术,从医疗文本里提取关键信息,如实体、关系、属性等。项目涉及多个医疗领域的信息抽取任务,包括医疗实体识别、实体关系抽取、属性抽取等,同时提供多种深度学习模型在这些任务中的表现情况。
项目的主要特性和功能
- 实体抽取:可对多种主流深度学习模型在中文NER数据集上的表现进行评估,提供MSRA - NER、CCKS2019 - 医疗实体抽取、CCKS2020 - 医疗实体抽取等任务的模型性能对比。
- 实体关系联合抽取:给出2019和2020语言与智能技术竞赛中关系抽取任务的模型实现及性能评估。
- 属性抽取:支持瑞金医院糖尿病信息抽取数据集的属性抽取任务,能提取药物和疾病的属性。
- 事件抽取:支持CCKS2020医疗事件抽取任务,以及面向金融领域的篇章级事件主体和要素抽取任务。
- 低资源解决方案:提供信息抽取中的低资源解决方案,包含数据增强、迁移学习等技术。
安装使用步骤
环境配置
- 确保已安装Python 3.6+。
- 安装必要的Python库:
pip install -r requirements.txt
。
数据准备
- 下载所需的数据集,并将其放置在
data/
目录下。 - 根据任务需求,修改配置文件
config.yaml
中的数据路径和参数设置。
模型训练
- 运行
train.py
脚本进行模型训练:python train.py --config config.yaml
。 - 训练过程中,模型会自动保存最佳模型到
models/
目录。
模型评估
- 运行
evaluate.py
脚本进行模型评估:python evaluate.py --model_path models/best_model.pth --data_path data/test.json
。 - 评估结果将输出到控制台,并保存到
results/
目录。
任务执行
- 根据具体任务需求,运行相应的脚本,如实体抽取任务:
python scripts/entity_extraction.py
。 - 任务执行结果将输出到指定目录。
通过以上步骤,用户可快速上手并使用本项目进行医疗信息抽取任务的模型训练和评估。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】