项目简介
本项目基于PaddlePaddle框架打造了一个情感分析系统,具备细粒度的情感分析能力。系统由评论观点抽取和属性级情感分类两部分构成,可自动从给定文本中抽取潜在评论属性及对应观点,并识别各属性的情感极性。
项目的主要特性和功能
- 评论观点抽取:借助深度学习模型,自动抽取文本中的评论属性和对应评论观点。
- 属性级情感分类:利用预训练模型对抽取的评论观点进行情感极性分类,支持正向、负向和中性三种情感标签。
- 模型优化:提供基于PPMiniLM的小模型解决方案,在保证较高性能的同时,大幅提升模型推理速度,便于线上部署。
- 高性能预测部署:提供基于Paddle Inference的高性能预测脚本,满足高性能情感分析需求。
安装使用步骤
环境准备
- 安装Python 3.6及以上版本。
- 安装PaddlePaddle 2.2.2及以上版本。
- 安装PaddleNLP 2.2.2及以上版本。
数据准备
- 下载项目提供的评论观点抽取和属性级情感分类的Demo数据,或准备自己的标注数据。
- 将数据文件放入
./data/ext_data
和./data/cls_data
目录下。
模型训练
若需使用自定义的评论观点抽取模型或属性级情感分类模型,可参考extraction
和classification
目录下的train.py
脚本进行训练。
模型导出
训练完成后,通过export_model.py
脚本将动态图模型转换为静态图模型,方便线上部署。
模型评估
使用evaluate.py
脚本评估模型性能。
预测使用
- 快速体验:使用
demo.py
脚本进行交互式体验。 - 批量预测:使用
predict.py
脚本进行批量文本情感分析预测。 - 高性能预测:使用
deploy/predict.py
脚本进行高性能预测。
使用前请确保模型文件、标签字典等资源的路径和配置正确。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】