项目简介
本项目是基于PyTorch框架搭建的情感分析系统,主要用于处理ISEAR数据集。项目实现了卷积神经网络(CNN)、长短时记忆网络(LSTM)和多层感知器(MLP)等多种深度学习模型,可对文本数据进行情感分类。
项目的主要特性和功能
- 多模型支持:
- CNN模型:采用Kim(2014)的卷积神经网络架构,支持多窗口卷积核。
- LSTM模型:包含嵌入层、双向LSTM层和全连接层,支持多层LSTM。
- MLP模型:作为基线模型,是包含两个隐藏层的全连接网络。
- 数据预处理:对文本数据进行预处理,包括停用词处理、词汇表构建和数据分批,同时使用GloVe预训练词嵌入向量。
- 模型训练与评估:支持自定义训练参数,如学习率、批处理大小、权重衰减等;训练过程中提供损失和准确率曲线图;在测试集上评估模型性能,计算准确率和F值。
安装使用步骤
1. 环境配置
确保已安装Python 3.x,执行以下命令安装项目所需的依赖包:
bash
pip install -r requirements.txt
2. 数据准备
将ISEAR数据集放置在./data
目录下,确保包含训练集、验证集和测试集的CSV文件。
3. 数据预处理
运行预处理脚本对数据进行预处理:
bash
python preprocess.py
4. 模型训练
使用以下命令启动训练,默认使用CNN模型:
bash
python train.py
也可通过命令行参数指定其他模型和训练参数,例如:
bash
python train.py --model lstm --epoch 100 --batch_size 32
5. 模型测试
训练完成后,使用以下命令对模型进行测试:
bash
python test.py --model lstm
此命令将加载训练好的模型权重,并在测试集上评估模型性能。
6. 结果分析
训练和测试过程中会在项目根目录下生成损失和准确率的曲线图,便于分析模型的训练效果。通过以上步骤,即可成功运行并评估本情感分析系统。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】