项目简介
本项目借助深度学习和神经网络技术,实现对猫狗图像的分类。通过搭建并训练卷积神经网络(CNN)和ResNet模型,达成猫狗图像的自动分类,同时还探索了Swin Transformer在图像分类任务中的应用。项目涵盖模型训练、验证、测试以及结果展示等环节。
项目的主要特性和功能
- 模型搭建:运用PyTorch框架构建CNN和ResNet模型,开展图像分类任务。
- 数据处理:提供
get_data.py
脚本,构建自定义数据类并加载到Dataloader中。 - 模型训练:包含CNN和ResNet模型的训练脚本,支持自定义网络结构和参数调整。
- 结果展示:提供
show.py
脚本,通过图形界面选择图像并显示模型预测结果。 - Transformer应用:尝试使用Swin Transformer进行图像分类,展现其在该任务中的效果。
安装使用步骤
环境准备
- 确保已安装Python 3.x。
- 安装必要的Python库:
pip install torch torchvision matplotlib
。
数据准备
将猫狗图像数据放置在指定的数据文件夹内,按项目要求的格式组织数据。
模型训练
- 运行
python cnn.py
进行CNN模型的训练。 - 运行
python resnet.py
进行ResNet模型的训练。
模型测试
使用show.py
脚本选择图像并查看模型的预测结果。
结果查看
使用TensorBoard查看训练过程中的损失和准确率曲线。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】