项目简介
本项目借助深度学习技术,依托PyTorch框架构建了一个视频跌倒检测系统。运用LRCN(Long-term Recurrent Convolutional Networks)模型,结合CNN和LSTM网络,可有效识别视频中的跌倒行为。项目采用Le2i Fall Detection Dataset数据集进行训练和验证,提供了从数据预处理到模型训练、验证及推理的完整流程。
项目的主要特性和功能
- LRCN模型:融合CNN和LSTM,可处理视频帧序列,识别跌倒行为。
- 数据预处理:把视频数据切分为连续帧序列,方便模型处理。
- 模型训练:支持自定义训练参数,例如滑动窗口大小、模型保存路径等。
- 模型验证与推理:具备模型验证功能,支持对单个视频进行跌倒检测。
- 高效推理:在GPU和CPU上均可实现高效推理速度(fps=20)。
安装使用步骤
环境准备
- 确保已安装Python 3.x。
- 安装PyTorch框架及其他依赖库:
bash pip install torch torchvision opencv-python
数据预处理
- 将Le2i Fall Detection Dataset数据集放置在
root_dir
目录下,目录结构如下:root_dir |_ Coffee_room_02 | |_ [Videos] | | |_ video (49).avi | | |_ video (50).avi | | |_ ... | |_ [Annotation_files] | |_ video (49).txt | |_ video (50).txt | |_ ...
- 运行数据预处理脚本:
bash python script/train.py --root_dir /path/to/root_dir --out_dir /path/to/output_dir --save_dir /path/to/save_dir --clip_len 4
模型训练
使用预处理后的数据进行模型训练:
bash
python script/train.py --root_dir /path/to/root_dir --out_dir /path/to/output_dir --save_dir /path/to/save_dir --clip_len 4
模型验证与推理
使用训练好的模型进行验证或推理:
bash
python script/inference.py --checkpoint /path/to/save_dir/Le2i_epoch-45.pth.tar --input /path/to/input.mp4
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】