项目简介
本项目聚焦于运用混合模型开展单分类问题中的异常检测工作。混合模型融合了神经网络、SVM、Parzen窗法等不同算法,致力于检测数据集中的异常样本,并以直观方式展示和分析结果。
项目的主要特性和功能
- 多种异常检测方法:采用基于Parzen窗法的概率密度函数模型、支持向量机(SVM)模型和基于高斯混合模型(GMM)等算法构建训练模型,用于估计数据分布和识别异常样本。
- 数据预处理与特征提取:提供数据清洗、标准化和特征选择等预处理功能,提高模型性能并降低计算复杂度。
- 异常检测性能评估:通过计算准确率、精确率和召回率等指标评估不同算法的异常检测性能,便于比较算法效果和选择最佳模型。
- 结果可视化:以柱状图、散点图等形式展示不同算法的结果,帮助直观理解数据分布和异常样本情况,方便结果分析与解释。
安装使用步骤
安装依赖库
- 使用Anaconda/Miniconda创建虚拟环境:
bash conda create -n oc python=3.9 conda activate oc
- 安装项目依赖:
bash pip install -r requirements.txt
准备数据
将数据集准备好并按指定格式存放,数据集需包含训练数据和测试数据,存储为CSV格式,每行对应一个样本点,包含所需特征信息,且不包含标签信息(单分类问题)。
运行代码
运行项目中的代码文件,例如:
bash
python mixture.py
python norm.py
python svm.py
python parzen.py
代码会自动加载数据、预处理数据、训练模型并进行异常检测,可调整参数优化模型性能和定制配置。
查看结果
代码运行完成后,会生成结果文件和可视化图像。可查看结果文件了解不同算法的检测结果和性能指标,通过可视化图像直观理解数据分布情况并进行结果分析。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】