项目简介
本项目利用机器学习技术处理二手车交易数据,通过多种数据处理方法和模型对二手车交易价格进行预测。将神经网络模型与树模型的预测结果融合,提高了价格预测的准确性。
项目的主要特性和功能
数据处理
- 用众数填充空值和异常值,解决预测值长尾分布问题。
- 提取日期、城市等信息,进行特征结合、融合与筛选。
- 对类别特征进行 count 编码、mean - encoding 编码、target - encoding 编码等,对连续特征进行分桶、归一化等操作。
模型构建
- 采用简单的 MLP 全连接层的 NN 模型,依据 epoch 进行学习率衰减。
- 运用 lgb 模型和 cat 模型两种树模型进行预测。
模型融合
把树模型的预测结果 stack 起来,再与 NN 模型的结果 mix 起来。
安装使用步骤
- 确保已下载本项目的源码文件。
- 安装所需的 Python 库,如 pandas、numpy、sklearn、lightgbm、catboost 等。
- 将二手车交易数据上传至 data 文件夹。
- 运行数据处理脚本进行数据预处理,生成的中间结果会存放在 user_data 文件夹。
- 运行模型训练脚本,训练 NN 模型和树模型。
- 运行模型融合脚本,得到最终的价格预测结果。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】