项目简介
本项目聚焦于商户类别推荐问题,以官方提供的信用卡交易等数据为基础,运用机器学习算法,旨在App内为用户更精准地推荐当地吃穿住行的商家服务,实现个性化的商户类别推荐。
项目的主要特性和功能
- 数据处理:处理大量交易数据,包含数据分布探索、预处理、清洗等操作,如填补缺失值、转换离散型字段类型、新增差分列等。
- 特征工程:基于交易数据集创建通用组合特征和业务统计特征,进一步精细化挖掘特征,如手动特征衍生、挖掘时序特征、二阶交叉特征衍生等。
- 模型训练:使用随机森林、LightGBM、XGBoost、CatBoost等模型进行训练,通过相关系数、特征重要性筛选特征。
- 参数优化:采用网格搜索、贝叶斯优化等方法对模型超参数进行优化。
- 模型融合:运用投票集成(Voting)和堆叠集成(Stacking)策略,融合多个模型的预测结果。
安装使用步骤
1. 创建虚拟环境
bash
conda create -n lightgbm python=3.8
conda activate lightgbm
2. 安装项目所需第三方包
bash
pip install -r requirements.txt
3. 运行代码
按顺序分别运行各个py文件,如data_exploration(1.0).py
、data_exploration(1.1).py
等,进行数据探索、预处理、特征工程、模型训练和融合等操作。
4. 结果查看与提交
查看训练和预测结果,将符合比赛要求的预测结果提交至指定平台(比赛链接:https://www.kaggle.com/competitions/elo-merchant-category-recommendation )。
注:代码运行耗时较长,建议在计算资源充足的服务器上运行。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】