【源码】基于Scrapy框架的Python招聘信息爬取与分析系统

项目简介

本项目是基于Scrapy框架的Python爬虫系统，从BOSS直聘网站爬取Python相关职位招聘信息，对数据进行清洗、存储和分析，最终生成可视化图表和词云，帮助用户了解招聘市场趋势和需求。

环境准备：
- 确保安装Python 3.x。
- 安装Scrapy框架：pip install scrapy。
- 安装项目依赖：pip install -r requirements.txt。
配置数据库：
- 按需配置MongoDB数据库连接信息，修改mongo_connect.py中的连接参数。
运行爬虫：
- 在项目根目录下运行命令启动爬虫： bash scrapy crawl zhipin -o jobs_python.json
数据分析与可视化：
- 用Jupyter Notebook打开boss招聘.ipynb文件，运行代码生成分析图表。
- 运行wordcloud模块中的代码生成词云。
查看结果：
- 生成的图表和词云会保存在指定目录，可直接查看或导出。

点击下载 【提取码: 4003】【解压密码: www.makuang.net】