项目简介
本项目作为大数据专业毕业生的毕业设计,把爬虫与情感分析功能整合进一个交互网站。采用Python实现爬虫和情感分析,借助Flask搭建网站,同时利用MySQL数据库实现用户的登录注册功能。
项目的主要特性和功能
- 自动化登录与数据爬取:运用selenium库达成微博账号自动化登录,自动获取Cookie信息,解决手动复制Cookie的麻烦,能爬取指定关键词的微博帖子及评论。
- 情感分析:对爬取的评论内容开展情感分析。
- 用户交互:提供用户注册和登录功能,登录后可在搜索栏输入关键词搜索微博,输入帖子序号能爬取该帖子的评论。
- 可视化展示:将爬取的评论内容和情感分析结果进行可视化呈现。
安装使用步骤
- 连接数据库:导入
connections.ncx
文件连接MySQL数据库。 - 检查浏览器驱动:若浏览器版本自动更新,selenium驱动可能与浏览器不匹配而报错,需重新下载对应驱动,覆盖浏览器安装目录(如
C:\Program Files\Google\Chrome\Application
)和Python安装目录。 - 启动项目:运行
app.py
文件启动Flask应用,打开浏览器访问相应地址,注册并登录账号,即可使用网站各项功能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】