项目简介
本项目开发了 stockdataset 以摆脱对 tushare 的依赖,基于 Python 构建了股票数据集管理系统。该系统可从网易财经网站爬取股票基础数据、财务指标等,对数据进行清洗、整合、计算技术指标等处理后存入 MySQL 数据库,同时提供数据预处理、导出和更新等功能,为投资者和分析师进行股票分析提供便利。
项目的主要特性和功能
- 数据爬取:利用爬虫从网易财经获取股票基础数据与财务指标。
- 数据处理:清洗整合爬取数据,并计算 MA、BBI 等多种技术指标。
- 数据库存储:将处理后的数据存入 MySQL 数据库,便于查询分析。
- 数据预处理:支持数据归一化、标准化及日期特征提取等预处理操作。
- 数据导出:可将处理后的数据导出为 CSV 格式。
- 数据更新:定期更新股票数据,确保数据集实时准确。
安装使用步骤
- 安装依赖库:使用 pip 安装项目依赖的
requests
、pandas
、lxml
、BeautifulSoup
、SQLAlchemy
、talib
等 Python 库。 - 配置数据库:
- 运行
database/mysql
下的数据库脚本。 - 修改
config/database_config.yaml
中的数据库连接信息。
- 运行
- 配置文件路径:修改
config/app.yaml
里的文件路径信息。 - 更新数据:
- 运行
biz/weekly.py
更新股票信息。 - 运行
biz/main.py
更新个股行情信息。
- 运行
- 测试功能:运行
test
目录下的测试脚本,检查项目功能是否正常。
请注意,上述步骤假设用户已下载本项目的源码文件,实际使用时可能需根据具体环境和需求适当调整。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】