项目简介
本项目是基于Python编写的爬虫程序,旨在从SCI-HUB平台下载科学文献。项目规划分三个阶段,目前已实现第一阶段的基本功能,可依据CSV文件中的文献信息进行下载操作。
项目的主要特性和功能
- 文献下载:能读取CSV文件,根据文件中的文献信息(如PMID、标题、年份和DOI等)从SCI-HUB下载对应文献。
- 错误处理:对于下载失败的文献,程序会将其信息写入另一个CSV文件,并统计下载成功率。
- 实时日志:程序实时输出下载日志,包含当前下载进度、成功与失败的文献信息等。
安装使用步骤
- 确保已安装Python环境,并安装所需库,如requests、beautifulsoup4和pandas。若缺少对应库,可运行命令安装,例如:python -m pip install requests 。
- 项目源码文件已下载。
- 按照项目提供的模板,创建包含文献信息的CSV文件,确保文件格式正确。
- 保证CSV文件与当前爬虫文件在同一目录,且CSV文件至少包含四列,顺序为:PMID、Title、日期、DOI 。
- 在main(filename)模块中传入要读取的文件名,例如:
python filename = "Capacitive.csv" # 假设文件名为'Capacitive.csv'
- 完成上述步骤后,直接执行程序。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】