项目简介
本项目是PHBS的Python基础课程作业集合,包含多个不同功能的Python脚本,涉及数据处理、网络爬虫、翻译、数学拟合等多个领域,每个作业都有明确需求和对应实现代码。
项目的主要特性和功能
- 数据处理:可从Excel文件提取超链接到新文件,也能提取指定目录下所有PDF文件首页并合并成新PDF文件。
- 网络爬虫与翻译:能抓取特定网页论文摘要,使用百度翻译API将英文摘要翻译成中文并保存。
- 数学拟合:用梯度下降法对给定的一组点进行二次函数拟合,并可视化展示结果。
- 算法实现:包含计算网格中唯一路径数量、找出最长递增子序列长度、判断字符串是否为变位词、计算非负整数平方根等算法。
- 基础输出:可输出9*9乘法表。
安装使用步骤
环境安装
确保已安装Python 3.9.13及相关依赖库,依赖库版本如下: - numpy=1.24.3 - xlrd=2.0.1 - xlwt=1.3.0 - beautifulsoup4=4.12.2 - pypdf4=1.27.0 - matplotlib=3.8.2
下载源码
下载本项目的源码文件。
运行脚本
- 作业1:运行
./homework_1/multiplication_table.py
输出9*9乘法表。 - 作业2:判断字符串是否为变位词运行
./homework_2/anagram.py
;计算非负整数平方根运行./homework_2/exponent.py
。 - 作业3:计算网格唯一路径数量运行
./homework_3/unique_path.py
;找出最长递增子序列长度运行./homework_3/longest_increasing_seq.py
。 - 作业4:运行
./Homework_4/extract_url.py
,可添加参数--src
指定源文件路径、--dest
指定目标文件路径、--web
决定是否在浏览器打开链接、--link_col
指定包含链接的列索引。 - 作业5:提取PDF封面运行
./Homework_5/extract_cover.py
,可添加参数--src
指定源文件目录、--dest
指定目标文件路径;抓取网页摘要并翻译运行./Homework_5/translate_abstract.py
,需添加参数--appid
和--appkey
用于百度翻译,还可添加--en_path
指定英文摘要文件路径、--cn_path
指定中文摘要文件路径。 - 作业6:运行
/Homework_6/quadratic_fit.py
进行二次函数拟合。
查看结果
根据各脚本功能查看相应输出文件或可视化结果。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】