项目简介
本项目是基于Node.js的网页爬虫与自动化测试系统。借助Google官方的Puppeteer库,通过DevTools协议控制headless Chrome,利用其提供的API直接操控Chrome以模拟用户操作。可用于网页数据收集、自动化测试等,并且操作DOM可在内存中模拟,无需打开真实浏览器。
项目的主要特性和功能
- 网页爬虫:仿真模拟用户操作,高效爬取网页数据。
- 文件生成:能利用网页生成PDF和图片。
- SPA应用处理:爬取单页面应用并生成预渲染内容。
- 自动化操作:实现表单提交、UI测试、键盘输入等自动化任务。
- 测试环境搭建:创建新的自动化测试环境,运行测试用例。
- 性能分析:捕获站点时间线,助力分析网站性能问题。
安装使用步骤
安装环境
项目依赖Node.js 6.4以上版本,为使用async/await异步功能,建议使用7.6以上版本。因headless Chrome对服务器依赖库版本要求高,推荐使用高版本服务器。
安装步骤
进入项目目录,在终端执行 npm install
安装依赖。若安装报错,可切换至淘宝镜像,使用 cnpm
安装。
使用步骤
在终端运行 node index
启动项目。参考官方API文档及示例代码,编写自己的爬虫或自动化测试脚本。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】