三分钟学会如何在函数计算中使用 puppeteer

化风

2018-06-20

关注关注

简介

使用 puppeteer 结合函数计算，可以快速的构建弹性的服务完成各种功能，包括：

生成网页截图或者 PDF
高级爬虫，可以爬取大量异步渲染内容的网页
模拟键盘输入、表单自动提交、登录网页等，实现 UI 自动化测试
捕获站点的时间线，以便追踪你的网站，帮助分析网站性能问题

接下来，将基于一个脚手架项目开发我们自己 puppeteer 项目。

下载项目

&gt;&gt;&gt; git clone -o starter-kit https://github.com/awesome-fc/puppeteer-fc-starter-kit.git your_project_name

项目结构

├── lib chrome headless 依赖的共享库，打包的时候，拷贝到打包项目的根目录下
├── chrome 
│ ├── buildChrome.sh 编译 chrome headless shell 脚本，基于它，可以编译最新的版本
│ └── headless_shell.tar.gz 编译后的 chrome headless 二进制打包文件
├── src
│ ├── index.js 函数调用入口文件，函数 handler 为 index.handler，您的业务代码写在这里
│ └── starter-kit
│ ├── config.js 通过环境变量，获取相关配置属性，如：chrome 执行目录和安装目录等配置
│ ├── local.js 本地测试操作 chrome headless 的 API 是否正确，通过执行命令：npm run local
│ └── setup.js 安装 chrome headless 相关逻辑代码，如：基于 OSS 安装或者本地目录安装
├── package.json
└── package.zip 输出函数计算打包文件，通过命令：npm run package 或 npm run package-nochrome

如何写业务代码

index.js 文件

const setup = require('./starter-kit/setup');
exports.handler = async (event, context, callback) =&gt; {
 const browser = await setup.getBrowser(context);
 exports.run(browser).then(
 (result) =&gt; callback(null, result)
 ).catch(
 (err) =&gt; callback(err)
 );
};
exports.run = async (browser) =&gt; {
 // 实现您自己的业务代码
 // 下面是一个示例代码，需要替换成您自己的业务代码
 // 示例实现了对固定网页截图并返回图片的功能
 const page = await browser.newPage();
 await page.goto('https://fc.console.aliyun.com');
 return page.screenshot({
 clip: {
 x: 200,
 y: 60,
 width: 780,
 height: 450,
 },
 });
};

本地测试

执行命令： npm run local 。测试您操作 chrome headless 的相关 api 是否正确运行。

编译打包

包含 chrome headless

执行命令：npm run package 。命令会将 chrome headless 文件一起打包进项目，放在项目根目录，函数执行的时候，默认将 chrome headless 安装到 /tmp 目录。

不包含 chrome headless

执行命令：npm run package-nochrome 。命令不会将 chrome headless 文件一起打包进项目，你需要额外将 chrome-headless 上传到 OSS，通过环境变量告诉函数如何从 OSS 下载并安装，默认将 chrome headless 安装到 /tmp 目录。为函数计算设置环境变量：

CHROME_BUCKET(必填): chrome headless 上传到 OSS 的 bucket
CHROME_REGION(必填): chrome headless 上传到 OSS 的 region
CHROME_KEY(必填): chrome headless 上传到 OSS 的 key. 默认值: headless_shell.tar.gz

部署

编译打包输出的文件：package.zip，通过函数计算控制台或者 fcli 命令工具上传已打包文件。fcli 上传已打包文件命令：

# 在相应 service 目录下
&gt;&gt;&gt; mkf myFunction -h index.handler -f package.zip -t nodejs8 # 代码在本地的 package.zip 中

为什么要使用函数计算

函数计算是一个相对较新的事物，可能大部分开发人员或架构师对它很陌生。微服务架构是当下很流行的一种系统架构，微服务架构有没有不够完美的地方？答案是肯定的。基于微服务架构，我们需要考虑使用什么微服务框架来架构系统、需要多少台服务器、如何有效减轻运维负担等一些列问题。另外，按照《福布斯》杂志的统计，在商业和企业数据中心的典型服务器仅提供 5%～15% 的平均最大处理能力的输出。这无疑是一种资源的巨大浪费。

有没有办法解决上面的不足？答案也是肯定的，阿里云函数计算就是在这样的背景下应运而生的。如果把云计算理解成一个执行环境，那么，在这个环境里，函数（即业务逻辑的载体）+ 数据（即跟业务相关的输入与输出）就是应用的核心，有了函数、数据、事件这三者，其它任何代码和框架，无非是整个应用的胶水和UI罢了。那么，最理想的情况就是用最少的时间写胶水，将更多的时间投入到核心应用的开发中，甚至，彻底实现整个软件栈的微服务化。函数计算就是这里的胶水。

开发效率

三分钟学会如何在函数计算中使用 puppeteer

可靠性

三分钟学会如何在函数计算中使用 puppeteer

成本

三分钟学会如何在函数计算中使用 puppeteer

安全

三分钟学会如何在函数计算中使用 puppeteer

总结

函数计算有如下优势：

无需采购和管理服务器等基础设施
专注业务逻辑的开发
提供日志查询、性能监控、报警等功能快速排查故障
以事件驱动的方式触发应用响应用户请求
毫秒级别弹性伸缩，快速实现底层扩容以应对峰值压力
按需付费。只需为实际使用的计算资源付费，适合有明显波峰波谷的用户访问场景

本文为云栖社区原创内容，未经允许不得转载。

谷歌浏览器

安科网

三分钟学会如何在函数计算中使用 puppeteer

化风

简介

下载项目

项目结构

如何写业务代码

本地测试

编译打包

部署

为什么要使用函数计算

总结

化风

相关推荐

如何在Fedora上安装Google Chrome浏览器

Chrome 87新特性解读，多年来Chrome性能最大提升！

实用！8个Chrome插件玩转GitHub，单个文件下载小意思

如何在Android端Chrome上启用安全浏览增强型保护

使用Chrome开发者工具研究JavaScript函数的原生实现原理

使用Chrome开发者工具研究JavaScript的垃圾回收机制

Chrome的下载实在太蛋疼！教你如何改善它

寻找论文代码没那么麻烦，现在只需装个Chrome插件

chrome浏览器升级到85版本后，页面访问失败

Chrome 团队正探索 Rust 与 C++ 的互操作性

全面终端安全缺失的一环

全面终端安全缺失的一环

Node.js 深度调试方法解析

谷歌新工具重磅开源！有它就能在Chrome OS上快速构建应用程序了

Linux-Centos下selenium部署

文献搜索与下载——Google Chrome+Google Scholar插件+SCI-Hub插件

自动化测试（1）selenium+python+chrome 连接测试

解决Selenium重复开启浏览器问题

爬取素材库直接存入mysql数据库

linux 安装 web ui自动化环境-selenium+chromedirver

化风