别再像2009年那样写PHP代码了
离开在Facebook担任工程师的仅仅2个月时间,我就很困惑,外面的世界看上去仍然像是在2009年的时候那样写 PHP。
貌似人们从来没听过 Hack、 HHVM、 XHP 等等,人们仍旧在代码里大量使用 require() 和 include() 语句。简直了。
我仍然认为 PHP 是一门写前端应用的优秀语言(业务逻辑和 API 层),但只有当你应用了以下它的现代优势时,这一说法才成立:
1. Hack
打出你的变量:
说实话,PHP 最大的问题是它缺乏强类型。 变量可以是任何类型,很多时候这就是一个定时炸弹。
如果你不得不写这样的代码:
if ($var !== null && is_int($var)) { //... }
这意味着你可以想引用一个null变量,或者错误的变量类型。
Hack 是向 PHP 渐渐添加类型信息的途径,而且它是基于 PHP 的。
如果你添加了 hack 类型提示,它强制约束你的变量(包括把他们标记为可能为 null)。例如:
class Foo { ?int $var = null; // ... some code ... }
可以用在方法签名、类属性等上面,接着它允许你通过 hh_client 检查代码里是否存在错误,存在就会把类型错误高亮出来。
Hack 文档页面有更多更好的对于 Hack 类型的解释: https://docs.hhvm.com/hack/overview/typing
Async 异步
对于体面的 PHP 网站来说,下一个重要的跨越是使用 hack 的 async/await 关键词。
如果你从未接触过类似特性的语言,我来解释一下。
比如讲,你需要对数据库做 3 次函数调用,为了获取 3 块数据。为了计算出页面想要的结果,你需要所有 3 个查询结果,但每个结果都需要 1 条不一样的 SQL 语句。
一般你会这样写:
$data1 = querySQL1(); $data2 = querySQL2(); $data3 = querySQL3(); $result = computeResult($data1, $data2, $data3);
好,实际上,除非你在明确的做一些牛逼的东西,PHP 通常是在一个请求里面单线程跑的。 这意味着服务器会首先给第一条查询执行一条 SQL,等待结果,然后再执行第二条 SQL,接着再执行第三条。
这有什么问题呢?这里的问题是,计算最终结果所需的时间是执行 query1、query2 和 query3 三者的时间之和。
但大多数数据库都是多线程,且可以并行执行操作的。如果在此之上,你的 DB 在 SSD 上而不是在机械硬盘上执行,你就可以利用上 DB 的多核处理器和并行处理能力...
如果你在查询多个 DB 或者多个不同的服务,或是请求多个 API,对你来说这一特性也可以发挥优势。
我们怎么来解决呢? 使用 async/await:
list($data1, $data2, $data3) = await\HH\Asio\v(array( querySQL1(), querySQL2(), querySQL3(), ));
是这种方式,3 条查询一次性发送并等待结果。现在获取 3 块数据的时间就是执行耗时最长那条查询的时间,因为 3 条都在并行处理。
Hack 使用图表的方式更好地对 async 做了解释:https://docs.hhvm.com/hack/async/introduction
Hack 提供了对 MySQL, memcache 和 Curl 的 async 实现,所以你可以只需用它们的库替换掉你的调用就能立即利用到这一优势。
Collections:
PHP 数据,有时候是一个向量,有时候是一个字典,有时候两者都是。
即便你知道它里面包括什么,其他的工程师很可能认为自己也知道,但却在里面放进了错误的数据类型。
如果你曾经使用过像 C#, Java 或 C++ 这样的语言,你可能对 Generics 和 Collections 会感到熟悉。
Hack 引入了 Collections, 它让你指定 Collections 里面的数据类型。 这意味着你只是盲目寄望于数组包含了你想要的值,现在你知道这一结构包括了你想要的数据类型(字符串、整型等等)。
在这之上,如果你仍旧想使用 PHP 的数组,你只需要对代码做一点点重构,你就可以对数组内容的类型进行这样的约束:
class Bar { array $vector_of_ints = array(); array $dictionary_with_string_keys = array(); }
然后你只要在数组里放置了错误类型的变量,或者给数组指定一个字符串键,类型检查器就会抛出错误。
2. HHVM
Hack 带有它自己的运行环境,如你预料的,它无法直接运行于 Zend 的 PHP 环境。
HHVM 指 HipHop 虚拟机,是在 Facebook 开发的旨在极大改进 PHP 规模化的执行复杂度问题。
HHVM 运行了整个 Facebook 和一些其他主要站点,比如现在的维基百科,随着时间推移,越来越证明它所带来的许多性能收益。
由于 HHVM 无需 Hack 提示符也可以运行常规的 PHP,且同样可以加速代码执行效率,所以不使用 HHVM 作为你默认的 PHP 运行环境就是在浪费钱。
例如,当维基百科切换至 HHVM 后,平均单页加载时间减少了超过一半,CPU 的平均使用率从 70% 减少至 12%,这还是在 2 年前。自那时起, HHVM 团队持续提升其性能表现,所以你可以想象它现在表现更好了。
HHVM 在生产环境需要一个像 Apache 或 nginx 这样的 HTTP 服务器作为前端支撑,但是在开发环境,它也可以独立作为服务器运行。
3. XHP
如果有一件事是我憎恶的,就是 PHP/HTML 混编。这样的代码让我吐:
$user_name = 'Fred'; $output = "Hello $user_name";
更早的是,有人自作聪明,不在一个地方开闭 HTML 标签,像这样:
$user_name = 'Fred'; $output = " Hello $user_name"; // some call to a function that takes in $output and is supposed to close the div tag $output = addTheRestOfTheSoup($output);
于是你维护起来就...
XHP 让 HTML 作为 PHP 的一级公民,因此你可以在字符串外编写 HTML,像 XHP 一样解析。
比如:
$user_name ='Fred'; $output = Hello $user_name; addTheRestOfTheDivContentsTo($output); //... function addTheRestOfTheDivContentsTo(:div $div): :div { $div->appendChild("We come in peace"); return $div; }
如你所见, XHP 同样强制标签匹配,也就是说开标签有相应的闭标签,且以合适的顺序进行开闭。
XHP 同样处理字符串变量的 escape,避免 HTML/JS 进入页面的用户内容中,防御网站受到该攻击矢量的攻击。
你还可以为你自己创建自定义的 XHP 类,比如“自定义的HTML标签”来复用你的代码库,比如实现可以自动在 Facebook 页面添加链接的功能,甚至用一个标签来渲染整个页面头部。
更多关于 XHP 的文档:https://docs.hhvm.com/hack/XHP/introduction