Java or PHP? 谈谈高并发网站的技术选型和架构设计
对于许多创业公司,要做网站和手机App, 到底选择Java还是PHP,是个很纠结的事情.
作为一个有10多年经验的工程师,谈谈个人看法.
开门见山,先说结论.
一 结论
- PHP,Java各有优劣,不要把问题想的太重大了,不妨举重若轻,任选一个都好.
- 主要看团队成员熟悉哪个语言,哪个语言能快速出产品,并快速迭代更新.
二 详细比较
PHP的优点
- 简单, 开发效率高,是Java两倍以上,能快速出产品,并快速迭代更新.
- 优化简单,多数企业很容易获取较好的性能
PHP的缺点
- 由于PHP-FPM IO 阻塞的特点,一个进程同时只能处理一个请求,像京东,小米这样的抢购情况下,大并发处理能力较差.
- 现在大学生学php的人少,不好招人.
Java的优点
- 由于Tomcat非阻塞的特点,一个线程可同时处理多个请求,大并发性能较好
- 大学生学Java的人多,好招人.
Java的缺点
- 配置复杂,开发效率较PHP低
- 很占内存,性能优化复杂,如果优化不好,性能反而不及PHP
三 高并发网站的架构设计
其实许多初创公司的访问量,远远没有达到PHP或是JAVA撑不住的地步.
这里假设公司面临像小米或是12306这样的大并发访问.
大并发情况下,IO阻塞与非阻塞,性能差距是很大的.
查看一下Nginx, tomcat, php-fpm 的源码,我们发现,Nginx, tomcat使用的是非阻塞多路复用机制(对于linux, 底层就是epoll),一个线程可同时处理多个请求,而php-fpm是阻塞机制,一个进程同时只能处理一个请求.
(php-fpm 有个配置可以使用epoll,只适用于master管理进程,对应worker进程还是阻塞的)
处理大并发的能力排名nginx第一,tomcat第二,php-fpm第三.
对于像12306这样的大并发情况,无论tomcat还是php-fpm都是瓶颈.
只有在nginx上做文章.
顺便说下对于底层的IO多路复用,FreeBSD 的kqueue 性能要优于Linux 的epoll.
以Nginx为中心的大并发架构
首先,Nginx负载均衡是必需的.这里主要讲单台服务器的架构优化设计.
我们想,如果java和php 成为瓶颈,能绕过这个瓶颈就好.
回答是肯定的.
我们可以通过nginx插件直接访问redis缓存,或是rabbitmq消息队列里,这就是OpenResty项目提供的功能
OpenResty 是一款基于 NGINX 和 LuaJIT 的 Web 平台, 可以使用简单的Lua语言访问后端redis, rabbitmq,mysql 等服务,充分利用Nginx的非阻塞大并发处理能力.
通过OpenResty,可直接在redis读取缓存,而订单这样的操作,可以写到rabbitmq消息队列里.
这样大并发都有nginx来处理,php 或是java 只是作为工具在后端更新下缓存和处理消息队列,这样java和php 成为不再成为瓶颈,这也是开篇时,我说选择php 或是java不重要的原因.
如果我们使用JWT认证用户,这个用户检查的工作也可由nginx来处理.
随着公司规模的扩大,对于消息推送,需要同时大量TCP长连接的情况,这时候golang语言开始登场.
总结
对应创业公司,初期消息推送可用第三方服务,而对于以Nginx为中心的大并发架构方案对应很多初创公司也还用不到,真需要时,用户规模已经很大了.
所以说选择Java和PHP 真的不是很关键的问题,关键的问题是团队熟悉哪个语言.