今天我们不讲语法这些老掉牙的东西,我们随便找一个扩展,来分析一下 php底层 和 mysql 之间的通信原理。
首先我们来理解一下 php-fpm 的工作原理,php-fpm 是一个 php-cgi 进程管理器,其实就是一个连接池,它和nginx配合的工作原理如下。
vim php-fpm.ini
[www]
pm = static
pm.max_children = 5
pm.max_requests = 2
上面三句话的含义是什么呢:
1、static 表示静态以静态方式生成 php-fpm 进程
2、pm.max_children = 5 表示当 php-fpm 启动时就启动 5 个 php-fpm 子进程 等待处理 nginx 发过来的请求
3、pm.max_requests = 2 表示每个 php-fpm 子进程处理 2 个请求就销毁,当然父进程每次看到有销毁的自然也就会生成新的子进程
我们来简单验证一下这个说法:
首先重启 php-fpm,让它复位一下
接下来写一条简单的语句输出当前进程ID
echo "当前 php-fpm 进程ID:".posix_getpid()
不断刷新浏览器观察输出变化
当前 php-fpm 进程ID:24548
当前 php-fpm 进程ID:24549
当前 php-fpm 进程ID:24550
当前 php-fpm 进程ID:24547
当前 php-fpm 进程ID:24551
当前 php-fpm 进程ID:24548
当前 php-fpm 进程ID:24549
当前 php-fpm 进程ID:24550
当前 php-fpm 进程ID:24547
当前 php-fpm 进程ID:24551
当前 php-fpm 进程ID:24563
当前 php-fpm 进程ID:24564
当前 php-fpm 进程ID:24565
当前 php-fpm 进程ID:24566
当前 php-fpm 进程ID:24567
当前 php-fpm 进程ID:24563
当前 php-fpm 进程ID:24564
当前 php-fpm 进程ID:24565
当前 php-fpm 进程ID:24566
当前 php-fpm 进程ID:24567
当前 php-fpm 进程ID:24568
当前 php-fpm 进程ID:24569
当前 php-fpm 进程ID:24570
当前 php-fpm 进程ID:24571
当前 php-fpm 进程ID:24572
当前 php-fpm 进程ID:24568
当前 php-fpm 进程ID:24569
当前 php-fpm 进程ID:24570
当前 php-fpm 进程ID:24571
当前 php-fpm 进程ID:24572
可以看得出,第一批id不是按照顺序执行的,进程id为24547的进程是在第四位处理的,然后从下面开始,所有id都是顺序执行的而且每次生成的一批id都是递增,是不是有种mysql自增主键的赶脚呢?
这里需要注意的是,无论是静态还是下面的动态配置方式,只要没有设置 max_requests ,那么进程是不会销毁的,也就是说当一个进程里面出现死循环或者内存溢出等导致进程僵死的情况出现的时候,处理的进程就会少一个了
好吧理解了静态的处理方式,我们其实也很容易知道这个方式的弊端了,当然我们平时服务器不可能就开5个进程每个进程处理2个请求,我们来做一个简单的加减乘除,看看一个服务器应该开多少个 php-fpm 合适
首先我们来看看一个简单的echo需要多少内存:
$size = memory_get_usage()
$unit = array('b','kb','mb','gb','tb','pb')
$memory = @round($size/pow(1024,($i=floor(log($size,1024)))),2).' '.$unit[$i]
echo "当前 php-cgi 进程所使用内存:".$memory
观察浏览器我们可以得到一下数据:
当前 php-cgi 进程所使用内存:227.17 kb
也就是说一个简单的什么都不干的php就已经占用了200多K的内存,当然这也不算多。
不过进程多了cpu切换进程速度就会变慢,所以这个数还是需要通过ab等测试工具才能测试出具体应该开多少比较合理
我们先从200开始,不断的增加,架设增加到800的时候,效率和400一样,那我们就没必要开800那么多进程浪费内存了。
那么问题就来了,如果同一时间请求出超过400呢?有人说会排队等待,真的会排队等待吗?答案明显是 php-fpm 是没能力排队了,因为处理请求的php-fpm子进程都用完了,那么等待也就只能是在 nginx 等待,通常一个 nginx 也不只是转发请求给 php-fpm 就完事了,他还要处理静态文件呢?如果这些php请求导致nginx的请求数过多一直在等待,那么访问静态文件自然也会卡了,这时候我们就需要配置成下面的动态处理方式。
[www]
pm.max_children = 10
pm.start_servers = 5
pm.min_spare_servers = 2
pm.max_spare_servers = 8
pm.max_requests = 2
上面五句话的含义是什么呢:
1、dynamic 表示静态以动态方式生成 php-fpm 进程
2、pm.max_children = 10 同时活动的进程数 10个
3、pm.start_servers = 5 表示当 php-fpm 主进程启动时就启动 5 个 php-fpm 子进程
4、pm.min_spare_servers = 2 表示最小备用进程数
5、pm.max_spare_servers = 8 表示最大备用进程数
6、pm.max_requests = 2 上面说过就不说了
当前 php-fpm 进程ID:2270
当前 php-fpm 进程ID:2271
当前 php-fpm 进程ID:2272
当前 php-fpm 进程ID:2273
当前 php-fpm 进程ID:2274
当前 php-fpm 进程ID:2270
当前 php-fpm 进程ID:2271
当前 php-fpm 进程ID:2272
当前 php-fpm 进程ID:2273
当前 php-fpm 进程ID:2274
当前 php-fpm 进程ID:2270
当前 php-fpm 进程ID:2271
当前 php-fpm 进程ID:2272
当前 php-fpm 进程ID:2273
当前 php-fpm 进程ID:2274
在PHP-FPM处理HTTP请求时,有时会遇到一个请求需要进行多次MySQL查询(在报表类应用中比较常见)。通常我们会以串行方式查询:
$link = new mysqli()$rs1 = $link->query('SELECT * FROM table1')
while ($row = $rs1->fetch_row()) { ... }
$rs2 = $link->query('SELECT * FROM table2')
while ($row = $rs2->fetch_row()) { ... }
$rs3 = $link->query('SELECT * FROM table3')
while ($row = $rs3->fetch_row()) { ... }
串行查询方式有个缺点:在MySQL返回数据之前,PHP一直是处于空等的状态,不会继续往后执行。如果数据量大或者查询复杂,MySQL响应可能会比较慢,那么以串行方式查询会有一些延迟。给用户最直接的感受就是 Loading… 的圈圈一直打转。
那么有什么办法可以减少查询MySQL的时间?用多进程并行查询不行,因为PHP-FPM 中不允许用 pcntl_fork 一类的调用。
幸好还有 mysqlnd,mysqlnd提供了类似 stream_select 的机制(见 这篇文章) ,可以做到在单进程中对MySQL并行查询。这主要运用了mysqli_poll 和 reap_async_query 两个函数。
还是通过例子来介绍MySQL并行查询的实施方法。假设要并行地向MySQL发出10个查询,最基本的代码应该是这样的:
1. $links = []2. for ($i = 0 $i !== 10 $i++) {
3. $links[$i] = new mysqli('127.0.0.1', 'user', 'password', 'db1')
4. $links[$i]->query('SELECT SLEEP(1)', MYSQLI_ASYNC)
5. }
6. $allResult = []
7. while (!empty($links)) {
8. $reads = $links
9. $errors = $reject = []
10. if (!mysqli_poll($reads, $errors, $reject, null)) {
11. continue
12. }
13. foreach ($reads as $read) {
14. $idx = array_search($read, $links, true)
15. $allResult[$idx] = []
16. $result = $read->reap_async_query()
17. while ($row = $result->fetch_row()) {
18. $allResult[$idx][] = $row
19. }
20. $read->close()
21. unset($links[$idx])
22. }
23. }
解释下这段代码的含义:
2~5行,同时发起10个MySQL连接,并发出查询
注意query() 的第二个参数带上了 MYSQLI_ASYNC 表示非阻塞查询
10行,使用mysqli_poll 轮询10个连接的查询有无返回
mysqli_poll 的第一个参数$reads是个数组,包含需要轮询那些连接。mysqli_poll 执行完后,会改写$reads,改写后$reads包含的是那些已经有数据返回连接。
mysqli_poll的第四个参数,控制的是轮询的等待时间,单位是“秒”。如果像本例当中设置为null,那么mysqli_poll轮询是阻塞的:只有监听的连接中,任意一个连接有数据返回了,mysqli_poll才会返回。如果等待时间设置为0,那么每次执行mysqli_poll会立即返回,外层的while会频繁循环。
第11~19行,遍历已经有数据返回的连接
reap_async_query和普通query一样,返回的是mysqli_result,可以一行行fetch数据
20~21行,对于已经获得了数据的连接,下次mysqli_poll就不需要再轮询这个连接了,所以关闭连接,并从$links数组删除这个连接
当所有的连接都返回了数据,$links数组空了,while循环也就终止了。
使用并行查询的方式,可以大大缩短处理HTTP请求的时间,假设本例中的10个SQL查询,每个需要执行1秒。因为是并行,处理所有的查询,也只需要1秒左右。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)