【北京网站制作】PHP-CGI进程CPU 100%与file_get_contents函数的关系
  • 更新时间:2024-11-30 15:45:04
  • 网站建设
  • 发布时间:1年前
  • 805

PHP-CGI 进程 CPU 100% 与 file_get_contents 函数的关系

有时,运行Nginx和PHP-CGI(php-fpm)网络服务的Linux服务器突然出现系统负载增加。使用top命令查看,很多php-cgi进程的CPU占用率接近100%。后来通过跟踪发现,这种情况的出现与PHP的file_get_contents()函数密切相关。 (北京网站建设)

在大中型网站中,基于HTTP协议的API接口调用司空见惯。 PHP程序员喜欢用简单方便的file_get_contents('http://example.com/')函数来获取一个URL的返回内容,但是如果http://example.com/网站响应慢,file_get_contents()会一直卡在那里,不会暂停。

我们知道在php.ini中,有一个参数max_execution_time可以设置PHP脚本的最长执行时间,但是在php-cgi(php-fpm)中,这个参数是不会生效的。真正控制PHP脚本最大执行时间的是php-fpm.conf配置文件中的以下参数:

作为单个请求服务的超时(以秒为单位),之后工作进程将被终止

应在“max_execution_time”ini 选项因某种原因未停止脚本执行时使用

“0s”表示“关闭”

valuename='request_terminate_timeout'0s/值

默认值为0 秒,即PHP 脚本将永远执行。这样,当所有的php-cgi进程都卡在file_get_contents()函数中时,这个Nginx+PHP WebServer就不能再处理新的PHP请求,Nginx就会返回“502 Bad Gateway”给用户。需要修改该参数来设置PHP脚本的最大执行时间,但治标不治本。比如改成30s,如果file_get_contents()获取网页内容慢,说明150个php-cgi进程每秒只能处理5个请求,WebServer也很难避免“502 Bad网关”。

要实现完整的解决方案,PHP程序员只能改掉直接使用file_get_contents('http://example.com/')的习惯,而是稍微修改一下,加个timeout,按照下面的方式实现HTTP GET请求。如果觉得麻烦,可以自己将下面的代码封装成一个函数。

="tag-name">php    
  • $ctx = stream_context_create(array(    
  •    'http' => array(    
  •        'timeout' => 1 //设置一个超时时间,单位为秒    
  •        )    
  •    )    
  • );    
  • file_get_contents("http://example.com/", 0, $ctx);    
  • ?>   
  •   当然,导致 php-cgi 进程 CPU 100% 的原因不只有这一种,那么,怎么确定是 file_get_contents() 函数导致的呢?

      首先,使用 top 命令查看 CPU 使用率较高的 php-cgi 进程。

    1. top - 10:34:18 up 724 days, 21:01,  3 users,  load average: 17.86, 11.16, 7.69 
    2. Tasks: 561 total,  15 running, 546 sleeping,   0 stopped,   0 zombie 
    3. Cpu(s):  5.9%us,  4.2%sy,  0.0%ni, 89.4%id,  0.2%wa,  0.0%hi,  0.2%si,  0.0%st 
    4. Mem:   8100996k total,  4320108k used,  3780888k free,   772572k buffers 
    5. Swap:  8193108k total,    50776k used,  8142332k free,   412088k cached 
    6.   PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                            
    7. 10747 www       18   0  360m  22m  12m R 100.6 0.3    0:02.60 php-cgi                                                            
    8. 10709 www       16   0  359m  28m  17m R 96.8  0.4    0:11.34 php-cgi                                                            
    9. 10745 www       18   0  360m  24m  14m R 94.8  0.3    0:39.51 php-cgi                                                            
    10. 10707 www       18   0  360m  25m  14m S 77.4  0.3    0:33.48 php-cgi                                                            
    11. 10782 www       20   0  360m  26m  15m R 75.5  0.3    0:10.93 php-cgi                                                            
    12. 10708 www       25   0  360m  22m  12m R 69.7  0.3    0:45.16 php-cgi                                                            
    13. 10683 www       25   0  362m  28m  15m R 54.2  0.4    0:32.65 php-cgi                                                            
    14. 10711 www       25   0  360m  25m  15m R 52.2  0.3    0:44.25 php-cgi                                                            
    15. 10688 www       25   0  359m  25m  15m R 38.7  0.3    0:10.44 php-cgi                                                            
    16. 10719 www       25   0  360m  26m  16m R  7.7  0.3    0:40.59 php-cgi 

      找其中一个 CPU 100% 的 php-cgi 进程的 PID,用以下命令跟踪一下:

    1. strace -p 10747 

      如果屏幕显示:

    1. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    2. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    3. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    4. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    5. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    6. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    7. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    8. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    9. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    10. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    11. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    12. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    13. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    14. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    15. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    16. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    17. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    18. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 
    19. select(7, [6], [6], [], {15, 0})        = 1 (out [6], left {15, 0}) 
    20. poll([{fd=6events=POLLIN}], 1, 0)     = 0 (Timeout) 

      那么,就可以确定是 file_get_contents() 导致的问题了。

    我们专注高端建站,小程序开发、软件系统定制开发、BUG修复、物联网开发、各类API接口对接开发等。十余年开发经验,每一个项目承诺做到满意为止,多一次对比,一定让您多一份收获!

    本文章出于推来客官网,转载请表明原文地址:https://www.tlkjt.com/web/13826.html
    推荐文章

    在线客服

    扫码联系客服

    3985758

    回到顶部