問題描述
最近有臺服務器偶爾會報502錯誤,雖然量不多,每天就幾十個,但是也必須得找到原因,避免讓小問題變成大問題。
排查過程
502錯誤的原因,一般是對用戶訪問請求的響應超時造成的,一開始以為是請求量太大,超過了服務器目前的負載,但是查看了zabbix監(jiān)控,發(fā)現(xiàn)問題時段的負載、內存、IO都沒有非常明顯的變化,服務器并沒有達到繁忙的狀態(tài);查看這個時段請求的并發(fā)數(shù),也不高。
然后查看nginx錯誤日志,發(fā)現(xiàn)該時段有如下報錯:
connect() to unix:/dev/shm/phpfpm.socket failed (11: Resource temporarily unavailable) while connecting to upstream
說明還是php-fpm進程不足導致的。
然后再觀察問題時段的php-fpm進程數(shù)變化情況: