<html><body><div style="font-family: arial, helvetica, sans-serif; font-size: 12pt; color: #000000"><div>Ahoj,</div><div><br data-mce-bogus="1"></div><div>mám tady jeden server kde je cca 35k lidí za vteřinu. Běží tu nginx + php fpm a mysql db. V nginxu jsem rozjel microcache, což hodně ulevilo zátěži serveru. Nicméně, mám problém s PHPkem. FPM běží přes TCP (zkoušel jsem i unix socket nicméně bylo to pomalější a docházelo ke stejnému problému). Dle error logu dochází k těmto chybám:</div><div><br data-mce-bogus="1"></div><div>2015/12/01 23:26:56 [error] 27043#0: *122476 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 188.114.98.51, server: xxx request: "GET /xxx/xxxx/xxx HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "xxxx", referrer: "http://xxxxx"<br>2015/12/01 23:26:56 [error] 27032#0: *124368 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 188.114.99.50, server: xxxxxx, request: "GET /xxxxx/xxxxx HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "xxxxx", referrer: "xxxxx"</div><div><br data-mce-bogus="1"></div><div>a sype to tam docela drsně. Jak vypnu kešování v nginxu load vyskočí, třeba i na 500, těch chyb PHPka je méně ale jsou tam pořád. </div><div><br data-mce-bogus="1"></div><div>Konfigurace FPM pro pool toho webu je:</div><div><br data-mce-bogus="1"></div><div>[web1]<br><br>listen = 127.0.0.1:9000<br>listen.allowed_clients = 127.0.0.1<br>listen.owner = web1<br>listen.group = client0<br>listen.mode = 0660<br>listen.backlog = 65536<br><br>user = web1<br>group = client0<br><br>request_slowlog_timeout = 5s<br>slowlog = /var/log/php-fpm/slowlog-web1.log<br><br>pm = dynamic<br>pm.max_children = 7000<br>pm.start_servers = 4000<br>pm.min_spare_servers = 2000<br>pm.max_spare_servers = 4000<br>pm.max_requests = 100<br><br>request_terminate_timeout = 60s<br>rlimit_files = 500000<br>rlimit_core = unlimited<br>catch_workers_output = yes<br><br>pm.status_path = /php-status<br><br>chdir = /<br></div><div><br data-mce-bogus="1"></div><div>+ openbasedir, sessions save path. atp.</div><div><br data-mce-bogus="1"></div><div>S těma hodnotama jsem se zkoušel různě hrát, nicméně to k vyřešení tohoto problému nepomohlo. Zkoušel jsem upravit i nějaké parametry jádra (local port range, tcp ack timeouty atp.) ale výsledek stejný. Dělá to i u unix socketu, což je mi právě zvláštní. Nginx konfigurace je:</div><div>user www-data;<br>worker_processes 80;<br>pid /run/nginx.pid;<br># set open fd limit to 50000<br>worker_rlimit_nofile 100000;<br><br>events {<br> worker_connections 1024;<br> multi_accept on;<br> use epoll;<br>}<br></div><div><br data-mce-bogus="1"></div><div>ve vhostu nic zvlastniho, jenom pro php:</div><div><br data-mce-bogus="1"></div><div> fastcgi_split_path_info ^(.+\.php)(/.+)$;<br> fastcgi_param SCRIPT_FILENAME $document_root/$fastcgi_script_name;<br> include /etc/nginx/fastcgi_params;<br> fastcgi_pass 127.0.0.1:9000;<br> fastcgi_index index.php;<br> fastcgi_intercept_errors on;<br> fastcgi_read_timeout 4m;<br></div><div><br data-mce-bogus="1"></div><div>Dnes bude k tomuto server nový, pro rozdělení zátěže, ale jako fakt nevím jestli to má smysl ve stejné konfiguraci, kvůli těm php chybám. Nenapadá Vás kluci, co s tím? Nebo případně návrh řešení, kterým bych nahradil tohle, při dvou serverech ? Přemýšlím nad MySQL M - M replikací, v DNS round robin a GlusterFS pro data. Ale to phpko mi nedá spát. A dnes večer to už další nápor asi nedá.</div><div><br data-mce-bogus="1"></div><div>Díky za rady a konzultace.</div><div><br></div><div data-marker="__SIG_PRE__">S pozdravem<br>Branislav Viest<br></div></div></body></html>