-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA256
Ahojte,
jak jsem psal na outage-list, vcera nam dorazily dily na storage server - vymena vnitrnosti, protoze ten server uz nestihal.
Kdyz ne vcera, dostali bychom se k vymene vnitrnosti az pristi rok.
(poznamecka pro ty co nevedi: storage server je ten, kam jdou zalohy, 3U bedna s 16 disky)
Nastaly ruzne divne problemy (napr. na te desce nam nechce fungovat treti a ctvrty pametovy kanal u toho CPU, to zpusobilo dost dlouhe laborovani, jak to rozjet, potom system nechtel nabootovat, jelikoz optional boot ROM SAS radice si nerozumi zrejme dobre s UEFI, to byla docela dobra kovbojka); takze storage byl down dele, nez bych chtel.
NFS client v linuxu ma skvelou tendenci tuhnout, kdyz mu zmizi server a tezko se s tim neco dela. Proto mely VPS na node8 problem startovat (predevsim totiz mely problem se vypnout).
Umountnout se ten FS neda jednoduse, protoze existuji procesy, ktere nad nim visi a jak uz je na NFS client kodu v linuxu klasicke, i kdyz je namontovany s intr flagem, takove procesy nejde poradne pozabijet.
Dneska jsem objevil "novy" flag umountu, -l, ktery tohle resi (lazy umount, hodi ten mount na pozadi a procesum, ktere nad ten mount nesahaly, se pak jevi jako umountnuty - ty ktere pak jeste porad nad tim starym NFS mountem visi, casem vytimeoutuji).
Dulezity poznatek z toho tedy je, ze storage serveru musime zajistit co nejlepsi uptime a musime automatizovat umount -f -l mechanismus pro pripady, kdy je storage server down (at uz planovane, nebo neplanovane).
Jinak zajimave je, ze vsude jinde, krome node8, stacilo zavolat mount - -o remount nad tim mountem storage a vzpamatovalo se to (po tom co jsme storage doresili a uz je funkcni).
Storage server je vicemene docasne poreseny, ale ty vnitrnosti asi budeme reklamovat - napr. nefunkcnost dvou pametovych kanalu (DAFUQ, jak je to mozne), bugy v UEFI a to nemluvim o manualu, ktery psal nekdo, kdo tu desku v zivote nevidel... :)
S pozdravem
Pavel Snajdr
+421 948 816 186 | +420 720 107 791 | 110-010-956 CTO of Relbit | Predseda vpsFree.cz, o.s. | RHCE http://relbit.com | http://vpsfree.cz | https://www.redhat.com
community-list@lists.vpsfree.cz