[vpsFree.cz: community-list] O problemech se Storage serverem, tip na umount NFS

Pavel Snajdr snajpa at snajpa.net
Thu Dec 20 12:40:16 CET 2012


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

Ahojte,

jak jsem psal na outage-list, vcera nam dorazily dily na storage
server - vymena vnitrnosti, protoze ten server uz nestihal.

Kdyz ne vcera, dostali bychom se k vymene vnitrnosti az pristi rok.

(poznamecka pro ty co nevedi: storage server je ten, kam jdou zalohy,
3U bedna s 16 disky)

Nastaly ruzne divne problemy (napr. na te desce nam nechce fungovat
treti a ctvrty pametovy kanal u toho CPU, to zpusobilo dost dlouhe
laborovani, jak to rozjet, potom system nechtel nabootovat, jelikoz
optional boot ROM SAS radice si nerozumi zrejme dobre s UEFI, to byla
docela dobra kovbojka); takze storage byl down dele, nez bych chtel.

NFS client v linuxu ma skvelou tendenci tuhnout, kdyz mu zmizi server
a tezko se s tim neco dela. Proto mely VPS na node8 problem startovat
(predevsim totiz mely problem se vypnout).

Umountnout se ten FS neda jednoduse, protoze existuji procesy, ktere
nad nim visi a jak uz je na NFS client kodu v linuxu klasicke, i kdyz
je namontovany s intr flagem, takove procesy nejde poradne pozabijet.

Dneska jsem objevil "novy" flag umountu, -l, ktery tohle resi (lazy
umount, hodi ten mount na pozadi a procesum, ktere nad ten mount
nesahaly, se pak jevi jako umountnuty - ty ktere pak jeste porad nad
tim starym NFS mountem visi, casem vytimeoutuji).

Dulezity poznatek z toho tedy je, ze storage serveru musime zajistit
co nejlepsi uptime a musime automatizovat umount -f -l mechanismus pro
pripady, kdy je storage server down (at uz planovane, nebo neplanovane).

Jinak zajimave je, ze vsude jinde, krome node8, stacilo zavolat mount
- -o remount nad tim mountem storage a vzpamatovalo se to (po tom co
jsme storage doresili a uz je funkcni).

Storage server je vicemene docasne poreseny, ale ty vnitrnosti asi
budeme reklamovat - napr. nefunkcnost dvou pametovych kanalu (DAFUQ,
jak je to mozne), bugy v UEFI a to nemluvim o manualu, ktery psal
nekdo, kdo tu desku v zivote nevidel... :)

S pozdravem

Pavel Snajdr

+421 948 816 186  | +420 720 107 791          | 110-010-956
CTO of Relbit     | Predseda vpsFree.cz, o.s. | RHCE
http://relbit.com | http://vpsfree.cz         | https://www.redhat.com
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.12 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iF4EAREIAAYFAlDS+R0ACgkQdh+64ds5DaavnAD+ObVaSNlbtVnPtB+AqgP/gXzY
xSc0SBdx3B4w9l5eHt8BAKWhO0FQYrv6aL8BVCVtjC9VrfCj0V9WXBFAVsQ8Jsy/
=n5RX
-----END PGP SIGNATURE-----



More information about the Community-list mailing list