-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256
Known bug: nejak to nerozchodilo IPv6 :(
To opravim, jakmile se vyspim, ted bych napachal vic skod, nez uzitku.
Dik za pochopeni.
S pozdravem
Pavel Snajdr
+421 948 816 186 | +420 720 107 791 | 110-010-956
CTO of Relbit | Predseda vpsFree.cz, o.s. | RHCE
Ahojte,
report z outage:
Tohle byl vubec nejstresovejsi planovany vypadek *EVER*, topnul i
to, jak rok zpatky umrelo tehdy jeste towerovemu node5 diskove
pole.
Navzdory tomu, ze jsem si upgrade na SL6.4 a novy OpenVZ kernel
otestoval v testovacim prostredi, kde to sebehlo, na produkcnich
nodech to proste za boha nebezelo - konkretne node2, node3 a
node8.
Random nenabihaly VPS, pripadne se boot seknul uz na startu udevu,
kernel hlasil "hung tasks" (coz vetsinou znaci pruser s diskovym
subsystemem)...
Zabil jsem asi nejstresovejsi 3 hodiny zivota, abych zjistil, ze
kdyz necham ty masiny minutu-dve odstat uplne vypnute (tzn. ne
reboot), tak to najednou nabehne... zrejme ty 3 stroje spojovalo
to, ze mely nejakou uzasnou verzi kernelu, ktera pri rebootu
nechala tu masinu v jakemsi nevyresetovanem stavu a pak to delalo
psi kusy... Takze darujhovno.cz budto kernelovym vyvojarum, ale
spis to vidim na prasaky ze Supermicro/AMI za dopraseny UEFI/BIOS,
ktery neporadne resetuje hardware.
Kazdopadne, vsechno nakonec *DOBRE* dopadlo.
Jestli vam nekomu VPS nenajela, je mozne, ze je to jeste artefakt z
ne uplne davne doby vpsAdminu, kdy spatne nastavoval on_boot flag
VPSkam -> staci jit a pustit ji z vpsAdmin UI.
S pozdravem
Pavel Snajdr
+421 948 816 186 | +420 720 107 791 | 110-010-956 CTO of
Relbit | Predseda vpsFree.cz, o.s. | RHCE
http://relbit.com |
http://vpsfree.cz |
https://www.redhat.com
On 07/08/2013 12:01 PM, podpora(a)vpsFree.cz wrote:
Čas a datum výpadku: 2013-07-10 01:00 Očekavaná
délka: 60 minut
Výpadek se týká serverů: node1.prg, node2.prg, node3.prg,
node6.prg, node8.prg, node9.prg, backuper.prg, nasbox.prg,
router1.prg, router2.prg, node1.brq, node2.brq, node3.brq,
node4.brq, router1.brq, router2.brq Důvod: Update vsech systemu
Detailnější popis: Update na Scientific Linux 6.4 a nejnovejsi
OpenVZ kernel. Výpadek vykonává: Pavel Snajdr, Jakub Skokan
ENGLISH: Date and time: 2013-07-10 01:00
Estimated duration: 60
minutes What's affected: node1.prg, node2.prg, node3.prg,
node6.prg, node8.prg, node9.prg, backuper.prg, nasbox.prg,
router1.prg, router2.prg, node1.brq, node2.brq, node3.brq,
node4.brq, router1.brq, router2.brq Reason: Systems update
Performed by: Pavel Snajdr, Jakub Skokan
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJ0eXBlX2NzIjoiUGxhbm92YW55IiwidHlwZV9lbiI6IlBsYW5uZWQiLCJkYXRlIjoiMjAxMy0w
Ny0xMCAwMTowMCIsImR1cmF0aW9uIjoiNjAiLCJzZXJ2ZXJzIjpbIm5vZGUxLnByZyIsIm5vZGUy
Y2t1cGVyLnByZyIsIm5hc2JveC5wcmciLCJyb3V0ZXIxLnByZyIsInJvdXRlcjIucHJnIiwibm9k
LCJyb3V0ZXIyLmJycSJdLCJyZWFzb25fY3MiOiJVcGRhdGUgdnNlY2ggc3lzdGVtdSIsImRlc2Ny
cGVuVloga2VybmVsLiIsInJlYXNvbl9lbiI6IlN5c3RlbXMgdXBkYXRlIiwicGVyZm9ybWVkX2J5
-----END BASE64 ENCODED PARSEABLE JSON-----
_______________________________________________
Outage-list
mailing list Outage-list(a)lists.vpsfree.cz
http://lists.vpsfree.cz/listinfo/outage-list
_______________________________________________ Outage-list mailing
list Outage-list(a)lists.vpsfree.cz
-----BEGIN PGP
SIGNATURE-----
Version: GnuPG v1.4.12 (GNU/Linux)
Comment: Using GnuPG with Mozilla -
http://enigmail.mozdev.org/
iF4EAREIAAYFAlHc1fYACgkQMBKdi9lkZ6qPyAEAvftxYWOodem2nz4tuDGkPBl8
9ECXg8jSYbBa0t4TH+wA+gKqguqNP2ch95FYYCt40kjVuN0fxSVvllGXfE+0E71D
=FGiM
-----END PGP SIGNATURE-----