Čas a datum výpadku: 2014-02-25 12:00
Očekavaná délka: 25 minut
Výpadek se týká serverů: node2.brq
Důvod: Kernel panic
Detailnější popis: Pad kernelu a nasledny restart serveru. Pravdepodobne rovnaka pricina ako naposledy node v PRG.
Výpadek vykonává: tomsDetaily o průběhu (pokud jsou): toms
ENGLISH:
Date and time: 2014-02-25 12:00
Estimated duration: 25 minutes
What's affected: node2.brq
Reason: Kernel panic and reboot of the server
Performed by: tomsProgress updates on: toms
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJ0eXBlX2NzIjoiTmVwbGFub3ZhbnkiLCJ0eXBlX2VuIjoiVW5wbGFubmVkIiwiZGF0ZSI6IjIw
MTQtMDItMjUgMTI6MDAiLCJkdXJhdGlvbiI6IjI1Iiwic2VydmVycyI6WyJub2RlMi5icnEiXSwi
cmVhc29uX2NzIjoiS2VybmVsIHBhbmljIiwiZGVzY3JpcHRpb25fY3MiOiJQYWQga2VybmVsdSBh
IG5hc2xlZG55IHJlc3RhcnQgc2VydmVydS4gUHJhdmRlcG9kb2JuZSByb3ZuYWthIHByaWNpbmEg
YWtvIG5hcG9zbGVkeSBub2RlIHYgUFJHLiIsInJlYXNvbl9lbiI6Iktlcm5lbCBwYW5pYyBhbmQg
cmVib290IG9mIHRoZSBzZXJ2ZXIiLCJwZXJmb3JtZWRfYnkiOiJ0b21zIiwicHJvZ3Jlc3NfdXBk
YXRlcyI6InRvbXMifQ==
-----END BASE64 ENCODED PARSEABLE JSON-----
Čas a datum výpadku: 2014-02-17 13:28
Očekavaná délka: 30 minut
Výpadek se týká serverů: node3.prg
Důvod: Disk failure + Linux RAID = fail
Detailnější popis: Odesel disk v node3, no linux raid1... typicky to s sebou vzalo celou masinu. :(
Výpadek vykonává: Pavel Snajdr
ENGLISH:
Date and time: 2014-02-17 13:28
Estimated duration: 30 minutes
What's affected: node3.prg
Reason: Disk failure + Linux RAID = fail
Performed by: Pavel Snajdr
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJ0eXBlX2NzIjoiTmVwbGFub3ZhbnkiLCJ0eXBlX2VuIjoiVW5wbGFubmVkIiwiZGF0ZSI6IjIw
MTQtMDItMTcgMTM6MjgiLCJkdXJhdGlvbiI6IjMwIiwic2VydmVycyI6WyJub2RlMy5wcmciXSwi
cmVhc29uX2NzIjoiRGlzayBmYWlsdXJlICsgTGludXggUkFJRCA9IGZhaWwiLCJkZXNjcmlwdGlv
bl9jcyI6Ik9kZXNlbCBkaXNrIHYgbm9kZTMsIG5vIGxpbnV4IHJhaWQxLi4uIHR5cGlja3kgdG8g
cyBzZWJvdSB2emFsbyBjZWxvdSBtYXNpbnUuIDooIiwicmVhc29uX2VuIjoiRGlzayBmYWlsdXJl
ICsgTGludXggUkFJRCA9IGZhaWwiLCJwZXJmb3JtZWRfYnkiOiJQYXZlbCBTbmFqZHIiLCJwcm9n
cmVzc191cGRhdGVzIjoiIn0=
-----END BASE64 ENCODED PARSEABLE JSON-----
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256
Ahojte,
node2 a node9 v Praze se nam pres noc skacely na stejnou chybu jadra,
pravdou je, ze tam to jadro bylo uz ne uplne aktualni a jakmile se
dosahne uptime s urcitou hodnotou, vypada to, ze nevydrzi a spadne.
Nastesti jsem vcera aktualizoval ty systemy a co spadlo, uz nabehlo do
novejsiho.
Ostatnim masinam budu muset naplanovat reboot na nejblizsi dobu, no
snad uz potom zas bude klid na delsi dobu jak tomu vzdycky tak je -
obcas nas OpenVZ vyvojari/kernelisti/ZFSisti nejakou chvili trolujou a
pak je najednou klid (nicmene se v trolovani pravidelne stridaji, holt
neco jako stabilni opensource je oxymoron). :)
S pozdravem
Pavel Snajdr
+421 948 816 186 | +420 720 107 791 | 110-010-956
CTO of Relbit | Predseda vpsFree.cz, o.s. | RHCE
http://relbit.com | http://vpsfree.cz | https://www.redhat.com
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1
Comment: Using GnuPG with Thunderbird - http://www.enigmail.net/
iF4EAREIAAYFAlL8ajoACgkQMBKdi9lkZ6ogOAD+PPbE11VpMW+8D+yJegQ/MkON
lBq3Mky/22SjtZDqRWQBALXKiQ1KBdT7G6K20QjfxmziEHCgo0yYUIIJahOjysgw
=pZtH
-----END PGP SIGNATURE-----