Čas a datum výpadku: 2012-02-04 19:21
Očekavaná délka: 60 minut
Výpadek se týká serverů: epsilon
Důvod: Prehrati serveru
Detailnější popis: Server se zase prehral a umrel.
V Platonu nikdo nezveda telefon.
Remote management serveru neni dostupny.
Výpadek vykonává: Pavel Snajdr
ENGLISH:
Date and time: 2012-02-04 19:21
Estimated duration: 60 minutes
What's affected: epsilon
Reason: Server overheat
Performed by: Pavel Snajdr
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJ0eXBlX2NzIjoiTmVwbGFub3ZhbnkiLCJ0eXBlX2VuIjoiVW5wbGFubmVkIiwiZGF0ZSI6IjIw
MTItMDItMDQgMTk6MjEiLCJkdXJhdGlvbiI6IjYwIiwic2VydmVycyI6WyJlcHNpbG9uIl0sInJl
YXNvbl9jcyI6IlByZWhyYXRpIHNlcnZlcnUiLCJkZXNjcmlwdGlvbl9jcyI6IlNlcnZlciBzZSB6
YXNlIHByZWhyYWwgYSB1bXJlbC5cclxuXHJcblYgUGxhdG9udSBuaWtkbyBuZXp2ZWRhIHRlbGVm
b24uXHJcblxyXG5SZW1vdGUgbWFuYWdlbWVudCBzZXJ2ZXJ1IG5lbmkgZG9zdHVwbnkuIiwicmVh
c29uX2VuIjoiU2VydmVyIG92ZXJoZWF0IiwicGVyZm9ybWVkX2J5IjoiUGF2ZWwgU25hamRyIiwi
cHJvZ3Jlc3NfdXBkYXRlcyI6IiJ9
-----END BASE64 ENCODED PARSEABLE JSON-----
Čas a datum výpadku: 2012-02-03 19:12
Očekavaná délka: 30 minut
Výpadek se týká serverů: node3a
Důvod: problem s alokaci pameti
Detailnější popis:
Výpadek vykonává: Jakub Skokan
ENGLISH:
Date and time: 2012-02-03 19:12
Estimated duration: 30 minutes
What's affected: node3a
Reason: memory allocation problem
Performed by: Jakub Skokan
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJ0eXBlX2NzIjoiTmVwbGFub3ZhbnkiLCJ0eXBlX2VuIjoiVW5wbGFubmVkIiwiZGF0ZSI6IjIw
MTItMDItMDMgMTk6MTIiLCJkdXJhdGlvbiI6IjMwIiwic2VydmVycyI6WyJub2RlM2EiXSwicmVh
c29uX2NzIjoicHJvYmxlbSBzIGFsb2thY2kgcGFtZXRpIiwiZGVzY3JpcHRpb25fY3MiOiIiLCJy
ZWFzb25fZW4iOiJtZW1vcnkgYWxsb2NhdGlvbiBwcm9ibGVtIiwicGVyZm9ybWVkX2J5IjoiSmFr
dWIgU2tva2FuIiwicHJvZ3Jlc3NfdXBkYXRlcyI6IiJ9
-----END BASE64 ENCODED PARSEABLE JSON-----
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256
Ahoj,
jedna z poslednich opozdenych outage zprav bez jednotneho formatu:
Dneska v noci probehne reboot vsech serveru v Praze - bezpecnostni
update + prepojeni z EU power socketu na APC PDU pod 2 ruzne jistice.
Ocekavany zacatek rebootu: 22:00
Ocekavany vypadek per node: 10-60 minut (muzeme narazit na fsck, coz
bude zdrzovat nabeh, uz abychom meli ext4 vsude...)
- --
Pavel Snajdr
+420 720 107 791
http://vpsfree.cz
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.11 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
iF4EAREIAAYFAk8jv1EACgkQdh+64ds5DabcIAD/bYWuF5r/7LkuCQps/OYHEHQC
t/zJwiIxMx5nMRYTK4kBAO9vrC15nDbrNTFlsmqnwN7zmMoppKU0eaN9KnCq/X3X
=EVQ6
-----END PGP SIGNATURE-----
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256
$high-IO
To je tak, kdyz asi 150 procesu chce najednou pristoupit k disku... to
nemame sanci stihat.
https://prasiatko.vpsfree.cz/munin/vpsfree.cz/praha-node2b.vpsfree.cz/cpu.h…
Uz to zas nabiha.
- --
Pavel Snajdr
+420 720 107 791
http://vpsfree.cz
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.11 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
iF4EAREIAAYFAk8UjN0ACgkQdh+64ds5DaaJ+QEAtAXejVolVAI/3SfbWJ7pcS1F
DOkF8bVRgBF+FUD2I2oBAN7qg2vTjeXy3AcWLAr/VPootwyEKDrwLZaZU1doOHL6
=wU3l
-----END PGP SIGNATURE-----