Datum a čas: 2024-07-30 01:05 CEST
Očekavaná délka: 35 minut
Oznámení se týká serverů: node6.brq
Typ odstávky: system_restart
Důvod: Reboot kvuli zaseknutemu arc_prune
Odstávku řeší: Pavel Šnajdr
arc_prune proces trefil bug, stroj musi byt restartovan
ENGLISH:
Date and time: 2024-07-30 01:05 CEST
Expected duration: 35 minutes
Affected systems: node6.brq
Maintenance type: system_restart
Reason: Reboot due to stuck arc_prune
Handled by: Pavel Šnajdr
arc_prune process hit a bug so the machine needs to be restarted
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJpZCI6MTEzMiwidHlwZSI6Im1haW50ZW5hbmNlIiwiYmVnaW5zX2F0Ijoi
MjAyNC0wNy0zMFQwMTowNTowMCswMjowMCIsImR1cmF0aW9uIjozNSwiaW1w
YWN0Ijoic3lzdGVtX3Jlc3RhcnQiLCJlbnRpdGllcyI6W3sibmFtZSI6Ik5v
ZGUiLCJpZCI6MjE1LCJsYWJlbCI6Im5vZGU2LmJycSJ9XSwiaGFuZGxlcnMi
OlsiUGF2ZWwgxaBuYWpkciJdLCJ0cmFuc2xhdGlvbnMiOnsiZW4iOnsic3Vt
bWFyeSI6IlJlYm9vdCBkdWUgdG8gc3R1Y2sgYXJjX3BydW5lIiwiZGVzY3Jp
cHRpb24iOiJhcmNfcHJ1bmUgcHJvY2VzcyBoaXQgYSBidWcgc28gdGhlIG1h
Y2hpbmUgbmVlZHMgdG8gYmUgcmVzdGFydGVkIn0sImNzIjp7InN1bW1hcnki
OiJSZWJvb3Qga3Z1bGkgemFzZWtudXRlbXUgYXJjX3BydW5lIiwiZGVzY3Jp
cHRpb24iOiJhcmNfcHJ1bmUgcHJvY2VzIHRyZWZpbCBidWcsIHN0cm9qIG11
c2kgYnl0IHJlc3RhcnRvdmFuIn19fQ==
-----END BASE64 ENCODED PARSEABLE JSON-----
Datum a čas: 2024-07-12 00:32 CEST
Očekavaná délka: 35 minut
Oznámení se týká serverů: node24.prg
Typ výpadku: system_reset
Důvod: Kernel bug
Výpadek řeší: Pavel Šnajdr, Jakub Skokan
Zrejme narazime na chyby v novem kodu planovace, ktere jeste nejsou vyresene v upstreamu.
ENGLISH:
Date and time: 2024-07-12 00:32 CEST
Expected duration: 35 minutes
Affected systems: node24.prg
Outage type: system_reset
Reason: Kernel bug
Handled by: Pavel Šnajdr, Jakub Skokan
There seem to be multiple bugs with the new scheduler code, which are not resolved yet.
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJpZCI6MTEzMCwidHlwZSI6Im91dGFnZSIsImJlZ2luc19hdCI6IjIwMjQt
MDctMTJUMDA6MzI6MDArMDI6MDAiLCJkdXJhdGlvbiI6MzUsImltcGFjdCI6
InN5c3RlbV9yZXNldCIsImVudGl0aWVzIjpbeyJuYW1lIjoiTm9kZSIsImlk
IjoxMjUsImxhYmVsIjoibm9kZTI0LnByZyJ9XSwiaGFuZGxlcnMiOlsiUGF2
ZWwgxaBuYWpkciIsIkpha3ViIFNrb2thbiJdLCJ0cmFuc2xhdGlvbnMiOnsi
ZW4iOnsic3VtbWFyeSI6Iktlcm5lbCBidWciLCJkZXNjcmlwdGlvbiI6IlRo
ZXJlIHNlZW0gdG8gYmUgbXVsdGlwbGUgYnVncyB3aXRoIHRoZSBuZXcgc2No
ZWR1bGVyIGNvZGUsIHdoaWNoIGFyZSBub3QgcmVzb2x2ZWQgeWV0LiJ9LCJj
cyI6eyJzdW1tYXJ5IjoiS2VybmVsIGJ1ZyIsImRlc2NyaXB0aW9uIjoiWnJl
am1lIG5hcmF6aW1lIG5hIGNoeWJ5IHYgbm92ZW0ga29kdSBwbGFub3ZhY2Us
IGt0ZXJlIGplc3RlIG5lanNvdSB2eXJlc2VuZSB2IHVwc3RyZWFtdS4ifX19
-----END BASE64 ENCODED PARSEABLE JSON-----
Datum a čas: 2024-07-01 07:15 CEST
Očekavaná délka: 50 minut
Oznámení se týká serverů: node23.prg
Typ výpadku: system_reset
Důvod: Vysoký loadavg a systém přestal reagovat
Výpadek řeší: Jakub Skokan
ENGLISH:
Date and time: 2024-07-01 07:15 CEST
Expected duration: 50 minutes
Affected systems: node23.prg
Outage type: system_reset
Reason: High loadavg and the system stopped responding
Handled by: Jakub Skokan
-----BEGIN BASE64 ENCODED PARSEABLE JSON-----
eyJpZCI6MTEyNiwidHlwZSI6Im91dGFnZSIsImJlZ2luc19hdCI6IjIwMjQt
MDctMDFUMDc6MTU6MDArMDI6MDAiLCJkdXJhdGlvbiI6NTAsImltcGFjdCI6
InN5c3RlbV9yZXNldCIsImVudGl0aWVzIjpbeyJuYW1lIjoiTm9kZSIsImlk
IjoxMjQsImxhYmVsIjoibm9kZTIzLnByZyJ9XSwiaGFuZGxlcnMiOlsiSmFr
dWIgU2tva2FuIl0sInRyYW5zbGF0aW9ucyI6eyJlbiI6eyJzdW1tYXJ5Ijoi
SGlnaCBsb2FkYXZnIGFuZCB0aGUgc3lzdGVtIHN0b3BwZWQgcmVzcG9uZGlu
ZyIsImRlc2NyaXB0aW9uIjoiIn0sImNzIjp7InN1bW1hcnkiOiJWeXNva8O9
IGxvYWRhdmcgYSBzeXN0w6ltIHDFmWVzdGFsIHJlYWdvdmF0IiwiZGVzY3Jp
cHRpb24iOiIifX19
-----END BASE64 ENCODED PARSEABLE JSON-----