<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div class="">Ahoj,</div>Já si myslím že to je rozumné - rollbackovat až když to slítne. Už aby ZFS přepsali celé do Rustu a vyhnuli se těm race conditions :D<div class=""><br class=""></div><div class="">Lukáš<br class=""><div class=""><br class=""><div><br class=""><blockquote type="cite" class=""><div class="">On 5 Aug 2019, at 12:25, Pavel Snajdr <<a href="mailto:snajpa@snajpa.net" class="">snajpa@snajpa.net</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta http-equiv="content-type" content="text/html; charset=utf-8" class=""><div dir="auto" class=""><div dir="ltr" class=""></div><div dir="ltr" class="">Cauko,</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">no, pri poslednim vserestartu jsme upgradovali ZFS z 0.8.0-rc2 na 0.8.1 “stable” release, jenze na nem hitujeme hned tri bugy, oproti rc2, kde nas netrapilo nic.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Nejvetsi WTF je toto:</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class=""><a href="https://github.com/zfsonlinux/zfs/issues/8673" class="">https://github.com/zfsonlinux/zfs/issues/8673</a></div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Tam jde o nejakou strasne nestastnou race condition, kterou dojde k tomu, ze objekt, do kteryho se zapisuje asynchronnima zapisama, je v jednu chvili z pohledu ZFS mensi, nez zapis, co do nej zamiri. Stane se to hlavne v noci, kdy se nejvic tlaci na ARC, aby promlela a pomenila svuj obsah na nekterych strojich i na nekolikrat.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Kdyz uz nehitneme tenhle PANIC, dojde jeste s mensi pravdepodobnosti k deadlocku; pravdepodobne za to muzou zmeny, ktere byly backportovany i do starsich releases, 0.7.11 a dal tim trpi taktez. Ale zatim se mi nepovedlo to dolovit, spis je to pro mne velka skola ZFS internals, takhle zblizka dovnitr jsem jeste videt nepotreboval. A s tim zamykanim dnodes vs. jemna interakce s ARC a ne uplne systematicky doresenou reclaim path, je to docela komplexni peklo na palici :)) Existuje totiz nekolik cest, odkud se oproti Solarisu i FreeBSD da na ZFS v jadre tlacit, aby uvolnilo pamet; nedostava to tak komplexni testovani, jak by melo. Dobrou zpravou je, ze na kazdy vetsi vyreseny WTF bug vznikaji testy a v pristich releasech by uz se to nemelo opakovat... Spatnou zpravou je, ze nad tak starym jadrem uz to neprovozujou ani v LLNL, takze vz nodu u nas uz se novejsi verze ZFS nejspis netykaji.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">No a posledni annoying bug je s paralelnim mountem vs. existujicimi nonempty mounty. Paralel mount kod se s neurcitosti dovede vysekat po namountovani dvou tri datasetu a zbytek proste nenamountuje. Tak se stalo uz nekolikrat, ze po resetu nabehnou na stroji jedna dve VPSky a zbytek nejde ani mountnout.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Takze jsme vsude nainstalovali zpatky 0.8.0-rc2.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Snazil jsem se nekolik dni prijit tem lockupum na kloub, ale dosel jsem na to, ze bude lepsi rollbacknout a venovat se dal nonzombie kernelum, tj. vpsAdminOS.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Otazka k diskuzi: pokud jsou to bugy, na kterych padaji stroje jednou za par dni, nepredvidatelne a jen pod velkou specifickou zatezi (vetsinou ten crash zpusobi rspamd proces), ma cenu rebootovat vsechno kvuli rollbacku na 0.8.0-rc2?</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Ja jsem zvolil strategii nechat to bezet a nechat nabehnout stroje na rc2 az po padu; je to na min celkoveho vypadku, ale mozna muze ten vypadek prijit v spatnou, denni, dobu.</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">Co si o tom myslite, v takovym pripade, rollbackovat vsechno, jen neco, nebo takhle?</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class="">/snajpa</div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class=""><br class=""></div><div dir="ltr" class=""><br class="">On 5 Aug 2019, at 05:43, zd nex <<a href="mailto:zdnexnet@gmail.com" class="">zdnexnet@gmail.com</a>> wrote:<br class=""><br class=""></div><blockquote type="cite" class=""><div dir="ltr" class=""><div dir="ltr" class=""><div class="">Ahojte,</div><div class=""><br class=""></div><div class="">zdá se že se nějak nyní množí výpadky ZFS, jsou tam teď nějaké problémy?<br class=""></div><div class=""><br class=""></div><div class=""><br class=""></div><div class="">Zdenek<br class=""></div></div>
</div></blockquote><blockquote type="cite" class=""><div dir="ltr" class=""><span class="">_______________________________________________</span><br class=""><span class="">Community-list mailing list</span><br class=""><span class=""><a href="mailto:Community-list@lists.vpsfree.cz" class="">Community-list@lists.vpsfree.cz</a></span><br class=""><span class=""><a href="http://lists.vpsfree.cz/listinfo/community-list" class="">http://lists.vpsfree.cz/listinfo/community-list</a></span><br class=""></div></blockquote></div>_______________________________________________<br class="">Community-list mailing list<br class=""><a href="mailto:Community-list@lists.vpsfree.cz" class="">Community-list@lists.vpsfree.cz</a><br class="">http://lists.vpsfree.cz/listinfo/community-list<br class=""></div></blockquote></div><br class=""></div></div></body></html>