[vpsFree.cz: community-list] Vypadky a problemy - checklist

Pavel Snajdr snajpa at snajpa.net
Wed Apr 2 13:06:22 CEST 2014


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

On 04/02/2014 12:08 PM, Pavel Snajdr wrote:
> A btw hlavni vyhoda ukladani dumpu po siti - nepotrebuju ten node 
> nejak rozdejchavat na to, abych mohl zacit analyzovat dump.
> 
> Kdyz se mi povede vymyslet, co ted vymejslim s Infinibandem a 
> distribuovanym replikovanim ZFS, tak by se to melo projevit naplno 
> jako vyhoda - VPS budou nekde nabihat, zatim co ja muzu
> analyzovat, proc to sletelo a nekdo jinej muze davat dokupy ten
> server primo (ssh/reseni se supportem v DC/...).
> 
> Kdezto s lokalnim kdumpem musim vzdycky tu masinu privyst k zivotu
> a pak z toho tech 256GB vytahnout na misto, kde budu mit a] toolset
> b] dost RAM na analyzu. Ted si predstav tahat to ven z nodu po
> gigabitu...

Jeste ke kdumpum a proc ma smysl je delat:

Diky tomu, ze budeme mit kompletni image ram z momentu padu serveru
(pripadne se da dump vyvolat i pri zfs deadlocku atd.), jsme schopny
potom post-mortem cokoliv dohledat a dodebugovat. Odpada tim nutnost
na milionkrat se snazit ten bug reprodukovat.

A kdyz budeme pracovat ve spolupraci s lidma od OpenVZ / ZFS / Red
Hatu, coz postupne zacinam minimalne ja osobne vic a vic (myslim ze
muj nick uz znaji celkem duverne :D) delat, umozni nam to prijit k
pomyslnymu stolu vyvoje tech opensource projektu, co nas zajimaji, s
cennyma debug informacema na, ktery urychly zasadne hledani problemu.

Takze v tom vidim nejenom nutnost, ale v podstate i metodu, jak pomoct
nejenom sobe, ale i celymu ekosystemu.

/snajpa

> 
> /snajpa
> 
> On 04/02/2014 12:01 PM, Pavel Snajdr wrote:
>> On 04/02/2014 11:58 AM, Stanislav Petr wrote:
>>> Tak vytvorit servisni oddil na nejakym stavajicim disku nebo 
>>> zkusit zauvazovat nad pouzitim USB3 externi flash (sileny, ja 
>>> vim, ale mohlo by to fungovat levne).
> 
>> Vsak prave, ze uz jsem varianty zvazoval a vzhledem k tomu, ze
>> 10GE se blizi tak jako tak. 1GE je tragicky malo, navic pri
>> zalohach uz 1GE dneska je limit, "zejtra" bude totalni limit pri
>> prechodu z rsyncu na zfs send/receive - pak budou zalohy,
>> restory, migrace opravdu vyuzivat to, ze budou sedet na rychly
>> siti.
> 
>> Abych udelal misto na 256GB blbosti lokalne na kazdym nodu,
>> musel bych vyrazne zmensit cast SSD, ktera se pouziva pro level 2
>> read caching (a to se hodne pozna v momentech, kdy je na tom
>> stroji min ramky, nez je idealni).
> 
>> Delani mista na rotacnich diskach je blbost, protoze by to 
>> rozhodilo tvar celyho zpoolu.
> 
>> Tak nejak mi nevysla jina moznost, nez NFSv3+10GE...
> 
>> /snajpa
> 
> 
>>> Stanislav Petr Tel.: +420 602 620 026
> 
>>> -----Original Message----- From: 
>>> community-list-bounces at lists.vpsfree.cz 
>>> [mailto:community-list-bounces at lists.vpsfree.cz] On Behalf Of 
>>> Pavel Snajdr Sent: Wednesday, April 02, 2014 11:55 AM To: 
>>> vpsFree.cz Community list Subject: Re: [vpsFree.cz: 
>>> community-list] Vypadky a problemy - checklist
> 
>>> Disk uz neni kam dat :)
> 
>>> S pozdravem
> 
>>> Pavel Snajdr
> 
>>> +421 948 816 186  | +420 720 107 791          | 110-010-956
>>> CTO of Relbit     | Predseda vpsFree.cz, o.s. | RHCE 
>>> http://relbit.com | http://vpsfree.cz         | 
>>> https://www.redhat.com
> 
>>> On 04/02/2014 11:49 AM, Stanislav Petr wrote:
>>>> Hele k tomu kdumpu a zfs. Jednoduchy a elegantni reseni - 
>>>> budto pridat jeden disk nebo oddil s EXT a ten vyhradit pro 
>>>> kdump. Tim ti odpadne problém se zapisovanim kdumpu do zfs 
>>>> kterej není podporovanej.
> 
>>>> Stanislav Petr Tel.: +420 602 620 026
> 
>>>> -----Original Message----- From: 
>>>> community-list-bounces at lists.vpsfree.cz 
>>>> [mailto:community-list-bounces at lists.vpsfree.cz] On Behalf Of
>>>>  Pavel Snajdr Sent: Wednesday, April 02, 2014 11:38 AM To: 
>>>> vpsFree.cz Community list Subject: [vpsFree.cz: 
>>>> community-list] Vypadky a problemy - checklist
> 
>>>> Caute,
> 
>>>> vim, ze nekteri trpite zhruba stejne, jako ja, tak jak jsme
>>>> na tom ted, a jak dlouho nas ten shitstorm jeste ceka, nez 
>>>> pomine?
> 
>>>> padajici ipv6: bird, snad pobezi, uvidime dal,
> 
>>>> prichozi ddosy: in progress, cosi se mozna rysuje ve
>>>> spolupraci s Master Internet, nebo pripadne custom solution s
>>>> BGP blackholingem,
> 
>>>> kernel panic: ted je tam kernel, kterej pres vsechny jeho 
>>>> chyby pokud vim na panic nepada, takze od nej je klid a
>>>> dalsi kernel uz by mel projit lepsim testovanim, nez ho
>>>> nasadime,
> 
>>>> zfs deadlock: po poupdatovani codebase napric vsema
>>>> serverama se mi uz dari chytit stabilni ZFS setup na vsech
>>>> nodech, takze se ZFS uz nebudou problemy (dokud se s nim zase
>>>> nerozhodneme delat psi kusy, ale to pujde uz pres QA masinu)
> 
>>>> QA: minimalne jsem se dost nastval na to, aby mi nevadilo, ze
>>>>  vyhodime jednu velkou silnou masinu na testovani, takze 
>>>> ohledne QA se veci snad taky pohnou.
> 
>>>> kdump: potrebujeme 10GE infratrukturu po ktery sbirat memory
>>>>  dumpy odpadlejch nodu, bez toho je kdump celkem useless,
> 
> 
>>>> -> seznam je to nepekne nekratkej, nastesti vsechno uz ve 
>>>> stavu pri nejhorsim "znam reseni", no uz by se na nej
>>>> nemuselo nic chvili pridavat, protoze jinak uz mne z toho
>>>> chytaji infarktovy stavy... Navic mam tuseni, ze hranice
>>>> trpelivosti, nez zacnou lidi hromadne migrovat veci pryc, je
>>>> tak nejak blizko a ted uz to proste musi vsechno bezet bez
>>>> problemu, i za cenu odlozeni nejakych inovaci na par mesicu.
> 
>>>> _______________________________________________
>>>> Community-list mailing list Community-list at lists.vpsfree.cz 
>>>> http://lists.vpsfree.cz/listinfo/community-list
> 
> 
> 
>>>> _______________________________________________
>>>> Community-list mailing list Community-list at lists.vpsfree.cz 
>>>> http://lists.vpsfree.cz/listinfo/community-list
> 
>>> _______________________________________________ Community-list
>>>  mailing list Community-list at lists.vpsfree.cz 
>>> http://lists.vpsfree.cz/listinfo/community-list
> 
> 
> 
>>> _______________________________________________ Community-list
>>>  mailing list Community-list at lists.vpsfree.cz 
>>> http://lists.vpsfree.cz/listinfo/community-list
> 
>> _______________________________________________ Community-list 
>> mailing list Community-list at lists.vpsfree.cz 
>> http://lists.vpsfree.cz/listinfo/community-list
> 
> _______________________________________________ Community-list
> mailing list Community-list at lists.vpsfree.cz 
> http://lists.vpsfree.cz/listinfo/community-list
> 
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1
Comment: Using GnuPG with Thunderbird - http://www.enigmail.net/

iF4EAREIAAYFAlM77y4ACgkQMBKdi9lkZ6pWjwD/a0qiAdOAazaq+hv8fRmyV3QA
WD3f7xQ+f/e2tfarq1QA/iBX6gfs28bZohfP91rO1a04zPGJpkgyufh530LDYPKe
=73NH
-----END PGP SIGNATURE-----



More information about the Community-list mailing list