[vpsFree.cz: community-list] Vypadky Node5

Pavel Snajdr snajpa at snajpa.net
Tue Feb 10 11:03:59 CET 2015


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

Ahojte,

o vypadcich node5 vime a nenechavame to jen tak. Nicmene neni
jednoduche odladit, kde presne vznika problem, kdyz se ta masina
zasekne tak, ze ani stack trace z ni nejde vydolovat.

Nejlepsim resenim pro ted bude z nejvice postizenych stroju odhazet
kontejnery, ktere vyuzivaji nejvic RAM, na cisty stroj, ktery bych mel
dnes/zitra nainstalovat. Tim by melo mnozstvi problemu radove ustat.

Dalsi vec je, ze vsechny ty problemy resime s upstreamem, at uz s
vyvojari OpenVZ nebo ZFS, cili by se situace mela zlepsovat.

Pokud pro nekoho je (ted vcelku casty) restart problem, coz se ani
nedivim, ze problem je - neni potreba cekat, az pretece cise
trpelivosti, kdyz se clovek rozhlidne, node5 neni jediny server, co
mame a v clusteru mame taky stroje, ktere maji uptime aktualne 146 dni.

Z nejakeho duvodu se nam na node4.prg, node5.prg, node8.prg a
node2.brq seslo neco, co tomu jadru nedela dobre. Pred 7mi dny jsme na
nich aktualizovali jadro a ZFS patchnute o dlouhodobe resene problemy
se spravou pameti, na node8.prg a node2.brq to, zda se, problemy
vyresilo, ale node4.prg a node5.prg trpi problemy dal, pricemz node5
je na tom absolutne nejhur.

Pro ty z vas, kteri potrebuji situaci resit ASAP, piste na podporu,
popresouvame ty VPS na stabilnejsi stroje (a ano, je pravdepodobnost,
ze tim presunem i kontejner, ktery to shazuje tim, co dela - ale to by
bylo spis dobre, nez spatne, protoze budeme mit jasno).

K tomu, co pise Nikos - ano, dostupnost a garance jsou u nas "ozehave"
tema zhruba ve smyslu, jak to Nikos popisuje, ale v momente, kdy jsme
se s poctem clenu prehoupnuli pres pul tisicovky a mirime k tisicovce
cele, uz to tak jak tak, at jsme dobrovolne sdruzeni nebo ne, nejde
brat jen tak na lehkou vahu - problemy s jednim nebo izolovanym poctem
stroju pak hazi spatne svetlo na cele sdruzeni, zatim co stovky clenu
jsou spokojene, najde se par desitek, ktere jsme vypekli temi vypadky
a kteri o nas moc dobreho mezi lidmi nereknou - a to nechceme.

No a k poslednimu Nikove odstavci mam akorat aktualni zpravu :)

Jelikoz jsme se rozhodli ukoncit podnikani v Bratislave a zavrit
spolecnost Relbit, ktere jsem do ted venoval drtivou vetsinu casu, mel
jsem ted moznost se rozhodnout, co dal se sebou, jestli mam jit nekam
pracovat (vzhledem k me praxi za celkem slusne penize), nebo jestli
zkusit cestu "vetsiho punku" a jit delat vpsFree na full-time.

Tedy, situace se vyvinula tak, ze jsem se pred tydnem a neco konecne
zabydlel v Brne, aktualne se venuju rozbehani clusteru pro jednoho
zakaznika, ale jakmile to budu mit hotove, dostane to nase sdruzeni
moji maximalni pozornost. Cili odhadem cca 3-4 tydny a potom se budu
vpsFree venovat vicemene na plny uvazek - ale jelikoz by mne vpsFree
nezvladlo adekvatne zaplatit, musim si prave vyresit dalsi prijem k
tomu, proto mesicni zbrzdeni.

Mezitim vyplnuju bugy a komunikuju s vyvojari software, ktery
pouzivame a ktery ma nejvetsi problemy u nas, cili veci se hybou, ale
nez budu mit cas naplno se ponorit do Ccka a zdrojaku, ktere
pouzivame, bude to cca mesic trvat. Do te doby jako docasny workaround
rozbalancujeme zatez a popresouvame VPSka, jak to pujde + musime
posbirat dostatecne mnozstvi debug informaci, aby bylo od ceho se odrazit.

All in all, tyhle problemy mame, protoze nepouzivame zadny dobre znamy
stack software - kdybychom pouzivali KVM a jako storage LVM, to je
velmi dobre testovane (Red Hat na tom stavi byznys preci) a funguje
to, nicmene takovy pristup je IMHO prave vhodny pro komercni
poskytovatele, kteri potrebuji poskytnout sluzbu, zkasirovat a vic
neresit.

U nas je to o co nejlepsim sharovani tech HW prostredku, co uz jsme si
nakoupili, coz KVM ani trochu neumoznuje. V podstate to neumoznuje
zadna out-of-box dostupna technologie v Linuxu, proto se starame o
vlastni platformu. Vlastni platforma nam potom umoznuje delat kouzla a
integraci, jaka by s cizi (a plnou) virtualizaci nebyla vubec myslitelna.

Uz pred 6 lety jsem si myslel, ze jit cestou kontejneru, i kdyz
vsichni jdou cestou plne virtualizace, je ta spravna cesta pro nas.
Snahy o LXC a use-cases, pro ktere jsou podobne technologie mirene, to
akorat potvrzuji a ukazuje se, ze kontejnery jako technologie jsou
mnohem vhodnejsi pro typy workloadu, jako mame my. Chtel bych tohle
obhajit a dal byt prukopnikem v oblasti, chci, abychom technologie
spis rozvijeli a byli na spicce vyvoje, nez se jenom vezli a pouzivali
to nejposlednejsi a nejvic otestovane.

Samozrejme to znamena uplne jinou casovou narocnost a narocnost na
vedomosti, ale presne proto vpsFree.cz od zacatku aspon ja osobne
delam - silene mne to bavi. A ted mam prilezitost se tomu venovat na
plno.

Hodlam ji vyuzit a tesim se na ni.

S pozdravem / Best regards,

Pavel Snajdr

+421 948 816 186  | +420 720 107 791          | 110-010-956
CTO of Relbit     | Predseda vpsFree.cz, o.s. | RHCE
http://relbit.com | http://vpsfree.cz         | https://www.redhat.com

On 02/10/2015 10:04 AM, Nikos Timiopulos wrote:
> Ahoj,
> 
> tohle je trochu ožehavé téma. Mě samotného výpadky také trápi, ale
> na obranu vpsfree.cz je třeba si uvědomit, že to není komerční
> služba, kam lze volat a buzerovat v případě výpadků. Každý, kdo tu
> teď diskutujeme, jsme členem sdružení, platíme si za členství a v
> rámci tohoto členství máme k dispozici VPS. Podstatné ale je, že
> vpsfree se svým charakterem nedá s komerčními službami srovnávat,
> žádnou službu vlastně nenabízí, natož nějaké garance. S tím je
> třeba počítat a zahrnout do úvahy výhody/nevýhody. Pro provoz
> vysoce dostupné služby v tuto chvíli 1 VPS u vpsfree vhodná není.
> 
> Jako členové máme kromě odchodu možnost si pořídit další VPS v
> druhém datacentru Praha/Brno a zkusit nějakou replikaci (cenově za
> ten výkon to stále může vycházet výhodněji), nebo ideálně, což se
> právě děje, vyvolat diskuzi o příčinách a hledat řešení. A ještě
> lépe přímo na členské schůzi.
> 
> Nevím teď přesně, jaký je stav aktivních členů, kteří se starají o
> chod a vyvíjejí (podle odměn 6 lidí?), ale podle výše těch odměn to
> asi nikdo nedělá na fulltime, což by také mohlo hrát roli a já bych
> se pak nebál zvednout ruku pro investici právě do této oblasti.
> 
> 
> Nikos
> 
> 
> 
> 
> 
>> On 10 Feb 2015, at 08:46, Michal Zobec (ZOBEC Consulting) 
>> <michal.zobec.news at gmail.com
>> <mailto:michal.zobec.news at gmail.com>> wrote:
>> 
>> Ahoj,
>> 
>> Souhlasím, taky mi to už připadne nenormální … já k vám „přešel“ 
>> v listopadu. Mezitím začaly ty výpadky a tak nějak váhám jestli
>> mám dokončit migraci. Sice máte super cenu ale u konkurence tohle
>> fakt nezažívám …
>> 
>> 
>> 
>>>> 
>> s přátelským pozdravem | best regards
>> 
>> *Michal Zobec **| *Senior IT Consultant, Project Manager Mobil:
>> +420 608960987 | Email: michal at zobec.net
>> <mailto:michal at zobec.net> LinkedIn:
>> www.linkedin.com/in/michalzobec 
>> <http://www.linkedin.com/in/michalzobec> | Na volne noze:
>> www.navolnenoze.cz/prezentace/michal-zobec/ 
>> <http://www.navolnenoze.cz/prezentace/michal-zobec/>
>> 
>> *ZOBEC Consulting | *Renneska trida 12, 63900 Brno, Czech
>> Republic www.zobecconsulting.cz <http://www.zobecconsulting.cz/>
>> | www.michalzobec.cz <http://www.michalzobec.cz/> |
>> www.virtualnipc.cz <http://www.virtualnipc.cz/> LinkedIn:
>> www.linkedin.com/company/michal-zobec-lightning-group-company
>> <http://www.linkedin.com/company/michal-zobec-lightning-group-company>
>>
>>  <image002.jpg>
>> 
>> Plánovaná nepřítomnost | Planned absence (none) …
>> 
>> 
>> 
>> 
>> *From:* community-list-bounces at lists.vpsfree.cz 
>> <mailto:community-list-bounces at lists.vpsfree.cz> 
>> [mailto:community-list-bounces at lists.vpsfree.cz] *On Behalf Of
>> *Jiří Veruňák *Sent:* Tuesday, February 10, 2015 8:33 AM *To:*
>> vpsFree.cz Community list *Subject:* [vpsFree.cz: community-list]
>> Vypadky Node5
>> 
>> Ahoj,
>> 
>> uz drive tu nekdo zvedal reseni castych vypadku a pro me je to 
>> posledni zvolani po naprave. Jde o vypadky od zacatku roku Node5 
>> (10.2, 8.2, 25.1, 18.1) typicky to byla nedele dopoledne 20
>> minut. S kazdym vypadkem mi volaji klienti a takto to dal nejde.
>> Mam srovnani s konkurenci, kde na podobne sluzbe nebyl za
>> posledni 4 roky vypadek zadny, takze to lze a cleny si take
>> nevybiraji.
>> 
>> Drive se tu sklonovaly napady udelat stabilni Node s vybranymi
>> VPS. Nechci navrhovat reseni jen se snazim rict, ze si to zada
>> nejaky funkcni napravny krok nebo aspon jeden clen vas opusti z
>> duvodu kvality s produkcni VPS.
>> 
>> Jsem sam, kdo ma s kvalitou zasadni problem?
>> 
>> Diky za vyjadreni a s pozdravem Jirka Verunak 731 544 587 
>> _______________________________________________ Community-list
>> mailing list Community-list at lists.vpsfree.cz
>> <mailto:Community-list at lists.vpsfree.cz> 
>> http://lists.vpsfree.cz/listinfo/community-list
> 
> 
> 
> _______________________________________________ Community-list
> mailing list Community-list at lists.vpsfree.cz 
> http://lists.vpsfree.cz/listinfo/community-list
> 
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1

iF4EAREIAAYFAlTZ140ACgkQgRwOVqYrsFVdUAD/drif7rwW1B1D3tfMlpWe2Clq
X6ge4e6tPYOzUKFWDhEA/1te1mBEC/xJfne/qMP3geI+htQKkp2pFEtB2COXQHEr
=PBkl
-----END PGP SIGNATURE-----



More information about the Community-list mailing list