-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA256
Ahojte,
o vypadcich node5 vime a nenechavame to jen tak. Nicmene neni jednoduche odladit, kde presne vznika problem, kdyz se ta masina zasekne tak, ze ani stack trace z ni nejde vydolovat.
Nejlepsim resenim pro ted bude z nejvice postizenych stroju odhazet kontejnery, ktere vyuzivaji nejvic RAM, na cisty stroj, ktery bych mel dnes/zitra nainstalovat. Tim by melo mnozstvi problemu radove ustat.
Dalsi vec je, ze vsechny ty problemy resime s upstreamem, at uz s vyvojari OpenVZ nebo ZFS, cili by se situace mela zlepsovat.
Pokud pro nekoho je (ted vcelku casty) restart problem, coz se ani nedivim, ze problem je - neni potreba cekat, az pretece cise trpelivosti, kdyz se clovek rozhlidne, node5 neni jediny server, co mame a v clusteru mame taky stroje, ktere maji uptime aktualne 146 dni.
Z nejakeho duvodu se nam na node4.prg, node5.prg, node8.prg a node2.brq seslo neco, co tomu jadru nedela dobre. Pred 7mi dny jsme na nich aktualizovali jadro a ZFS patchnute o dlouhodobe resene problemy se spravou pameti, na node8.prg a node2.brq to, zda se, problemy vyresilo, ale node4.prg a node5.prg trpi problemy dal, pricemz node5 je na tom absolutne nejhur.
Pro ty z vas, kteri potrebuji situaci resit ASAP, piste na podporu, popresouvame ty VPS na stabilnejsi stroje (a ano, je pravdepodobnost, ze tim presunem i kontejner, ktery to shazuje tim, co dela - ale to by bylo spis dobre, nez spatne, protoze budeme mit jasno).
K tomu, co pise Nikos - ano, dostupnost a garance jsou u nas "ozehave" tema zhruba ve smyslu, jak to Nikos popisuje, ale v momente, kdy jsme se s poctem clenu prehoupnuli pres pul tisicovky a mirime k tisicovce cele, uz to tak jak tak, at jsme dobrovolne sdruzeni nebo ne, nejde brat jen tak na lehkou vahu - problemy s jednim nebo izolovanym poctem stroju pak hazi spatne svetlo na cele sdruzeni, zatim co stovky clenu jsou spokojene, najde se par desitek, ktere jsme vypekli temi vypadky a kteri o nas moc dobreho mezi lidmi nereknou - a to nechceme.
No a k poslednimu Nikove odstavci mam akorat aktualni zpravu :)
Jelikoz jsme se rozhodli ukoncit podnikani v Bratislave a zavrit spolecnost Relbit, ktere jsem do ted venoval drtivou vetsinu casu, mel jsem ted moznost se rozhodnout, co dal se sebou, jestli mam jit nekam pracovat (vzhledem k me praxi za celkem slusne penize), nebo jestli zkusit cestu "vetsiho punku" a jit delat vpsFree na full-time.
Tedy, situace se vyvinula tak, ze jsem se pred tydnem a neco konecne zabydlel v Brne, aktualne se venuju rozbehani clusteru pro jednoho zakaznika, ale jakmile to budu mit hotove, dostane to nase sdruzeni moji maximalni pozornost. Cili odhadem cca 3-4 tydny a potom se budu vpsFree venovat vicemene na plny uvazek - ale jelikoz by mne vpsFree nezvladlo adekvatne zaplatit, musim si prave vyresit dalsi prijem k tomu, proto mesicni zbrzdeni.
Mezitim vyplnuju bugy a komunikuju s vyvojari software, ktery pouzivame a ktery ma nejvetsi problemy u nas, cili veci se hybou, ale nez budu mit cas naplno se ponorit do Ccka a zdrojaku, ktere pouzivame, bude to cca mesic trvat. Do te doby jako docasny workaround rozbalancujeme zatez a popresouvame VPSka, jak to pujde + musime posbirat dostatecne mnozstvi debug informaci, aby bylo od ceho se odrazit.
All in all, tyhle problemy mame, protoze nepouzivame zadny dobre znamy stack software - kdybychom pouzivali KVM a jako storage LVM, to je velmi dobre testovane (Red Hat na tom stavi byznys preci) a funguje to, nicmene takovy pristup je IMHO prave vhodny pro komercni poskytovatele, kteri potrebuji poskytnout sluzbu, zkasirovat a vic neresit.
U nas je to o co nejlepsim sharovani tech HW prostredku, co uz jsme si nakoupili, coz KVM ani trochu neumoznuje. V podstate to neumoznuje zadna out-of-box dostupna technologie v Linuxu, proto se starame o vlastni platformu. Vlastni platforma nam potom umoznuje delat kouzla a integraci, jaka by s cizi (a plnou) virtualizaci nebyla vubec myslitelna.
Uz pred 6 lety jsem si myslel, ze jit cestou kontejneru, i kdyz vsichni jdou cestou plne virtualizace, je ta spravna cesta pro nas. Snahy o LXC a use-cases, pro ktere jsou podobne technologie mirene, to akorat potvrzuji a ukazuje se, ze kontejnery jako technologie jsou mnohem vhodnejsi pro typy workloadu, jako mame my. Chtel bych tohle obhajit a dal byt prukopnikem v oblasti, chci, abychom technologie spis rozvijeli a byli na spicce vyvoje, nez se jenom vezli a pouzivali to nejposlednejsi a nejvic otestovane.
Samozrejme to znamena uplne jinou casovou narocnost a narocnost na vedomosti, ale presne proto vpsFree.cz od zacatku aspon ja osobne delam - silene mne to bavi. A ted mam prilezitost se tomu venovat na plno.
Hodlam ji vyuzit a tesim se na ni.
S pozdravem / Best regards,
Pavel Snajdr
+421 948 816 186 | +420 720 107 791 | 110-010-956 CTO of Relbit | Predseda vpsFree.cz, o.s. | RHCE http://relbit.com | http://vpsfree.cz | https://www.redhat.com
On 02/10/2015 10:04 AM, Nikos Timiopulos wrote:
Ahoj,
tohle je trochu ožehavé téma. Mě samotného výpadky také trápi, ale na obranu vpsfree.cz je třeba si uvědomit, že to není komerční služba, kam lze volat a buzerovat v případě výpadků. Každý, kdo tu teď diskutujeme, jsme členem sdružení, platíme si za členství a v rámci tohoto členství máme k dispozici VPS. Podstatné ale je, že vpsfree se svým charakterem nedá s komerčními službami srovnávat, žádnou službu vlastně nenabízí, natož nějaké garance. S tím je třeba počítat a zahrnout do úvahy výhody/nevýhody. Pro provoz vysoce dostupné služby v tuto chvíli 1 VPS u vpsfree vhodná není.
Jako členové máme kromě odchodu možnost si pořídit další VPS v druhém datacentru Praha/Brno a zkusit nějakou replikaci (cenově za ten výkon to stále může vycházet výhodněji), nebo ideálně, což se právě děje, vyvolat diskuzi o příčinách a hledat řešení. A ještě lépe přímo na členské schůzi.
Nevím teď přesně, jaký je stav aktivních členů, kteří se starají o chod a vyvíjejí (podle odměn 6 lidí?), ale podle výše těch odměn to asi nikdo nedělá na fulltime, což by také mohlo hrát roli a já bych se pak nebál zvednout ruku pro investici právě do této oblasti.
Nikos
On 10 Feb 2015, at 08:46, Michal Zobec (ZOBEC Consulting) <michal.zobec.news@gmail.com mailto:michal.zobec.news@gmail.com> wrote:
Ahoj,
Souhlasím, taky mi to už připadne nenormální … já k vám „přešel“ v listopadu. Mezitím začaly ty výpadky a tak nějak váhám jestli mám dokončit migraci. Sice máte super cenu ale u konkurence tohle fakt nezažívám …
…
s přátelským pozdravem | best regards
*Michal Zobec **| *Senior IT Consultant, Project Manager Mobil: +420 608960987 | Email: michal@zobec.net mailto:michal@zobec.net LinkedIn: www.linkedin.com/in/michalzobec http://www.linkedin.com/in/michalzobec | Na volne noze: www.navolnenoze.cz/prezentace/michal-zobec/ http://www.navolnenoze.cz/prezentace/michal-zobec/
*ZOBEC Consulting | *Renneska trida 12, 63900 Brno, Czech Republic www.zobecconsulting.cz http://www.zobecconsulting.cz/ | www.michalzobec.cz http://www.michalzobec.cz/ | www.virtualnipc.cz http://www.virtualnipc.cz/ LinkedIn: www.linkedin.com/company/michal-zobec-lightning-group-company http://www.linkedin.com/company/michal-zobec-lightning-group-company
<image002.jpg>
Plánovaná nepřítomnost | Planned absence (none) …
*From:* community-list-bounces@lists.vpsfree.cz mailto:community-list-bounces@lists.vpsfree.cz [mailto:community-list-bounces@lists.vpsfree.cz] *On Behalf Of *Jiří Veruňák *Sent:* Tuesday, February 10, 2015 8:33 AM *To:* vpsFree.cz Community list *Subject:* [vpsFree.cz: community-list] Vypadky Node5
Ahoj,
uz drive tu nekdo zvedal reseni castych vypadku a pro me je to posledni zvolani po naprave. Jde o vypadky od zacatku roku Node5 (10.2, 8.2, 25.1, 18.1) typicky to byla nedele dopoledne 20 minut. S kazdym vypadkem mi volaji klienti a takto to dal nejde. Mam srovnani s konkurenci, kde na podobne sluzbe nebyl za posledni 4 roky vypadek zadny, takze to lze a cleny si take nevybiraji.
Drive se tu sklonovaly napady udelat stabilni Node s vybranymi VPS. Nechci navrhovat reseni jen se snazim rict, ze si to zada nejaky funkcni napravny krok nebo aspon jeden clen vas opusti z duvodu kvality s produkcni VPS.
Jsem sam, kdo ma s kvalitou zasadni problem?
Diky za vyjadreni a s pozdravem Jirka Verunak 731 544 587 _______________________________________________ Community-list mailing list Community-list@lists.vpsfree.cz mailto:Community-list@lists.vpsfree.cz http://lists.vpsfree.cz/listinfo/community-list
_______________________________________________ Community-list mailing list Community-list@lists.vpsfree.cz http://lists.vpsfree.cz/listinfo/community-list