[vpsFree.cz: community-list] Zmeny inode numbers u souboru na FS

Pavel Snajdr snajpa at snajpa.net
Sat Mar 15 23:13:39 CET 2014


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

On 03/15/2014 11:08 PM, Pavel Snajdr wrote:
> No dobre, tak jeste teda nejdu spat, tak se trochu rozepisu a 
> vysvetlim, o co jde:
> 
> - kazdej kontejner je slozka na FS - coz znamena, ze abych mohl
> limitovat diskspace kontejneru, musel bych mit FS per kontejner,
> coz trochu drti nektery vyhody kontejneru (napr. agregace mista pri
> shared FS se proste neda udelat elegantneji)
> 
> V OpenVZ to vyresili tak, ze mezi ext*fs/xfs a "simfs" (simulovany
> fs kontejneru) vlozili vzquotu, coz je neco jako tabulka mapovani
> muj inode -> node na FS + accounting infromace o velikosti.
> 
> Diky tomu pak i funguje second-level quota (tzn. normalni linuxova 
> user/group quota) - coz je neco, co budeme muset do ZFS
> doimplementovat.
> 
> Nevyhoda vzquoty se pozna pri resetu systemu, kdyz nema cas si 
> syncnout ten mapujici soubor na disk. Pak musi vzquota pri startu 
> kazdyho kontejneru projit jeho soubory a znova je namapovat. To je 
> prave to, co ti muze rozhazet cisla inodu.
> 
> Bootovani serveru s vzquotou po resetu je pak tragedie a masina s
> 90 VPS muze naskakovat klidne 3-4 hodiny.
> 
> Krom toho je vzquota nachylna na random rozbijeni se i pres tu 
> kontrolu integrity, da se rozbit ze ukazuje min/vic zabranyho 
> mista/inodes, akorat nevim, jak k tomu dochazi (co je trigger toho 
> rozbiti), deje se to jenom zridkakdy.
> 
> Also, ukazalo se ze mit vic kontejneru na EXT4 je totalni blbost,
> v ext4 je nejfatalnejsi problem journal. Stane se bottleneckem
> celyho toho FS a proste neda se nic. Obzvlast, kdyz nad tim FS bezi
> par databazi. Iowait leti nahoru, disky seekujou jak pomateny a 
> propustnost filesystemu jde do kytek.
> 
> Oproti tomu node se ZFS ma tech 90 VPS nastartovanych do tak 10ti 
> minut jako absolutni maximum. A tech MySQL muze na serveru bezet,
> co zvlada CPU, protoze na synchronnni zapisy a fuckup unixovyho
> sveta jmenem sync() ma ZFS mechanismus jmenem Intent Log a moznost
> ho vysoupnout na dedikovany device. Oproti tomu ext4 ani s
> dedikovanym journalem na SSD nedela temer zadny rozdil. Pak uz
> disky tolik neseekujou, ale vykon porad nikde. Btw tahle
> "vlastnost" ext4ky donutila OpenVZ lidi implementovat ploop, takze
> pak delaji ext4 in a file per container. So much win! :)

Tady jeste doplnim, ze ty nody s ext4 maji SSDcka a Facebook
flashcache modul, tzn. nad RAID10 je flashcache, ktera dela writeback
na SSD.
Tzn. efektivne vsechny zapisy ext4 do journalu atd., to vsechno slo na
SSD odjakziva u nas, ale presto je to na ext4 tragicky pomaly.
Nejvic na to nadavam vzdycky, kdyz mam ted migrovat VPS ext4 server ->
ZFS server, jak lidem casem ty VPSky nakynuly, tak dostat je ze
zdrojovyho nodu je job na desitky hodin per VPS. Doslova mi to pak
pripada, jakoze ty VPSky s tim nodem srostly :)
Nastesti uz bude klid. ZFS.

/snajpa

> 
> Urcite budem dal pracovat na ZFS podpore, linuxovy filesystemy
> jsou jedna velka tragedie. Navic se diky tomu muzem zbavit ty
> tragedie vzquoty.
> 
> /snajpa
> 
> On 03/15/2014 10:55 PM, Pavel Snajdr wrote:
>> A na doplneni: na nodech se ZFS uz vzquota neni, tam se to dit 
>> nebude :)
> 
>> S pozdravem
> 
>> Pavel Snajdr
> 
>> +421 948 816 186  | +420 720 107 791          | 110-010-956 CTO
>> of Relbit     | Predseda vpsFree.cz, o.s. | RHCE
>> http://relbit.com | http://vpsfree.cz         |
>> https://www.redhat.com
> 
>> On 03/15/2014 10:52 PM, Ondrej Mikle wrote:
>>> Ahoj,
> 
>>> ma OpenVZ vlastnost, ze napriklad pri premigrovani kontejneru 
>>> nebo nejake jine zmene se taky zmeni inode numbers souboru na 
>>> filesystemu?
> 
>>> Ptam se proto, ze rkhunter to "spatne nese" a reportuje to. Pri
>>>  porovnani SHA256 checksumu s cistym systemem i s rpm --verify
>>>  checksumy sedi. Souboru se zmenenym inode je velka spousta,
>>> tim padem z predchoziho vyplyva, ze jde o spis false alarm.
> 
>>> Setkal se s tim i nekdo jiny?
> 
>>> Dik, Ondro
> 
> 
> 
>>> _______________________________________________ Community-list
>>>  mailing list Community-list at lists.vpsfree.cz 
>>> http://lists.vpsfree.cz/listinfo/community-list
> 
>> _______________________________________________ Community-list 
>> mailing list Community-list at lists.vpsfree.cz 
>> http://lists.vpsfree.cz/listinfo/community-list
> 
> _______________________________________________ Community-list
> mailing list Community-list at lists.vpsfree.cz 
> http://lists.vpsfree.cz/listinfo/community-list
> 
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1
Comment: Using GnuPG with Thunderbird - http://www.enigmail.net/

iF4EAREIAAYFAlMk0JMACgkQMBKdi9lkZ6qNPQD/fxDxVjrsR3lFonApxuZEOXhx
Co0tXW/gidlA9v1oQcwA/2B8IDSJeW0T+2IMD+hVMa9o4cIMVmNZVT0PBa8N0GfE
=SmMB
-----END PGP SIGNATURE-----



More information about the Community-list mailing list