E gata! High Availability, politica de backup globala… shared storage, “vmotion”… totul in 30Wh intr-o stare de aproape idle. Proxmox Cluster în Sfârșit: 3 Noduri, NFS și Consumul de Curent “Eco-Friendly”

După lungi aventuri și cafele încărcate cu speranță, am reușit: am un cluster Proxmox funcțional!

Hardware-ul

“Clusterul” e compus din trei noduri, cu nume de scenă pve00, pve01 și pve02. Iată rolurile fiecăruia:

  • pve00: E ca acel coleg care nu face prea multe, dar e indispensabil. Acesta va fi nodul martor (“witness”) și va oferi storage shared pe NFS pentru câteva VM-uri.
  • pve01 și pve02: Adevărații clusterului, gazduind VM-uri și containere LXC.

Toate acestea rulează pe trei mini PC-uri Lenovo Tiny (m710q și m715q), care sunt ca niște chihuahua hiperactive: mici, dar cu o energie neașteptată. 4CPU si 32GB ram fiecare. Pare putin dar este suficient pentru laboratorare.

cluster

Consumul de energie

Cu tot clusterul „aproape idle”, consumul total de curent este de doar 28-32W. Aproape că te aștepți să vezi un LED aprins și să îți spui: „Esti sigur că merge totul? Nu e doar screensaver-ul?”.

Funcționalitate

Am testat aproape toate funcțiile basic pe care le-am folosit anterior în VMware. Rezultatul? Totul functioneaza ca uns, ca in oil overload. Nu ma asteptam sa fie asa de bine pus la punct… Singurul regret? Ceph. Ar fi fost interesant, dar sunt limitat de un număr insuficient de discuri. (Așa-i când visezi la mamaliga, dar nu ai malai.)

Migrarile de pe un host pe altul: cand VM-ul nu este pe shared storage va fi copiat disk-ul pe storage-ul vecin si memory state. 1-2 pinguri se pierd. Cand este pe shared storage se copiaza doar ram-ul… cand este protejat de HA doar mentioneaza ca migreaza prin HA si nu mai arata altceva.

HA – la fel ca Vmware, se restarteaza vm-ul pe unu din serverele care mai exista si se pune in fencing pe cel care e mort in papushoi.

Hotplug: CPU, RAM, DISK, USB… Network. Cam tot de ce ai nevoie.

Shared storage

Merge cam orice ai: NFS, CIFS, ISCSI, SCSI, FC, GlusterFS, Ceph, ZFS, etc. Am testat cu NFS si CIFS.

Storage pe NFS

Pentru storage-ul shared, am configurat un VM cu NFS pe pve00. Deși nu e cea mai rapidă soluție, și-a făcut treaba impecabil pentru nevoile noastre. VM-urile și containerele sunt mulțumite si am putut porni High Availability.

Am testat OpenMediaVault (OMV) ca soluție de storage, dar mi s-a părut lent comparativ cu așteptările. Ma asteptam sa umplu gigabitul ala dar testele erau undeva intre 78-89 MB/s, TrueNAS cu aceleasi disk-uri este constant, undeva peste 110MB/s. Se poate sa fie nevoie de tuning suplimentar pe OMV.

Tot pe NFS am configurat si Backup-urile VM-urilor mai importante, aici fiind avantajos ca avem o politica globala.

Ce urmează?

Anunț oficial „Next Episode”: TrueNAS – Virtualizare pe Proxmox? Stay tuned!

Până atunci, rămâneți curioși, caffeinați și gata de experimente. Mai avem multe de descoperit în lumea homelab-ului!

De cateva luni m-am apucat sa invat Kubernetes, Docker. Am avut nevoie de un sandbox, ceva mai sofisticat decat statia mea cu windows 11, care ar fi ajuns bine-mersi ca resurse. Ideea mea era un HomeLab setup care sa aiba un pic de redundanta, sa stea in priza 24/7, sa consume decent si sa pot sa imi ridic 10-20-30 vm-uri cu linux pe care sa incerc sa invat K8S. Sa pot sa sterg tot si sa o iau de la inceput.

proxmox

Am inceput cu un Lenovo M715q. Am pus pe el proxmox. Puteam rula VM-uri si LXC-uri iar sistemul atata vreme cat nu trageam de el era destul de silentios. Cu cateva VM-uri pornite (un ubuntu cu apache/php/mysql, un HomeAssistant os, 2 windows 2022) manca in idle cam 7W. 7W si puteai sa dormi langa el.

Cred ca postul asta este mai mult despre ProxMox… Am descoperit ca are backups, folosind politici, out of the box. Great! Puteam scrie backup-urile dupa un schedule, automat, intr-un disk de backup. Super tare, ESXi nu avea asta. ill.ro sta pe proxmox si are si backup-uri, plus homeassistant, care are si el backup-uri. Minunat!

Daca pana acum foloseai VMware ESXi pentru homelab sfatul meu este sa incerci proxmox. Folosesc vmware din 2008 si am fost certificat VCP de la versiunea 4.5 la 6.5, am ceva background pe VMware dar e clar ca Proxmox PVE este excelent, si cred ca este indeajuns de bun sa il pun si pe un mediu de productie. Are cam tot ce avea ESXi si inca niste plusuri, nici nu mai mentionez costul care este mult mai mic!

Pasii urmatori: cluster si shared storage.

Companiile mari cumpara companii mici. Private Equity funds investesc in companii mici… De atunci business-ul se schimba si conteaza ROI-ul alora care pompeaza bani in compania mica care a putut pana nu a mai putut ca era prea scump, sau a crescut prea mult. S-a scumpit PRTG – ce alternative ai?

Paessler e una din companiile astea.

Paessler are un produs matur pentru monitorizarea infrastructurilor it. Un produs super decent. Costul se facea la senzori monitorizati (1 senzor era de exemplu 1 disk de pe 1 server, care iti arata cat spatiu mai exista, sau procesorul, cat e utilizat). Am inceput cu 1000 de senzori si am ajuns la 5000. Din punct de vedere bugetare, era simplu, costul era decent si fix, era previzibil si nu trebuia sa iei aprobari ca sa cumperi an de an. Licenta era perpetua si cumparai mentenanta si suport.

Mentenanta si suportul pentru licenta perpetua, cum era pana acum au disparut iar pretul subscriptiei creste de vreo 3 ori. Este modelul Brocade de a cerne clientii mici…

Folosesc PRTG de 7 ani si sunt foarte multumit de produs… nu prea au mai inovat ei in ultimii x ani dar produsul e stabil. Poti customiza senzori si daca “le ai” cu scripturile si poti monitoriza cam ce vrei dintr-o infrastructura on prem (sau cloud) fara agenti, prin wmi, snmp, perfmon, ssh, etc… Dupa 7 ani, la renewal-ul anual, ne loveste baiatu de la sales cu costul marit de 3 ori… cu o explicatie cam stupida, dar incluzand disocount de 40% daca comitem pentru 3 ani.

NU

Ramanem la versiunea asta pana cand expira si ne uitam la alternative, ca slava domnului, sunt destule. Nu ne uitam la solarwinds cum nu ne-am uita la Crowdstrike daca vrem antivirus. Poate peste inca 4 ani :))

Ce am incercat pana acum, din lista de FREE’n’Moka sau ShutUpAndTakeMyMoney. Prin incercat zic instalat solutia si testat use case-urile noastre. Pana acum favoritul meu e site24x7.

  1. Primul produs testat si luat cotatie – Logic Monitor. Cam de 10 ori mai scump decat noua subscriptie de la PRTG pentru fix aceleasi nevoi de monitorizare. Produsul este cam de 10 ori mai avansat decat PRTG si are integrare in toate cloudurile existente. Stie AWS, GCP si Azure. Iti arata tot intr-un singur dashboard. E customizabil cat se poate si are rapoarte cat cuprinde. Ne-a speriat pretul.
  2. CheckMK – m-a dezamagit cumva ca avea agenti si pe langa asta era cam ciudata interfata. Ciudata probabil pentru mine… ca la fel mi-a parut si PRTG prima oara cand am dat ochii cu el, problema cu CheckMK a fost ca intre discovery si adaugat la monitorizare parca trebuia sa mai faci niste pasi inutili. In fine, poate am fost biased. Nu e agentless. Nu am obtinut nici o cotatie de pret.
  3. Zabbix – Gratis. Dar munca pe care trebuia sa o depunem sa ajungem la nivelul de monitorizare pe care il avem acum in PRTG ar fi fost titanica. Daca as lua ceva de la zero as alege zabbix… dar nu o luam de la 0 si tot ce era alerta, limita de warning, limita de eroare… trebuia facut de maini dibace. Am 42 de ani si nu mai am chef. Plus ca mai avea nevoie si de agenti…
  4. Domotz – Autodiscovery foarte misto, dar nu aveai detaliile out of the box. Trebuia sa pui server cu server ca vrei cel putin disk, ram, cpu. Nu poti crea senzori custom. Pentru monitorizare windows foloseste WinRM si SSH (da, pui ssh pe windows) … si ssh pentru linux-uri
  5. WhatsUP Gold – Discovery foarte bun doar ca out of the box iar nu aveai foarte multe lucruri monitorizate. Ping. Pentru mai mult trebuia sa adaugi senzori. Nu mi-a placut pentru ca nu puteam monitoriza “chestiile custom din PRTG”.
  6. Grafana si Prometheus – iar, am 42 de ani si am devenit putoare. Arata super dashboard-urile din grafana, dar cand ai multe servere asta inseamna overhead. Instaleaza agenti, pune sursa in prometheus, vezi pe la dashboard-uri… poate pe un set restrans de servere.. acolo unde vrem grafice frumoase.
  7. Site24x7 a lu manage engine – nu e agentless dar poti si fara agenti, pui in reteaua in care vrei sa monitorizezi un “On premise poller” setezi credentiale si merge cu WMI si SSH pentru windows-uri si linux-uri. Ce e cu agent iti adauga valoare: aplication performance monitoring, logs monitoring. Rapoarte SLA foarte misto. Integrare cu AWS… si aduce din toate conturile resurse pe care le doresti monitorizate. Cred ca numarul norocos este 7. Se potriveste pe toate use case-urile doar ca inca nu avem un pret…

Mai sunt si alte solutii de monitorizare foarte bune, dar atat am testat si am decis sa ma opresc. Manage Engine mai are OpManager, mai sunt icinga, openNMS, Datadog, NewRelic, Dynatrace, Solarwinds (cred ca trebuie mentionat chiar daca au avut acel faimos data leak)… etc.

Dupa toate mutarile idioate din tabara Broadcom, dupa ce au cumparat Vmware spunem Bye VMware – welcome Proxmox.

Folosesc VMware cam de prin 2008. Prima oara am auzit de el de la un coleg prea entuziast, care spunea atunci ca asta este viitorul. Nu o sa mai avem datacentere pline de servere fizice, sau na, vor mai fi dar cam de 30 de ori mai eficiente dpdv al energiei electrice, al spatiului, al cooling-ului. O sa virtualizam datacentere intregi! Tu iti dai seama? Serveru e un fisier acum, il poti muta cum vrei, ii faci backup usor, exista snapshot si daca strici ceva, pac, revii la snapshot.

Bye VMware - Welcome Proxmox

Cam de atunci, din 2008 cam asta a fost jobul meu. Administrator de sisteme, cu vmware, cu storage, cu fiberchannel, cu virtualizare de storage, cam tot tacamul. Ce a fost in jurul lui Vmware probabil am testat si administrat. Mi-a placut foarte mult, am inteles cum functioneaza, am construit si la joburi ulterioare, in fine… super.

Vmware a fost cumparat de EMC, am lucrat si cu solutii din portofoliul lor, i-a cumparat Dell, povestea a continuat, am descoperit prin 2017 Compellent, PowerProtect… iar acum dupa 17 ani de munca in zona asta imi dau seama ce dinozauristica este tehnologia pe care o cunosc si am promovat-o atata vreme cu entuziasm.

Vmware a fost vandut catre Broadcom. Bye VMware – Welcome Proxmox.

Aici incep sa se schimbe un pic lucrurile. Versiunea gratuita dispare, se trece la alt model de subscriptie care face Vmware sa fie mai scump, echipele de suport si toate procedurile se muta la Broadcom. Peste VMware apare “by Broadcom”. Clientii vechi deja cauta alternative sau deja se muta pe alte tehnologii, alti vendori deja au track-uri de migrare de la VMware.

Foloseam VMware vsphere acasa pentru laboratoare / sandbox-uri. Imi parea asa de simplu incat nu am cautat nimic care probabil era mai ok pentru use-case-urile mele. Acum nu ca n-as fi putut sa iau “de pe torente” un esxi si sa-l folosesc in continuare, am preferat sa caut…

Am vorbit cu niste colegi (mai demult) de Proxmox, ca pare misto, ca e free… pentru o companie care nu foloseste toate tool-urile vmware sau incepe sa isi faca o infrastructura, pare alegerea ideala… Nu l-am testat.

Welcome Proxmox VE.
VM-uri, Containere… poate! As vrea sa il pun si intr-o infrastructura mai “enterprise” cu un shared storage, sau chiar sa folosesc Ceph (in loc de vmware vsan)… si sa vad si cum e… in real life, in productie :D.
Pana acum mi-a placut ca poti sa faci backup unui VM fara software aditional (este in interfata), poti sa muti masina de colo colo printre noduri, imi place UI-ul, imi place!

Bye VMware – Welcome Proxmox! Acum dinozaurul s-a pus pe invatat si alte lucruri, ca nu-l mai angajeaza nimeni daca stie bine de tot vmware. Era la moda devops, acum vad ca se cauta SRE, care e urmatorul trend? Toti vor in cloud?

SSD kaput! Back dupa mult downtime, dar cine mai numara? Ce s-a intamplat? Ei bine aveam – cum este cazul si acum – blogul hostat acasa, pentru ca imi mai place sa am proiecte personale, cum este si cu gradinaritul… mai fumezi o tigara, mai dai drumu la aspersoare… dar mai faci si ceva pe server, iti pui ups, mai faci un laborator…

SSD kaput. Bug de firmware. Nu mai vroia sa se initializeze firmware-ul si cu asta basta! Cred ca am pierdut si cateva posturi, nu stiu cate, ca am descoperit tarziu ca site-ul e down si intamplator chiar. Noroc ca nu mai scriam mult si nu tineam asa tare la ce am scris dupa Covid.

2020-2024 am tinut hard disk-ul la naftalina, de 2-3 ori am incercat sa-l resuscitez (de hobby asa) iar recent, am dat drumu la un liliput server pentru a testa proxmox asadar am luat ultimul backup valid si s-am urcat, updatat… e voilla!

Probabil ca o sa pice iar si iar si tot nu o sa ma duc in amazon ca am contract cu hidroelectrica!