Ollama + Open WebUI pe Proxmox: AI local fara iluzii
Am construit un stack de AI local pe Proxmox cu Ollama, Open WebUI, Qdrant si SearXNG — modele DeepSeek si Qwen pentru coding, RAG activ, GPU inference pe RTX 5070. Functioneaza. Dar fata de un model comercial serios, e ca si cum repari Dacia cu sarma.