Proxmox vs. VMware: comparativa técnica honesta
HA, backup, soporte y coste real, cara a cara y con tablas. Sin marketing: dónde gana cada uno y cuándo conviene quedarse o saltar.
Ceph es uno de los grandes argumentos a favor de Proxmox frente a VMware: te da almacenamiento distribuido, replicado y con alta disponibilidad real sin pagar licencias de la capa de almacenamiento, algo que con vSAN cuesta caro. Pero Ceph también es donde más proyectos de hiperconvergencia se tuercen, porque no perdona los atajos en red ni en diseño.
Esta guía explica qué es Ceph, cuándo tiene sentido y, sobre todo, qué decisiones tomar para que no se convierta en una fuente de dolor.
Ceph es un sistema de almacenamiento distribuido: en lugar de una cabina central, reparte los datos en trozos replicados a lo largo de varios nodos. Si un disco o un nodo entero cae, los datos siguen disponibles porque hay copias en otros sitios. No hay un único punto de fallo.
En un clúster Proxmox, Ceph se integra directamente: los mismos servidores que ejecutan tus máquinas virtuales aportan también su almacenamiento al pool común. Eso es la hiperconvergencia: cómputo y almacenamiento en el mismo hardware, gestionados desde una sola interfaz.
Sus piezas principales:
No siempre es la respuesta. Depende del tamaño y de lo que necesites:
| Opción | HA / failover | Escalado | Coste | Cuándo |
|---|---|---|---|---|
| ZFS local por nodo | Replicación async (pierde minutos) | Por nodo | Muy bajo | Clústeres pequeños, RPO laxo |
| SAN/NAS externa | Sí (si la cabina es HA) | Limitado por la cabina | Alto (cabina) | Ya tienes inversión en cabina |
| Ceph | Sí, síncrono y automático | Horizontal, casi lineal | Sin licencia, sí hardware/red | HA real e hiperconvergencia |
La gran ventaja de Ceph: la replicación es síncrona, así que el failover no pierde los últimos cambios, y escalas añadiendo nodos en horizontal. Es lo más parecido a vSAN que tienes sin pagar la capa de almacenamiento. Lo vimos por encima en la guía de migración de VMware a Proxmox; aquí vamos a fondo.
Aquí es donde se hunde la gente que trata a Ceph como “un sistema de ficheros más”.
Ceph sobre 1 GbE es una receta para la frustración. La replicación síncrona genera muchísimo tráfico interno entre nodos. El mínimo razonable es 10 GbE dedicado, y para producción seria 25 GbE. Idealmente, red de almacenamiento separada de la red de las VMs, y a poder ser redundante. Si recortas aquí, el rendimiento de todo el clúster se resiente y no entenderás por qué.
Ceph necesita quórum de monitores y suficientes nodos para replicar. Con replicación 3x (el estándar sensato), necesitas al menos 3 nodos para sobrevivir a la caída de uno sin perder disponibilidad. Con menos, no tienes HA real.
NVMe/SSD para cargas que pegan a disco (bases de datos, VMs activas), discos grandes para capacidad fría. No mezcles a lo loco: el OSD más lento marca el ritmo. Y olvídate de poner los OSD detrás de una controladora RAID en modo cabina: Ceph quiere ver los discos directamente (HBA / modo IT).
ceph -s). Un clúster en HEALTH_WARN que nadie mira acaba en HEALTH_ERR.Sé honesto: si tienes dos nodos, red de 1 GbE y cargas modestas, Ceph es excesivo y problemático. ZFS con replicación asíncrona será más simple y suficiente. Ceph brilla a partir de 3-4 nodos, con red de 10/25 GbE y necesidad real de HA síncrona y escalado horizontal. Si tu caso es de clústeres con almacenamiento local a escala media o grande, ahí es donde paga su complejidad.
Ceph es una de las mejores cosas que le pasan a un cloud privado sobre Proxmox: HA real, hiperconvergencia y cero licencias de almacenamiento. Pero exige diseño serio, la red sobre todo, y operación atenta. No es “instalar y olvidar”.
Si la idea te encaja pero la operación te impone respeto, es exactamente el tipo de plataforma que diseñamos y operamos por ti: dimensionamos red, discos y replicación para tu carga real y la vigilamos. Mira nuestro cloud privado sobre Proxmox y, si necesitas replicación de nivel superior entre datacenters, el almacenamiento síncrono.