Ceph en cloud privado: almacenamiento distribuido para Proxmox y clústeres

Ceph es uno de los grandes argumentos a favor de Proxmox frente a VMware: te da almacenamiento distribuido, replicado y con alta disponibilidad real sin pagar licencias de la capa de almacenamiento, algo que con vSAN cuesta caro. Pero Ceph también es donde más proyectos de hiperconvergencia se tuercen, porque no perdona los atajos en red ni en diseño.

Esta guía explica qué es Ceph, cuándo tiene sentido y, sobre todo, qué decisiones tomar para que no se convierta en una fuente de dolor.

Qué es Ceph, sin jerga innecesaria

Ceph es un sistema de almacenamiento distribuido: en lugar de una cabina central, reparte los datos en trozos replicados a lo largo de varios nodos. Si un disco o un nodo entero cae, los datos siguen disponibles porque hay copias en otros sitios. No hay un único punto de fallo.

En un clúster Proxmox, Ceph se integra directamente: los mismos servidores que ejecutan tus máquinas virtuales aportan también su almacenamiento al pool común. Eso es la hiperconvergencia: cómputo y almacenamiento en el mismo hardware, gestionados desde una sola interfaz.

Sus piezas principales:

OSD (Object Storage Daemon): un proceso por cada disco que guarda datos. Más discos, más OSDs, más capacidad y rendimiento.
MON (Monitor): mantiene el mapa del clúster y el quórum. Necesitas un número impar (3 o 5) para que no haya empates.
MGR (Manager): métricas y gestión.
Pools y placement groups: cómo se distribuyen y replican los datos.

Por qué Ceph en lugar de ZFS o una SAN

No siempre es la respuesta. Depende del tamaño y de lo que necesites:

Opción	HA / failover	Escalado	Coste	Cuándo
ZFS local por nodo	Replicación async (pierde minutos)	Por nodo	Muy bajo	Clústeres pequeños, RPO laxo
SAN/NAS externa	Sí (si la cabina es HA)	Limitado por la cabina	Alto (cabina)	Ya tienes inversión en cabina
Ceph	Sí, síncrono y automático	Horizontal, casi lineal	Sin licencia, sí hardware/red	HA real e hiperconvergencia

La gran ventaja de Ceph: la replicación es síncrona, así que el failover no pierde los últimos cambios, y escalas añadiendo nodos en horizontal. Es lo más parecido a vSAN que tienes sin pagar la capa de almacenamiento. Lo vimos por encima en la guía de migración de VMware a Proxmox; aquí vamos a fondo.

Los requisitos que no son negociables

Aquí es donde se hunde la gente que trata a Ceph como “un sistema de ficheros más”.

Red dedicada y rápida

Ceph sobre 1 GbE es una receta para la frustración. La replicación síncrona genera muchísimo tráfico interno entre nodos. El mínimo razonable es 10 GbE dedicado, y para producción seria 25 GbE. Idealmente, red de almacenamiento separada de la red de las VMs, y a poder ser redundante. Si recortas aquí, el rendimiento de todo el clúster se resiente y no entenderás por qué.

Tres nodos como mínimo (y mejor más)

Ceph necesita quórum de monitores y suficientes nodos para replicar. Con replicación 3x (el estándar sensato), necesitas al menos 3 nodos para sobrevivir a la caída de uno sin perder disponibilidad. Con menos, no tienes HA real.

Discos pensados para el rol

NVMe/SSD para cargas que pegan a disco (bases de datos, VMs activas), discos grandes para capacidad fría. No mezcles a lo loco: el OSD más lento marca el ritmo. Y olvídate de poner los OSD detrás de una controladora RAID en modo cabina: Ceph quiere ver los discos directamente (HBA / modo IT).

Errores comunes que arruinan un Ceph

Red insuficiente. El error número uno, con diferencia. 1 GbE mata el rendimiento.
Llenar el clúster por encima del 80%. Ceph reserva espacio para rebalancear ante fallos. Si lo llenas, pierdes la capacidad de recuperarte y el clúster puede bloquearse. Planifica capacidad con margen.
Replicación 2x para “ahorrar”. Con 2x, un segundo fallo durante una reconstrucción te deja sin datos. Usa 3x salvo que sepas muy bien lo que haces.
Mezclar tráfico de Ceph y de VMs en la misma red. Se pisan y el rendimiento se vuelve impredecible.
No monitorizar el estado (ceph -s). Un clúster en HEALTH_WARN que nadie mira acaba en HEALTH_ERR.

Cuándo NO usar Ceph

Sé honesto: si tienes dos nodos, red de 1 GbE y cargas modestas, Ceph es excesivo y problemático. ZFS con replicación asíncrona será más simple y suficiente. Ceph brilla a partir de 3-4 nodos, con red de 10/25 GbE y necesidad real de HA síncrona y escalado horizontal. Si tu caso es de clústeres con almacenamiento local a escala media o grande, ahí es donde paga su complejidad.

¿Te encaja Ceph?

Ceph es una de las mejores cosas que le pasan a un cloud privado sobre Proxmox: HA real, hiperconvergencia y cero licencias de almacenamiento. Pero exige diseño serio, la red sobre todo, y operación atenta. No es “instalar y olvidar”.

Si la idea te encaja pero la operación te impone respeto, es exactamente el tipo de plataforma que diseñamos y operamos por ti: dimensionamos red, discos y replicación para tu carga real y la vigilamos. Mira nuestro cloud privado sobre Proxmox y, si necesitas replicación de nivel superior entre datacenters, el almacenamiento síncrono.

Qué es Ceph, sin jerga innecesaria

Por qué Ceph en lugar de ZFS o una SAN

Los requisitos que no son negociables

Red dedicada y rápida

Tres nodos como mínimo (y mejor más)

Discos pensados para el rol

Errores comunes que arruinan un Ceph

Cuándo NO usar Ceph

¿Te encaja Ceph?

Artículos relacionados

Proxmox VE ya corre en ARM64: qué hardware vale, qué se queda fuera y por qué importa

Backups de bases de datos en Proxmox: por qué un snapshot de la VM no basta

EVPN-VXLAN: cómo escalar la red del datacenter sin extender la capa 2