Bare-metal con GPU vs hiperescalar para IA: rendimiento y coste
Alquilar GPU en la nube es ideal para empezar; ruinoso para cargas sostenidas. Cuándo el bare-metal con GPU dedicada sale mucho más barato y rinde más, y dónde gana el hiperescalar.
“¿Cuánto cuesta un cloud privado?” es una pregunta razonable, pero está mal planteada. Pasa como cuando preguntas cuánto cuesta una casa. Depende. Aun así hay una respuesta útil: entender de qué se compone el coste para que puedas comparar de verdad y no llevarte sorpresas en el año dos.
Vamos a desmontar la factura, partida por partida, incluidas las que nadie te enseña en la propuesta inicial.
La pregunta de fondo no es solo cuánto, sino cómo pagas.
No hay respuesta universal. Una empresa con caja y carga muy estable puede preferir CAPEX; una que valora flexibilidad y no quiere un equipo de infra, OPEX. La mayoría de proyectos de “cloud privado gestionado” son OPEX precisamente para externalizar el dolor.
Servidores con CPU y RAM. El precio depende de núcleos, frecuencia, memoria y si necesitas GPU. Aquí la trampa es sobredimensionar: comprar para el pico teórico que quizá nunca llegue. Dimensiona para la carga real más un margen sensato.
No todo el almacenamiento cuesta igual. NVMe para bases de datos transaccionales, SSD para uso general, disco para archivado. Y ojo con la replicación: si quieres RPO bajo con copias síncronas multi-datacenter, multiplicas capacidad.
Ancho de banda, conectividad redundante y, si haces hiperconvergencia con Ceph, red interna de 10/25 GbE dedicada. Es una partida que se olvida y luego limita el rendimiento.
Aquí varía enormemente:
| Componente | Coste típico |
|---|---|
| Hipervisor VMware | Alto (suscripción por núcleo) |
| Hipervisor Proxmox | 0 (soporte opcional) |
| Sistema operativo (Windows Server) | Por núcleo/CAL |
| Backup (Veeam u otros) | Por carga/VM |
La elección de hipervisor por sí sola puede cambiar el TCO de forma drástica.
El componente que más se subestima. Alguien tiene que monitorizar, parchear, gestionar incidencias y responder a las 3 de la madrugada. Si lo haces interno, es salario de perfiles especializados; si lo externalizas, es la cuota del servicio gestionado. En cualquier caso, no es cero, aunque en muchos presupuestos aparezca como tal.
Si vienes de comparar con un hiperescalar, hay una partida que cambia el resultado: el egress, el coste de sacar datos de la nube.
En cloud público, el cómputo y el almacenamiento parecen baratos en la calculadora, pero transferir datos hacia fuera se paga por gigabyte, y en cargas con mucho tráfico de salida (servicios de medios, backups externos, APIs muy consultadas) ese coste puede igualar o superar al del cómputo. Es, además, el principal mecanismo de lock-in: salir de la nube literalmente cuesta dinero.
En un cloud privado bien contratado, el tráfico suele venir incluido o con tarifas planas predecibles. Cuando compares, no mires solo el precio del servidor: calcula el egress de tu carga real. Es donde muchas migraciones a privado se justifican solas.
Para comparar opciones de verdad, suma a 3 años:
Solo cuando tienes esas siete líneas puedes decir cuánto cuesta “de verdad”. La cifra del titular del proveedor casi nunca las incluye todas.
Un cloud privado gestionado para una pyme suele moverse en una cuota mensual predecible que, comparada honestamente (con egress y operación incluidos), a menudo sale igual o más barata que el público para cargas estables, y casi siempre más barata que VMware tras la subida de Broadcom. Pero la cifra concreta depende de tu carga.
Por eso no damos un número de catálogo: damos un cálculo. Si nos cuentas tu carga real, montamos el TCO completo a tres años con todas las partidas a la vista, incluidas las incómodas. Sin letra pequeña.