Skip to main content

1.2.3. Comparación GPUs

Para un uso doméstico o con pocos usuarios, podremos usar la GPU integrada del procesador, esto será suficiente para transcodificar video en 720p o 1080p, pero estaremos muy limitados a la hora de hacer streaming a varios usuarios simultáneamente o realizar transcodificaciones en 4k.

Si deseamos realizar varios streams simultáneos que requieran de transcodificación en el servidor o quitar carga al procesador al realizar backups o stremear video, es recomendado usar una GTX 1650, es muy básica, pero nos ofrece transcodificar en prácticamente todos los codecs actuales incluso en 10 bits.

Para el servicio de streaming de videojuegos, tendremos en cuenta los requisitos de nuestros videojuegos y añadiremos un pequeño margen que necesitaremos para el streaming del mismo.

Para aprender a desplegar el servicio de IA realmente no necesitamos GPU, podremos hacerlo con la CPU. Pero veremos un rendimiento totalmente inutulizable.
Si queremos tener un modelo útil a una velocidad suficiente, el mínimo serán 6GB de VRAM. Recomendando un mínimo de 8 en una GPU RTX, ya que disponen de tensor cores.
Para poder generar imágenes simples y de poca resolución 8 GB serán suficiente, pero es recomendable 12 GB.
Para generar video en muy baja resolución, símplemente por aprender a hacer flujos, 6-8GB es el mínimo absoluto, siendo recomendable 12-16GB y si realmente vamos a darle uso, 16-24GB será un buen punto de partida.

Para IA excluiremos GPUs AMD e Intel ya que la compatibilidad es muy limitada y hay poca comunidad.

Hay tarjetas antiguas de datacenters muy económicas con mucha capacidad, aún que con un rendimiento menor ya que son antiguas, marca Nvidia, concretamente serie Tesla. Son GPUs con refrigeraciones pasivas o adaptadas muy ruidosas, de turbina. Muy ineficientes energéticamente, pero económicas y con mucha memoria.
La tesla v100 16GB se puede conseguir con adaptador PCI-E y disipador activo, no procesará video, pero tiene tensor cores (ya que es arquitectura Volta) y rendirá bien para IA.
Hay modelos que a simple vista pueden parecer muy atractivos, de arquitecturas anteriores, cómo Pascal, la tesla P100 16gb o P40 de 24GB, pero carecen de tensor cores, rindiendo mucho menos y manejando realmente mal la cuantización.
Esto quiere decir una tesla P40, usará sus 24GB por completo, mientras que una GPU más reciente, podrá hacer el mismo cálculo, más rápido y con mayor eficiencia energética pese a tener menos memoria, ya que la aprovecha mejor su memoria, pese a tener 12-16 GB.