Parte 3: Workstation de IA Definitiva

Parte 3

Tu Workstation de IA Definitiva

Perfil Profesional

María — Científica de Datos

Especialización: Entrenamiento de Modelos de Lenguaje

Investigadora de NLP en una empresa tech. Su jornada incluye fine-tuning de modelos como Llama 3.1 8B sobre datasets de documentos en español, inferencia local de LLMs para evaluación, preprocesamiento con pandas/HuggingFace y experimentación rápida: necesita resultados en horas, no días.

🔴 VRAM Abundante🔵 Storage NVMe Rápido🟢 CPU Multi-Core

↓ Selector de Build ↓

Elegí qué PC querés explorar

Compará las dos configuraciones y mirá las diferencias en detalle

~$1,010 USD · con ofertas habituales alcanzable en $800

AMD Ryzen 5 7600X

$180

6C/12T · 4.7/5.3 GHz · PCIe 5.0

💰 Ahorro: $409 vs 285K

Para fine-tuning, la CPU ejecuta el DataLoader y la tokenización. El 7600X maneja estas tareas sin ser el cuello de botella — que siempre es la GPU. Diferencia vs 285K con misma GPU: < 5%.

NVIDIA RTX 4060 Ti 16GB

$380

4,352 CUDA · 16GB GDDR6 · 288 GB/s

⭐ La decisión más inteligente del build

La versión de 16GB (no 8GB). VRAM es el recurso más escaso en fine-tuning. Con 16GB ejecutamos QLoRA sobre Llama 3.1 8B completo y Mistral 7B sin fragmentación. Sacrificio: velocidad (~3-4× más lento que 5090), no capacidad.

32 GB DDR5-5600

$65

2× 16GB Corsair Vengeance

💰 Ahorro: $835 vs 192GB

Suficiente para desarrollo activo. Actualizable a 64GB por $65 adicionales en el futuro.

WD Black SN770 1TB NVMe PCIe 4.0

$65

5,150/4,900 MB/s

💰 Ahorro: $435 vs T705

NVMe PCIe 4.0 a 5,150 MB/s es más que suficiente para el día a día. La diferencia con PCIe 5.0 se nota en lecturas masivas sostenidas — menos frecuentes en un entorno de dev.

MSI PRO B650-S WiFi

$120

AM5 · PCIe 5.0 · DDR5 7200MHz · WiFi 6E

Plataforma AM5 asegura soporte de nuevas CPUs AMD por años. Espacio para actualizar a Ryzen 9 9950X.

Thermalright Peerless Assassin 120 SE

$35

Disipador de torre dual

El mejor disipador por precio. Cubre el TDP del 7600X con amplio margen y en silencio.

Corsair RM750e 750W Gold

$85

750W · 80+ Gold

RTX 4060 Ti (165W) + Ryzen 5 7600X (105W) ≈ 300W real. 750W da headroom para picos y futuras actualizaciones de GPU.

Arquitectura del Build: ¿Cómo se conecta todo?

Lo que puede hacer esta máquina por $800

Capacidad	¿Puede?	Detalle
Inferencia LLaMA 3.1 8B (FP16)	✅ Sí	~18-22 tokens/segundo
Inferencia LLaMA 3.1 8B (Q4 GGUF)	✅ Sí	~35-45 tokens/segundo
Fine-tuning Mistral 7B (QLoRA)	✅ Sí	~45 min/epoch (dataset 5GB)
Fine-tuning Llama 13B (QLoRA 4-bit)	✅ Sí	~90 min/epoch
Stable Diffusion XL (1024×1024)	✅ Sí	~1.5 imágenes/segundo
Entrenamiento con imágenes	✅ Sí	CIFAR, COCO subset
Inferencia LLaMA 70B (Q4)	⚠️ Parcial	~3-5 tok/s con CPU offload
Fine-tuning LLM desde cero	❌ No recomendado	Se requiere GPU de datacenter

El Build $800 es el punto de entrada real al mundo del fine-tuning de LLMs. No es la herramienta para competir con OpenAI — es la herramienta para aprender, experimentar y crear soluciones de IA propias con modelos open-source.

Build A vs Build B — Cara a Cara

Métrica	💎 Sin Límite	🎯 Punto Dulce	Relación
Precio total	~$8,500	~$1,010	8.4× más caro
VRAM	32 GB GDDR7	16 GB GDDR6	2× más VRAM
RAM sistema	192 GB DDR5	32 GB DDR5	6× más RAM
Storage rápido	6 TB NVMe (PCIe 4+5)	1 TB NVMe PCIe 4.0	6× más capacidad
Consumo bajo carga	~900 W	~300 W	3× más consumo
Inferencia Llama 8B	~80 tok/s	~22 tok/s	3.6× más rápido
Fine-tune Mistral 7B (epoch 5GB)	~12 min	~45 min	3.7× más rápido
SDXL 1024×1024	~5 img/s	~1.5 img/s	3.3× más rápido
Llama 13B QLoRA	✅ nativo	✅ con 4-bit	Ambos lo hacen
Llama 70B	✅ con offload	⚠️ muy lento	Solo A es práctico

Conclusión: el Build A es ~3.5× más rápido pero cuesta ~8× más. El Punto Dulce ofrece el mejor rendimiento/dólar para el 90% del trabajo real de un investigador de IA.

¿Dónde ahorramos? Las decisiones del Punto Dulce

✅ Ahorramos en CPU sin perder casi nada

Pasamos de un 285K a un Ryzen 5 7600X. En fine-tuning, la CPU solo orquesta el DataLoader: la diferencia real es < 5%. Ahorro: $409.

✅ Ahorramos en RAM porque sobra

32 GB cubren QLoRA de Llama 8B y desarrollo activo. Si el día de mañana hace falta, se ampliar a 64 GB por $65 más. Ahorro: $835.

✅ Ahorramos en storage de capacidad

1 TB NVMe PCIe 4.0 a 5,150 MB/s. La diferencia con PCIe 5.0 se siente solo en lecturas masivas sostenidas. Ahorro: $435.

⚠️ NO ahorramos en VRAM

Elegimos la RTX 4060 Ti 16GB, NO la versión 8GB. La VRAM es el recurso más escaso en IA: con 8GB no entra ningún LLM moderno. Caro pero innegociable.

⚠️ NO ahorramos en fuente

750W 80+ Gold deja headroom para subir a una RTX 5070 o 5080 en el futuro sin cambiar la PSU. Una fuente de 500W ahorra $30 hoy y cuesta $200 mañana.

💡 Estrategia clave

Maximizamos VRAM (el cuello de botella real de la IA generativa) y minimizamos todo lo demás. Resultado: el 30% del rendimiento por el 12% del precio del Build A.