Parte 3

Tu Workstation de IA Definitiva

Perfil Profesional

María — Científica de Datos

Especialización: Entrenamiento de Modelos de Lenguaje

Investigadora de NLP en una empresa tech. Su jornada incluye fine-tuning de modelos como Llama 3.1 8B sobre datasets de documentos en español, inferencia local de LLMs para evaluación, preprocesamiento con pandas/HuggingFace y experimentación rápida: necesita resultados en horas, no días.

🔴 VRAM Abundante🔵 Storage NVMe Rápido🟢 CPU Multi-Core
↓ Selector de Build ↓

Elegí qué PC querés explorar

Compará las dos configuraciones y mirá las diferencias en detalle

~$1,010 USD · con ofertas habituales alcanzable en $800

AMD Ryzen 5 7600X

$180

6C/12T · 4.7/5.3 GHz · PCIe 5.0

💰 Ahorro: $409 vs 285K

Para fine-tuning, la CPU ejecuta el DataLoader y la tokenización. El 7600X maneja estas tareas sin ser el cuello de botella — que siempre es la GPU. Diferencia vs 285K con misma GPU: < 5%.

NVIDIA RTX 4060 Ti 16GB

$380

4,352 CUDA · 16GB GDDR6 · 288 GB/s

⭐ La decisión más inteligente del build

La versión de 16GB (no 8GB). VRAM es el recurso más escaso en fine-tuning. Con 16GB ejecutamos QLoRA sobre Llama 3.1 8B completo y Mistral 7B sin fragmentación. Sacrificio: velocidad (~3-4× más lento que 5090), no capacidad.

32 GB DDR5-5600

$65

2× 16GB Corsair Vengeance

💰 Ahorro: $835 vs 192GB

Suficiente para desarrollo activo. Actualizable a 64GB por $65 adicionales en el futuro.

WD Black SN770 1TB NVMe PCIe 4.0

$65

5,150/4,900 MB/s

💰 Ahorro: $435 vs T705

NVMe PCIe 4.0 a 5,150 MB/s es más que suficiente para el día a día. La diferencia con PCIe 5.0 se nota en lecturas masivas sostenidas — menos frecuentes en un entorno de dev.

MSI PRO B650-S WiFi

$120

AM5 · PCIe 5.0 · DDR5 7200MHz · WiFi 6E

Plataforma AM5 asegura soporte de nuevas CPUs AMD por años. Espacio para actualizar a Ryzen 9 9950X.

Thermalright Peerless Assassin 120 SE

$35

Disipador de torre dual

El mejor disipador por precio. Cubre el TDP del 7600X con amplio margen y en silencio.

Corsair RM750e 750W Gold

$85

750W · 80+ Gold

RTX 4060 Ti (165W) + Ryzen 5 7600X (105W) ≈ 300W real. 750W da headroom para picos y futuras actualizaciones de GPU.

Arquitectura del Build: ¿Cómo se conecta todo?

PSU 750WCorsair RM750eMotherboard · B650CPURyzen 5 7600X · 5.3 GHzRAM32GB DDR5-5600GPU · RTX 4060 Ti16GB VRAM · PCIe 4.0 ×16M.2 NVMeSN770 PCIe 4.012V

Lo que puede hacer esta máquina por $800

Capacidad¿Puede?Detalle
Inferencia LLaMA 3.1 8B (FP16)✅ Sí~18-22 tokens/segundo
Inferencia LLaMA 3.1 8B (Q4 GGUF)✅ Sí~35-45 tokens/segundo
Fine-tuning Mistral 7B (QLoRA)✅ Sí~45 min/epoch (dataset 5GB)
Fine-tuning Llama 13B (QLoRA 4-bit)✅ Sí~90 min/epoch
Stable Diffusion XL (1024×1024)✅ Sí~1.5 imágenes/segundo
Entrenamiento con imágenes✅ SíCIFAR, COCO subset
Inferencia LLaMA 70B (Q4)⚠️ Parcial~3-5 tok/s con CPU offload
Fine-tuning LLM desde cero❌ No recomendadoSe requiere GPU de datacenter

El Build $800 es el punto de entrada real al mundo del fine-tuning de LLMs. No es la herramienta para competir con OpenAI — es la herramienta para aprender, experimentar y crear soluciones de IA propias con modelos open-source.

Build A vs Build B — Cara a Cara

Métrica💎 Sin Límite🎯 Punto DulceRelación
Precio total~$8,500~$1,0108.4× más caro
VRAM32 GB GDDR716 GB GDDR62× más VRAM
RAM sistema192 GB DDR532 GB DDR56× más RAM
Storage rápido6 TB NVMe (PCIe 4+5)1 TB NVMe PCIe 4.06× más capacidad
Consumo bajo carga~900 W~300 W3× más consumo
Inferencia Llama 8B~80 tok/s~22 tok/s3.6× más rápido
Fine-tune Mistral 7B (epoch 5GB)~12 min~45 min3.7× más rápido
SDXL 1024×1024~5 img/s~1.5 img/s3.3× más rápido
Llama 13B QLoRA✅ nativo✅ con 4-bitAmbos lo hacen
Llama 70B✅ con offload⚠️ muy lentoSolo A es práctico

Conclusión: el Build A es ~3.5× más rápido pero cuesta ~8× más. El Punto Dulce ofrece el mejor rendimiento/dólar para el 90% del trabajo real de un investigador de IA.

¿Dónde ahorramos? Las decisiones del Punto Dulce

✅ Ahorramos en CPU sin perder casi nada

Pasamos de un 285K a un Ryzen 5 7600X. En fine-tuning, la CPU solo orquesta el DataLoader: la diferencia real es < 5%. Ahorro: $409.

✅ Ahorramos en RAM porque sobra

32 GB cubren QLoRA de Llama 8B y desarrollo activo. Si el día de mañana hace falta, se ampliar a 64 GB por $65 más. Ahorro: $835.

✅ Ahorramos en storage de capacidad

1 TB NVMe PCIe 4.0 a 5,150 MB/s. La diferencia con PCIe 5.0 se siente solo en lecturas masivas sostenidas. Ahorro: $435.

⚠️ NO ahorramos en VRAM

Elegimos la RTX 4060 Ti 16GB, NO la versión 8GB. La VRAM es el recurso más escaso en IA: con 8GB no entra ningún LLM moderno. Caro pero innegociable.

⚠️ NO ahorramos en fuente

750W 80+ Gold deja headroom para subir a una RTX 5070 o 5080 en el futuro sin cambiar la PSU. Una fuente de 500W ahorra $30 hoy y cuesta $200 mañana.

💡 Estrategia clave

Maximizamos VRAM (el cuello de botella real de la IA generativa) y minimizamos todo lo demás. Resultado: el 30% del rendimiento por el 12% del precio del Build A.