NUCBA - Formación profesional digital

La pregunta aparece siempre: ¿integro una API de machine learning o entreno mi propio modelo? La respuesta corta es que depende, pero no del tipo de "depende" que te deja igual. Acá vamos a ver los factores reales que importan para tomar esa decisión sin romantizar el código ni caer en la trampa del build-everything.

El contexto importa más que la técnica

Arranquemos por donde hay que arrancar: tu problema específico. No todos los problemas de ML son iguales, y la solución correcta tiene más que ver con tu contexto que con tu habilidad técnica.

Si estás construyendo un clasificador de imágenes para detectar gatos en fotos de productos, probablemente Cloud Vision de Google o AWS Rekognition te resuelvan el problema en dos días. Si estás trabajando en un sistema de recomendación para una plataforma con 50 millones de usuarios y patrones de comportamiento específicos de tu industria, probablemente necesités algo custom.

La diferencia no está en la complejidad técnica abstracta. Está en qué tan específico es tu caso de uso y qué tan crítico es el control total sobre el sistema.

Cuándo una API de ML tiene sentido

Las APIs de machine learning son servicios pre-entrenados que resuelven problemas comunes. OpenAI, Google Cloud AI, AWS SageMaker, Azure Cognitive Services. Todas ofrecen capacidades que funcionan out-of-the-box.

Usá una API cuando:

Estás resolviendo un problema genérico: análisis de sentimientos, reconocimiento de texto, clasificación básica de imágenes, traducción automática
Tu volumen de datos es bajo o medio (miles, no millones de requests diarios)
Necesitás velocidad de implementación más que precisión quirúrgica
No tenés un equipo especializado en ML o data science
El costo por request es asumible para tu modelo de negocio
La latencia de una llamada HTTP externa es aceptable
No necesitás entender exactamente cómo funciona el modelo internamente

Ejemplo práctico: estás haciendo un sistema de moderación de comentarios para un foro. Podés usar la API de moderación de OpenAI o Perspective API de Google. Implementación en horas, resultados decentes, problema resuelto.

import openai

def moderar_comentario(texto):
    response = openai.Moderation.create(input=texto)
    return response["results"][0]["flagged"]

comentario = "Este es un comentario normal"
es_toxico = moderar_comentario(comentario)

Tres líneas de código y tenés moderación básica funcionando. El 80% de los casos quedan cubiertos sin entrenar nada.

Cuándo construir tu propio modelo

Entrenar y mantener tu propio modelo de ML es más costoso, más lento y más complejo. Pero a veces es la única opción que tiene sentido.

Modelá desde cero cuando:

Tu dominio es específico y las APIs genéricas fallan consistentemente
Manejás datos sensibles que no podés mandar a terceros (privacidad, compliance, regulación)
El volumen justifica la inversión: miles o millones de predicciones por día donde el costo por API sería prohibitivo
Necesitás control total sobre el modelo: ajuste fino, interpretabilidad, debugging profundo
La latencia es crítica y no podés depender de un servicio externo
Tu ventaja competitiva depende del modelo en sí
Tenés acceso a datos propietarios que dan una ventaja real

Caso real: Mercado Libre tiene su propio sistema de detección de fraude. No usan una API genérica porque sus patrones de fraude son específicos del mercado latinoamericano, manejan volúmenes enormes, y el modelo es parte del core del negocio.

La zona gris: fine-tuning y modelos híbridos

Existe una tercera vía que cada vez tiene más sentido: partir de un modelo pre-entrenado y ajustarlo con tus datos.

OpenAI permite fine-tuning de sus modelos. Hugging Face tiene miles de modelos pre-entrenados que podés ajustar. Google ofrece AutoML para entrenar modelos custom sin ser un experto.

Esta opción te da lo mejor de ambos mundos en ciertos escenarios:

Arrancás con un modelo que ya aprendió patrones generales
Lo ajustás con tu data específica
Evitás el costo de entrenar desde cero
Mantenés cierto nivel de control

from transformers import AutoModelForSequenceClassification, Trainer, TrainingArguments

# Cargás un modelo pre-entrenado
model = AutoModelForSequenceClassification.from_pretrained("bert-base-uncased")

# Lo entrenás con tus datos
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=16
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tu_dataset
)

trainer.train()

Este approach tiene sentido si tu problema es "clasificación de textos médicos" o "detección de intención en chats de atención al cliente". El modelo base sabe lenguaje, vos le enseñás tu dominio.

Factores económicos reales

Los números importan. Una API puede parecer barata hasta que escalás.

Costos de una API:

Por request: desde $0.001 hasta $0.05 dependiendo del servicio
Predecible y lineal con el uso
Cero costo de infraestructura o mantenimiento
Riesgo: si tu producto crece, el costo puede volverse insostenible

Costos de modelo propio:

Infraestructura: GPUs, servidores, storage (desde $500/mes hasta decenas de miles)
Equipo: data scientists, ML engineers, DevOps (caro, escaso)
Tiempo de desarrollo: semanas o meses vs días
Mantenimiento continuo: reentrenamiento, monitoreo, debugging

Hacé la cuenta concreta. Si vas a hacer 100 mil predicciones por mes, una API a $0.002 por request te cuesta $200. Mantener infraestructura propia para eso no tiene sentido. Si hacés 100 millones de predicciones, la API te cuesta $200.000 mensuales. Ahí la ecuación cambia.

Control y dependencia

Usar una API implica depender de un tercero. Eso no siempre es malo, pero tenés que considerarlo.

Riesgos de dependencia:

Cambios de pricing sin previo aviso
Deprecación del servicio (pasó con varias APIs de Google)
Downtime fuera de tu control
Cambios en el comportamiento del modelo
Límites de rate que pueden afectar tu producto

Tener tu modelo significa control total, pero también responsabilidad total. Si se cae, es tu problema. Si el modelo empieza a degradar, tenés que detectarlo y arreglarlo.

Una matriz de decisión práctica

Para cerrar con algo concreto, una tabla que resume cuándo elegir cada opción:

Factor	API de ML	Modelo propio	Fine-tuning
Tiempo al mercado	Días	Meses	Semanas
Expertise técnico	Bajo	Alto	Medio
Costo inicial	Muy bajo	Alto	Medio
Costo a escala	Alto	Bajo	Medio
Personalización	Baja	Total	Alta
Control	Bajo	Total	Alto
Privacidad de datos	Riesgo	Seguro	Depende

Empezá simple, escalá con criterio

La movida inteligente suele ser: empezar con una API, validar que el problema vale la pena resolver, y recién después considerar construir algo custom si los números lo justifican.

No hay gloria en entrenar un modelo desde cero si OpenAI te resuelve el problema en una tarde. Pero tampoco tiene sentido pagar miles de dólares mensuales por algo que podrías resolver con un modelo fine-tuneado y un servidor GPU de $300.

La decisión es pragmática, no ideológica. Mirá tu caso de uso, hacé las cuentas, considerá tu equipo y tu contexto. El mejor modelo de ML es el que resuelve tu problema de forma sostenible, no el más complejo ni el más simple.

Y si arrancás con una API y después migrás a un modelo propio, está perfecto. La tecnología está para adaptarse a tu problema, no al revés.

APIs de ML vs modelar tu propio algoritmo