Cómo crear un agente de IA para tu empresa (guía real)

La semana pasada, un cliente nos escribió: "Quiero crear un agente de IA que gestione toda mi contabilidad." Cuando le preguntamos qué parte exactamente, dijo: "toda."
Ese proyecto no empezó con código. Empezó con una conversación de 30 minutos para entender qué tarea concreta le estaba quitando más tiempo. Resultó que no necesitaba un agente que gestionara "toda" la contabilidad. Necesitaba uno que clasificara facturas por empresa y trimestre. Eso sí se puede construir en una semana.
Esta guía es el proceso real que seguimos cada vez que creamos un agente de IA. No es teoría. Es lo que hacemos el lunes y entregamos el viernes.
Antes de crear nada: define el problema
El error más frecuente es empezar por la tecnología. "Quiero un agente con GPT-4" es como decir "quiero un coche con motor V8" sin saber adónde vas.
Antes de escribir una línea de código, necesitas responder tres preguntas:
- Qué tarea concreta quieres automatizar. No "mejorar la productividad". Algo como: "clasificar las facturas que llegan por email según empresa y trimestre".
- Quién la hace ahora y cuánto tiempo le dedica. Si nadie la hace, probablemente no necesitas un agente.
- Qué datos necesita el agente. Si los datos no existen o están desordenados, el primer paso no es un agente. Es limpiar datos.
Si no sabes qué es exactamente un agente de IA ni en qué se diferencia de un chatbot, empieza por nuestra guía sobre qué son los agentes de IA. Ahí cubrimos las bases.
Buenos candidatos para un agente de IA
- Tareas que requieren leer y entender texto: documentos, emails, contratos
- Búsquedas en bases de datos grandes donde la consulta es en lenguaje natural
- Clasificación y extracción de datos de documentos que no tienen formato fijo
- Respuestas a preguntas frecuentes con información que cambia (precios, disponibilidad, normativa)
Malos candidatos
- Tareas que un script simple resuelve (enviar un email cada lunes). Para eso, usa automatización con n8n.
- Procesos que requieren criterio humano real (decidir a quién contratar)
- Situaciones donde un error es inaceptable (diagnósticos médicos, asesoría legal vinculante)
La diferencia entre un buen candidato y uno malo suele ser esta: si la tarea se puede describir con un diagrama de flujo fijo, no necesitas un agente. Si la tarea cambia según el contexto, sí.
Elige la arquitectura correcta
No todos los agentes son iguales. Hay tres patrones principales, y elegir el equivocado es la forma más cara de perder tiempo.
Agente RAG (consulta documental)
El más común. El agente busca información relevante en tus documentos antes de generar una respuesta. Cuando un abogado pregunta "cláusulas de penalización en contratos con Empresa X", el agente busca en toda la base documental y devuelve los fragmentos exactos.
Ideal para: bases de conocimiento internas, manuales, contratos, documentación técnica.
Lo explicamos a fondo en nuestra guía sobre qué es RAG.
Agente con herramientas (Tool Use)
El agente tiene acceso a herramientas reales: consultar una API, ejecutar una query SQL, enviar un email, actualizar un CRM. El agente GIS que construimos para el Instituto Cartográfico de Valencia funciona así. Recibe una pregunta en lenguaje natural, genera la query SQL, la ejecuta contra PostGIS, y devuelve los resultados en el mapa.
Ideal para: operaciones que requieren actuar sobre sistemas, no solo consultar.
Agente multi-step (Orquestación)
Combina los dos anteriores. El agente razona sobre qué pasos dar, ejecuta cada uno, y adapta su plan si algo falla. Nuestro agente de clasificación de facturas funciona así: lee el documento, identifica la empresa, clasifica por trimestre, convierte la moneda y archiva. Si algún paso falla, intenta una alternativa.
Ideal para: procesos con varias acciones encadenadas donde las condiciones cambian.
Elige el modelo de lenguaje
La elección del modelo importa menos de lo que parece. Lo que importa es diseñar el agente para que el modelo sea intercambiable.
Dicho esto, hay diferencias reales:
| Factor | GPT-4 | Claude | Gemini | Open source |
|---|---|---|---|---|
| Precisión en tareas complejas | Alta | Alta | Alta | Variable |
| Coste por token | Alto | Medio | Medio | Gratis (infra propia) |
| Velocidad | Media | Media | Alta | Variable |
| Privacidad | Cloud | Cloud | Cloud | Total (local) |
Si manejas datos sensibles (médicos, legales, financieros), los modelos open source como Llama o Gemma permiten ejecución 100% local. Tus datos nunca salen de tu servidor.
Para el resto de casos, Claude y GPT-4 ofrecen la mejor relación calidad/coste.
La regla: no te cases con un modelo. Los agentes bien diseñados permiten cambiar de modelo sin reescribir el sistema. Los precios bajan cada trimestre y las capacidades suben. Lo que hoy es caro, mañana es barato.
Prepara los datos (la parte que nadie quiere hacer)
Aquí es donde la mayoría de proyectos fracasan. No por la IA, sino por los datos.
Hemos visto más proyectos morir por datos desordenados que por modelos mal elegidos. Si tuviéramos que poner un porcentaje: el 70% del éxito de un agente depende de la calidad de los datos, no del modelo.
Lo que necesitas antes de empezar:
- Datos estructurados y accesibles: base de datos con API, archivos con formato consistente
- Documentos en formato legible: PDF con texto, no escaneos sin OCR
- Reglas de negocio documentadas: qué puede hacer el agente, qué no, cuándo escalar a una persona
Lo que pasa si no lo tienes:
El agente responde con información incompleta. Los resultados son inconsistentes. Tu equipo pierde confianza en el sistema. Y lo peor: te convences de que "la IA no funciona" cuando el problema eran los datos.
Invertir dos o tres días en preparar datos ahorra semanas de debugging. No es la parte glamurosa, pero es la que marca la diferencia.
Construye con guardrails desde el primer día
Un agente sin guardrails es un riesgo. No porque la IA sea peligrosa, sino porque se equivoca. Todos los modelos se equivocan.
Estas son las protecciones mínimas que ponemos en cada agente:
- Validación de entrada. El agente rechaza peticiones fuera de su ámbito. Si le preguntas algo que no sabe, dice que no sabe.
- Umbral de confianza. Si no está seguro de una respuesta, lo indica en vez de inventar.
- Escalación a humano. Reglas claras sobre cuándo transferir a una persona. Esto no es un fallo del agente. Es diseño.
- Logging completo. Cada decisión del agente queda registrada. Si algo sale mal, puedes reconstruir exactamente qué pasó.
- Tests con datos reales. No solo con los tres ejemplos del laboratorio. Con los datos feos, incompletos y contradictorios que aparecen en producción.
Despliega, observa y mejora
Un agente no se "lanza". Se despliega, se observa y se mejora.
El ciclo que seguimos:
- Semana 1: despliegue con supervisión intensiva. Revisamos cada respuesta del agente. Corregimos los fallos más evidentes.
- Semanas 2-4: ajustes basados en errores reales. Los patrones que no previmos aparecen aquí.
- Mes 2 en adelante: operación normal con revisión quincenal. El agente ya funciona bien, pero siempre hay margen de mejora.
Métricas que importan:
- Precisión de las respuestas (muestreo manual semanal, no automatizado)
- Tasa de escalación a humano (si es muy alta, el agente no está resolviendo lo suficiente)
- Tiempo de respuesta
- Uso real: si nadie lo usa, no resuelve un problema real. Por bueno que sea técnicamente.
Cuánto cuesta crear un agente de IA
Los costes reales tienen tres componentes:
- Desarrollo inicial: desde 2.500€ (agente simple, 1 semana) hasta 15.000€+ (sistema multi-agente con múltiples integraciones)
- Infraestructura: desde 50€/mes (cloud compartido) hasta 500€+/mes (servidores dedicados)
- Coste de tokens: desde 10€/mes (uso ligero) hasta 500€+/mes (procesamiento masivo)
En la mayoría de casos para pymes, hablamos de 3.500€ de desarrollo y 100-200€/mes de operación. Desglosamos cada línea con ejemplos concretos en cuánto cuesta un agente de IA.
Nuestro proceso: de lunes a viernes
Si tienes un problema claro que cumple los criterios del primer punto, así es como trabajamos:
- Lunes: diagnóstico del problema y los datos. Entendemos qué quieres resolver, qué datos tienes y cómo se conectan tus sistemas.
- Martes-miércoles: diseño de la arquitectura y desarrollo del agente. Elegimos modelo, definimos herramientas, escribimos guardrails.
- Jueves: conexión con tus datos reales. El agente deja de trabajar con datos de prueba y empieza a procesar información real.
- Viernes: demo funcional. Pruebas con tu equipo, ajustes finales, documentación y entrega.
Lo llamamos Sprint Agente. Una semana, un agente funcionando, no una presentación de PowerPoint.
Si no tienes claro si un agente es lo que necesitas, la pregunta más útil es: "qué tarea me gustaría no tener que hacer nunca más." La respuesta suele señalar al candidato correcto.