La ingeniería agéntica designa una forma estructurada de trabajar con agentes de IA capaces de modificar código, ejecutar pruebas y preparar cambios. La diferencia con el vibe coding es simple: el vibe coding acelera la exploración, la ingeniería agéntica asegura la entrega. Para un proyecto de pyme, esto cambia sobre todo los riesgos, los plazos de validación y el presupuesto de mantenimiento.
Ingeniería agéntica: lo que el término abarca realmente
La ingeniería agéntica, o agentic software engineering, no consiste en “dejar que la IA programe en su lugar”. Consiste en organizar el trabajo entre humanos y agentes de IA, con objetivos, restricciones, pruebas, una revisión humana y un rastro de lo que se ha hecho.
Un agente de IA es un software capaz de ejecutar varias acciones para alcanzar un objetivo: leer un repositorio Git, modificar archivos, ejecutar un comando, crear una pull request (solicitud de fusión), e incluso llamar a un servicio externo. En mayo de 2025, OpenAI lanzó Codex en versión preliminar de investigación, GitHub puso Copilot coding agent en public preview, Google anunció Jules en beta pública y Anthropic puso Claude Code a disposición general. Por tanto, ya no es una hipótesis de laboratorio.
La verdadera ruptura no es que la IA escriba código. Los asistentes ya lo hacen desde GitHub Copilot en 2021. La ruptura es que la IA entra en el flujo de producción: tickets, ramas, pruebas, linters (herramientas de control automático del código), revisiones, integración continua.
Vibe coding: excelente para explorar, frágil para entregar
El “vibe coding” fue popularizado por Andrej Karpathy a principios de 2025 para describir una práctica en la que se pide a la IA que produzca código en lenguaje natural, aceptando en gran medida sus propuestas sin mirar demasiado el detalle. Collins incluso lo convirtió en su palabra del año 2025, definiéndolo como el uso de la IA, guiada por prompts, para ayudar a escribir código informático.
Para un directivo, el interés es evidente. Una idea puede convertirse en una maqueta en pocas horas. Un formulario, un script interno, una página de demostración o un prototipo de aplicación pueden sortir rápido, a veces por unos pocos cientos de euros de tiempo humano si el alcance sigue siendo muy reducido.
Pero la trampa es discreta. Una demostración que funciona delante de tres usuarios no es forcamente una base sólida para un producto que deberá gestionar pagos con Stripe, datos personales sujetos al RGPD, derechos de acceso o un aumento de carga. El coste oculto llega más tarde: deuda técnica (código difícil de hacer evolucionar), fallos de seguridad, incoherencias funcionales y ausencia de pruebas.
En los proyectos que llevamos, vemos a menudo el mismo escenario: el prototipo de IA impresiona al principio, pero luego el equipo descubre que hay que rehacer la arquitectura antes de añadir funciones de negocio serias. En esta fase, a veces es mejor volver a empezar limpiamente que reparar capa tras capa.
La diferencia que importa: intención, control y prueba
El vibe coding parte de una intención difusa: “hazme una app que permita…” La ingeniería agéntica parte de un marco: requisitos, reglas de negocio, restricciones de seguridad, entorno de ejecución, estrategia de pruebas y criterios de aceptación.
Esta diferencia parece teorica. No lo es. Si un agente de GitHub Copilot trabaja en un entorno GitHub Actions seguro, como GitHub lo describió en mayo de 2025, puede procesar una issue, ejecutar las pruebas, subir una rama y solicitar una revisión. El humano ya no verifica solo “¿funciona en mi pantalla?”, sino “¿el cambio respeta nuestras reglas y puede entregarse sin romper el resto?”
Google Jules, anunciado en beta pública en mayo de 2025, sigue la misma lógica asíncrona: leer el código y ejecutar tareas como escribir pruebas o corrigir errores. Claude Code, por su parte, añadió tareas en segundo plano mediante GitHub Actions e integraciones nativas con VS Code y JetBrains. Cursor 1.0 también anunció en junio de 2025 BugBot, el acceso a Background Agents y la instalación de MCP con un clic.
El MCP, o Model Context Protocol, sirve precisamente para conectar agentes de IA a fuentes de contexto: archivos, bases de datos, herramientas internas, documentación. Para entender este componente, un desvío por el papel del MCP en la conexión de los agentes de IA con los datos ayuda a distinguir un simple chatbot de un agente integrado en el sistema de información.
| Acérquese a | Uso pertinente | Plazo realista | Presupuesto orientativo en Francia | Riesgo principal |
|---|---|---|---|---|
| Vibe coding solo | Prototipo, demo, herramienta desechable | 1 a 5 días | Alrededor de 500 a 3 000 € según el acompañamiento | Código difícil de mantener |
| Asistente de IA supervisado | Desarrollo clásico acelerado | 2 a 8 semanas | A menudo 5 000 a 30 000 € para un MVP sencillo | Calidad variable si la revisión es insuficiente |
| Ingeniería agéntica | Producto evolutivo, equipo, deuda que hay que controlar | 4 a 12 semanas para definir y entregar una primera base | Más bien 15 000 a 60 000 € según el alcance y los requisitos | Mala definición de las limitaciones |
Lo que esto cambia para su presupuesto y sus plazos
El vibe coding da la impresión de reducir el presupuesto porque produce rápidamente algo visible. Eso es cierto en la fase de exploration. Sinceramente, para probar una idea ante inversores o validar un recorrido de usuario, este enfoque puede ser muy rentable.
El límite aparece en cuanto el software se convierte en un activo de la empresa. Una aplicación empresarial, un portail de cliente o una plateforme de comercio electrónico deben sobrevivir a los cambios: nueva regla de facturación, nuevo proveedor de pagos, rediseño móvil, requisitos del RGPD, correction de una vulnerabilidad. Si el código se ha aceptado sin estrategia, cada evolución se vuelve más lenta.
La ingeniería agéntica cuesta más al principio porque exige una definición previa. Se define qué puede modificar el agente, cómo debe probar, qué comandos puede ejecutar, quién valida y qué rastros quedan disponibles. Este trabajo puede representar desde unos días hasta dos semanas incluso antes de las primeras funcionalidades visibles.
A cambio, la entrega se vuelve más predecible. Los agentes pueden tratar tareas aisladas mientras los desarrolladores se centran en los arbitrajes complejos: arquitectura, seguridad, experiencia de usuario, dependencias críticas. La ganancia no es mágica, pero puede ser clara en las corrections repetitivas, la escritura de pruebas y la puesta al día de pequeños módulos.
Las salvaguardas que hay que exigir antes de confiar código a un agente
Un agente que puede modificar archivos es útil. Un agente que puede modificar archivos, acceder a secretos y desplegar en producción sin control es peligroso. El matiz es fundamental para una pyme.
- Limitar los accesos: sin claves de producción, sin base de clientes real, sin permisos amplios por defecto.
- Trabajar en ramas Git separadas, con pull request obligatoria y revisión humana.
- Exigir pruebas automatizadas: unitarias, funcionales o como mínimo pruebas de no regresión en los recorridos sensibles.
- Documentar las restricciones: RGPD, roles de usuario, reglas de pago, conservación de los datos, logs.
- Trazar las decisiones: qué issue se ha tratado, por qué agente, con qué archivos modificados y qué pruebas se han lanzado.
- Prever un entorno aislado, por ejemplo mediante GitHub Actions, un contenedor Docker o una infraestructura cloud dedicada.
Estas precauciones coinciden con las orientaciones de los trabajos recientes sobre agentic engineering. El artículo de arXiv “Agentic Agile-V”, publicado en mayo de 2026, insiste especialmente en el valor de los requisitos, las restricciones, la trazabilidad, la verificación independiente y la aprobación humana. Dicho de forma sencilla: cuanto más actúa la IA, más explícito debe ser el marco.
La seguridad no debe tratarse a posteriori. Un agente mal configurado puede copiar una dependencia vulnerable, exponer un token (clave secreta) o modificar un control de acceso sin comprender el impacto de negocio. Para una pyme, el riesgo no es solo técnico: afecta a la conformité, a la reputación y, a veces, a la continuidad de la actividad. Los mismos reflejos valen para los temas de IA más amplios, en particular los cubiertos por la conformité AI Act para las pymes que utilizan ChatGPT y Claude.
Cuándo el vibe coding sigue siendo la buena elección
No todo merece una fábrica de pruebas y agentes. Una maqueta de landing page, un script de import puntual o un prototipo desechable pueden producirse perfectamente con vibe coding, siempre que se asuma que no se industrializarán tal cual.
La mala decisión sería transformar automáticamente un prototipo en producto. Es tentador, porque ya se tiene algo que funciona. Sin embargo, a menudo es ahí donde empiezan los problemas: ausencia de un modelo de datos robusto, gestión aproximada de errores, seguridad mínima, dependencias elegidas al azar.
Para empezar bien sin invertir en exceso, un enfoque razonable consiste en separar dos fases. Primero, explorer rápido con la IA, eventualmente en VS Code o Cursor. Después, decidir qué merece una reescritura limpia. Si quiere acotar esta primera fase, un inicio metódico del vibe coding con VS Code ya permite evitar los errores más burdos.
Cómo elegir para un proyecto web o móvil
La buena decisión depende menos de la tecnología que del nivel de riesgo. Una aplicación interna utilizada por cinco personas no requiere las mismas exigencias que una plataforma SaaS con suscripciones, datos personales y soporte al cliente.
Por parte de la agencia, el reflejo es clasificar el proyecto según tres preguntas: qué pasa si el software se avería, qué pasa si los datos se filtran y cuánto costará una evolución dentro de seis meses. Estas respuestas orientan el nivel de control que debe ponerse en torno a los agentes.
Para un sitio escaparate WordPress, la IA puede acelerar la producción de componentes, contenidos estructurados o scripts de integración, pero el valor sigue estando en el SEO, el rendimormiento, la accesibilidad y el mantenimiento. Para una aplicación móvil React Native, Flutter o native iOS/Android, la ingeniería agentica se vuelve más interesante en cuanto hay que mantener pruebas, gestionar API y seguir varias versiones.
La elección de la base técnica sigue teniendo peso. Un agente no compensa una mala arquitectura JavaScript, un runtime mal elegido o una deuda acumulada. Si su proyecto se basa en Node.js, Bun o Deno, las decisiones descritas en la elección de un runtime JavaScript en 2026 siguen siendo válidas, con o sin IA.
Otro punto que a menudo se olvida: el alojamiento. OVHcloud, Scaleway, AWS o Google Cloud no plantean las mismas cuestiones de costes, localización de los datos, registro e aislamiento de los entornos. Cloudflare también puede intervenir para la protección DNS, la caché o algunas reglas de seguridad. El agente debe trabajar dentro de este marco, no al margen.
Definir este tipo de proyecto de antemano evita la mayoría de las malas sorpresas: alcance difuso, prototipo imposible de mantener, agente demasiado libre o ausencia de pruebas. A menudo es en este momento cuando una mirada externa hace ganar tiempo, porque transforme una promesa de IA en un método de entrega controlable.
Preguntas frecuentes sobre la ingeniería agéntica y el vibe coding
¿Sustituirá la ingeniería agéntica a los desarrolladores?
No, desplaza sobre todo su papel hacia el encuadre, la verificación, la arquitectura y las decisiones de producto. Los agentes ejecutan mejor tareas bornées que arbitrajes de negocio ambiguos.
¿Es peligroso el vibe coding para una pyme?
No si sirve para prototipar o probar una idea. Se vuelve arriesgado cuando el código generado se pone en producción sin revisión, sin pruebas y sin control de accesos.
¿Qué herramienta elegir entre Codex, Claude Code, Jules, Cursor y Copilot?
La elección depende sobre todo de su entorno: GitHub, VS Code, JetBrains, Google Cloud o workflows internos. Compare los permisos, la integración con las pruebas, la trazabilidad y la facilidad de revisión antes de la calidad percibida de las respuestas.
¿Cuánto tiempo se necesita para poner en marcha un enfoque agéntico?
Para un equipo pequeño, cuente a menudo con una o dos semanas para definir las reglas, aislar los entornos, conectar las pruebas y former a los desarrolladores. Un producto complejo requerirá más bien varias iteraciones.