Nico Finelli, miembro fundador de Vellum, ha ofrecido valiosas perspectivas sobre la inteligencia artificial (IA) y su integración en la industria, con un enfoque especial en la construcción de agentes de IA que realmente aporten valor. Con experiencia en machine learning y modelos de lenguaje, Finelli ha trabajado con empresas de la lista Fortune 500 y ahora está dedicado a guiar a otras organizaciones en el camino de la experimentación a la implementación efectiva de estas tecnologías.
Una encuesta reciente, que involucró a más de 1,200 desarrolladores de IA, reveló que solo el 25% está utilizando sus iniciativas de IA en producción. A pesar del entusiasmo en torno a la IA generativa, muchas organizaciones aún enfrentan desafíos en la fase de prueba. Uno de los obstáculos más destacados es el fenómeno de las «alucinaciones» en los modelos de IA, problema que más del 57% de los encuestados considera su mayor desafío.
La evaluación se presenta como un componente crucial que puede determinar el éxito o fracaso de un sistema de IA. Finelli destaca que muchos equipos que enfrentan alucinaciones dependen de pruebas manuales y retroalimentación de usuarios, lo que indica una falta de procesos robustos para asegurar una implementación efectiva. La ausencia de pruebas automatizadas complica la resolución de estos problemas debido a la especificidad de las aplicaciones de IA.
Las empresas que logran llevar sus sistemas de IA a producción se distinguen por un enfoque disciplinado y bien definido desde el principio. En lugar de seguir modas, priorizan el desarrollo de casos de uso claros y la inclusión de retroalimentación constante entre desarrolladores y expertos, lo que les permite iterar rápidamente. Según Finelli, alrededor del 65-70% de los clientes de Vellum tienen IA en producción, gracias a su rápida capacidad de ajuste y evaluación continua de sus sistemas.
Finalmente, la implementación exitosa de agentes de IA no solo depende de la tecnología, sino también de la estructura y el enfoque adoptados durante el desarrollo. Una evaluación efectiva es fundamental para convertir la IA en una herramienta empresarial útil y duradera.