Última hora 19:04 La primera ministra de Perú dimite semanas antes de las elecciones presidenciales 16:15 Turquía lista para acoger la próxima ronda de conversaciones entre Rusia y Ucrania 16:00 Taghazout Bay acoge una prueba clave de la WSL 16:00 Herramientas de programación con IA muestran fallos en tareas clave 15:45 Sri Lanka aprueba compras de combustible de emergencia ante preocupaciones por el suministro 15:30 Presunta visita de firma de espionaje israelí aumenta tensiones antes de las elecciones en Eslovenia 15:20 El telescopio Webb detecta la bruma atmosférica más densa en un exoplaneta 15:15 México dispuesto a acoger los partidos de Irán en el Mundial ante preocupaciones de seguridad 15:00 Las autoridades sirias prohíben el alcohol en Damasco 14:50 Acciones de Neste suben tras mejoras de previsión por alza del combustible 14:45 Bank Al-Maghrib prevé un crecimiento económico del 5,6 % para Marruecos en 2026 14:30 El futbolista marroquí Neil El Aynaoui y su familia víctimas de un violento robo en su casa en Roma 14:20 Emiratos Árabes Unidos cierra brevemente su espacio aéreo por ataques entre Irán e Israel 14:17 Trump dice que eeuu debería “tomar” cuba mientras isla se ahoga en crisis energética 14:16 La Federación Francesa de Rugby sufre un ciberataque que afecta a 530.000 miembros 14:00 Los precios del combustible siguen aumentando en Líbano en medio de tensiones regionales 13:56 Republicanos aprueban nuevos mapas en cuatro estados durante ofensiva de redistritación 13:50 El petróleo supera los 100 dólares por nuevas tensiones en el estrecho de Ormuz 13:45 Muere a los 88 años Shigeaki Mori, sobreviviente de Hiroshima 13:41 Casi 470 millones de niños viven en zonas de conflicto armado 13:34 Marruecos impulsa la IA agrícola para sostener el crecimiento económico 13:30 España aprueba la liberación de reservas de petróleo para aliviar la escasez de suministro 13:20 Solana supera los 90 dólares impulsado por ETF y liquidaciones cortas 13:15 Condenan a un hombre en Marruecos por difundir información falsa en el caso Soundous 13:00 Kabul golpeada por un ataque aéreo mortal en medio de crecientes tensiones entre Afganistán y Pakistán 12:54 La superstición persiste en Marruecos pese al aumento del escepticismo 12:50 La presentación de DLSS 5 de Nvidia genera críticas por gráficos con IA 12:45 El Banco de Inglaterra presenta un plan para reforzar la liquidez bancaria en crisis 12:39 Dell lanza el primer ordenador de escritorio con el chip GB300 de Nvidia 12:39 Líbano condena un presunto plan de sabotaje de Hezbollah en Kuwait 12:20 Dúo canadiense gana el Oscar a mejor diseño de producción por Frankenstein 12:15 Marroquíes obtienen nominaciones en los Africa Golden Awards 2026 12:00 Hyundai retira 68.500 vehículos tras un incidente mortal relacionado con asientos eléctricos 11:50 Jessie Buckley hace historia al ganar el Oscar a mejor actriz 11:20 Kpop Demon Hunters gana dos Oscar en una noche histórica para el K-pop 11:15 ONCF refuerza los trenes por el aumento de viajes en Aid al Fitr 11:06 Adopt inicia su expansión en Marruecos con tres tiendas 10:50 Nvidia presenta DLSS 5 y un chip de IA espacial en la GTC 2026 10:20 Las bolsas asiáticas suben impulsadas por la IA mientras el petróleo supera los 102 dólares 09:50 Zambia rechaza acuerdo con EEUU que vincula ayuda sanitaria a minerales 09:20 Gestores liquidan $36.000 millones en futuros del S&P 500 por tensión con Irán 08:50 El yen se acerca a 160 mientras mercados esperan decisiones de la Fed y el BoJ 08:20 Ethereum alcanza máximo de seis semanas tras subida del mercado cripto 07:50 El sector de fosfatos de Marruecos resiste ante el alza global de fertilizantes 07:20 El turismo en Marruecos alcanza casi 900.000 empleos con fuerte crecimiento 07:00 Científicos detectan todas las bases genéticas en muestras de Ryugu

Herramientas de programación con IA muestran fallos en tareas clave

16:00
Herramientas de programación con IA muestran fallos en tareas clave

Un estudio reciente de la Universidad de Waterloo concluye que las herramientas de programación basadas en inteligencia artificial fallan en aproximadamente uno de cada cuatro casos al generar salidas estructuradas, lo que plantea dudas sobre su fiabilidad en entornos reales de desarrollo de software.

La investigación, publicada el 16 de marzo y presentada en la International Conference on Learning Representations 2026, evaluó 11 modelos de lenguaje en 18 formatos estructurados y 44 tareas. Los modelos propietarios más avanzados alcanzaron cerca del 75 por ciento de precisión, mientras que las mejores alternativas de código abierto se situaron en torno al 67 por ciento.

Limitaciones en formatos estructurados

El estudio, titulado “StructEval: Benchmarking LLMs’ Capabilities to Generate Structural Outputs”, analizó la capacidad de los modelos para generar formatos clave como JSON, YAML, CSV, HTML, React y SVG, fundamentales para integrarse en sistemas de desarrollo.

Los investigadores aplicaron pruebas de validación sintáctica, coincidencia de palabras clave y evaluación visual. Los resultados muestran que los modelos responden mejor en tareas basadas en texto, como documentación o estructuras simples, pero presentan dificultades en tareas más complejas.

Los mayores errores se registraron en la generación de contenido visual, diseño web dinámico y código de diagramas. Además, las tareas que implican generar estructuras a partir de lenguaje natural resultaron más complejas que las de conversión entre formatos.

Supervisión humana sigue siendo clave

El equipo estuvo formado por Dongfu Jiang, Jialin Yang y Wenhu Chen, junto con otros colaboradores. Jiang explicó que el análisis se centró en la corrección sintáctica y en la relevancia de la respuesta.

Subrayó que los desarrolladores aún necesitan supervisar de cerca las salidas generadas por IA, especialmente en proyectos donde la precisión es crítica.

Chen destacó el enfoque colaborativo de investigación en Waterloo, donde los estudiantes participan activamente en la creación y evaluación de modelos.

Uso generalizado frente a riesgos ocultos

El informe llega en un contexto de adopción masiva de herramientas de programación con IA. Según The Pragmatic Engineer, el 95 por ciento de los desarrolladores utiliza estas herramientas al menos una vez por semana, y el 75 por ciento depende de ellas para gran parte de su trabajo.

Herramientas como GitHub Copilot, Claude Code y Cursor se han vuelto habituales. Sin embargo, el estudio advierte que los errores en salidas estructuradas pueden pasar desapercibidos y provocar fallos en sistemas complejos.

Estos problemas pueden amplificarse dentro de infraestructuras críticas, lo que refuerza la necesidad de controles humanos y procesos de validación.

El estudio ha sido publicado en Transactions on Machine Learning Research.


  • Fajr
  • Amanecer
  • Dhuhr
  • Asr
  • Maghrib
  • Isha

Este sitio web, walaw.press, utiliza cookies para ofrecerle una buena experiencia de navegación y mejorar continuamente nuestros servicios. Al continuar navegando por este sitio, acepta el uso de estas cookies.