Última hora 17:20 EE. UU. afirma que 13 buques retrocedieron mientras el bloqueo a Irán enfrenta evasión 17:00 Las petroleras se encaminan a ganancias récord por precios impulsados por la guerra 16:45 El presidente Erdoğan recibe a su homólogo turcochipriota en Estambul 16:40 Fallo crítico en protocolo de IA de Anthropic expone miles de servidores 16:30 El servicio público apuesta por indicadores más eficaces y transparentes 16:20 El Banco Mundial advierte que la guerra en Irán agravará el hambre global 16:15 La derrota de Orban provoca debate interno y llamados a la renovación en Fidesz 16:01 Ikea y Chupa Chups lanzan una piruleta con sabor a albóndigas en una colaboración inesperada 16:00 Escasez de chips 2nm de TSMC obliga a fabricantes a recortar modelos 15:45 España pide una emisión conjunta de deuda en la UE para reducir costes de financiación 15:40 Empresas de IA adoptan modelos de pago por uso en lugar de licencias por usuario 15:30 Legisladores de Ee. Uu. revisan proyecto de ley sobre la industria China de semiconductores 15:20 El presidente libanés rechaza llamada con Netanyahu tras anuncio de Trump 15:15 Suecia replantea el aprendizaje digital y regresa a métodos tradicionales 15:00 BLS International refuerza servicios de visado en Marruecos 15:00 Playmobil abrirá su primera tienda outlet en Francia 14:45 El crecimiento de Starlink se dispara mientras Spacex apunta a su salida a bolsa 14:40 Reguladores globales evalúan riesgos tras avance de IA en ciberseguridad 14:30 Klm cancela 160 vuelos ante el aumento de los costos de combustible 14:20 La UE advierte que los precios del gas seguirán altos durante años 14:15 Ocp recauda 1.5 mil millones de dólares con una emisión histórica de bonos híbridos 14:00 Amex avanza para adquirir hyper y expandir herramientas de gastos con Inteligencia Artificial 13:50 El CEO de Nvidia admite error con Anthropic y defiende su liderazgo en IA 13:45 El Snp de escocia promete limitar los precios de alimentos esenciales antes de las elecciones 13:30 Tpg invierte 100 millones de dólares en la empresa de movilidad estudiantil zum 13:15 Apagar y Leer: Macron insta a los adolescentes a reducir el tiempo de pantalla 13:07 Seguro de salud: los productos menstruales reutilizables serán reembolsados a partir del inicio del curso escolar 12:30 El ministro de comunicación de Burundi es encontrado muerto en su vehículo cerca de Buyumbura 12:20 Erdogan acusa a líderes israelíes de “asesinos de niños” en nueva escalada 12:15 Bny registra un aumento de beneficios impulsado por el crecimiento de comisiones e ingresos por intereses 12:00 La UE dice que Google debe permitir el acceso de motores de búsqueda de terceros a sus datos 12:00 Incendio en refinería australiana agrava crisis energética en Asia 11:45 Kering adquiere participación en la marca de lujo China icicle 11:40 Israel declara el sur del Líbano “zona de muerte” en plena escalada 11:30 El regulador financiero del Reino Unido introduce normas más claras y simples sobre la venta en corto 11:20 El mensaje críptico de Solana sobre XRP desata especulación en el mercado cripto 11:15 Graves inundaciones en República Dominicana y Haití dejan al menos 19 muertos y miles de desplazados 11:00 Los restos de Sophie Narme son exhumados en una investigación de caso sin resolver vinculada a Dominique Pelicot 11:00 Cofundador de Let Amir Hamza gravemente herido en tiroteo en Lahore 10:45 Chanel se expande en California con la adquisición de un nuevo viñedo 10:40 El maquillaje sunkissed lidera las tendencias de belleza de primavera 2026 10:30 Marruecos avanza en la lucha contra el analfabetismo: 2,4 millones de beneficiarios en tres años 10:20 Gartner advierte que la mayoría de migraciones de mainframe con ia fracasarán 10:15 El regulador francés de la competencia multa con 12,7 millones de euros a minoristas por un cártel de productos ecológicos 10:00 La empresa brasileña de pagos ebanx se expande hacia el sudeste asiático 10:00 Nuevo método busca vida extraterrestre mediante patrones planetarios 09:45 El expresidente prorruso de bulgaria lidera la carrera electoral con una agenda anticorrupción 09:40 Propuesta en bitcoin plantea congelar monedas antiguas ante riesgo cuántico 09:30 El Al amplía su acuerdo con boeing con la compra de seis nuevos dreamliners 09:20 Investigadores logran comprometer agentes de ia mediante ataques en github 09:15 Stellantis pondrá fin a la producción de vehículos en la planta de poissy en 2029 09:00 Las negociaciones entre India y Zambia sobre minerales críticos se estancan por derechos mineros 09:00 Un anillo geológico en Marte refuerza la hipótesis de un océano antiguo 08:45 Flydubai reanuda vuelos a Beirut mientras se recupera el transporte aéreo regional 08:40 El mayor experimento gravitacional confirma las leyes de Newton y Einstein 08:30 Jd sports vende su participación en applied nutrition en un acuerdo millonario 08:20 Modelos de IA pueden transmitir rasgos ocultos mediante datos irrelevantes según estudio 08:15 Air liquide invierte en japón para impulsar la producción de chips de ia de próxima generación 08:00 Hays registra una caída en sus ingresos ante la debilidad de la contratación en Alemania 07:50 El Nikkei alcanza récord impulsado por expectativas de diálogo entre Estados Unidos e Irán 07:45 Eqt relanza la venta de ginko con una valoración de mil millones de dólares 07:30 Inditex informa de un acceso no autorizado a bases de datos de transacciones 07:15 La economía del reino unido registra un crecimiento superior a lo esperado a inicios de 2026 07:00 Easyjet advierte sobre mayores pérdidas por el aumento del combustible y costos legales 06:23 Transformar las imperfecciones en obras de arte

Herramientas de programación con IA muestran fallos en tareas clave

Martes 17 Marzo 2026 - 16:00
Herramientas de programación con IA muestran fallos en tareas clave

Un estudio reciente de la Universidad de Waterloo concluye que las herramientas de programación basadas en inteligencia artificial fallan en aproximadamente uno de cada cuatro casos al generar salidas estructuradas, lo que plantea dudas sobre su fiabilidad en entornos reales de desarrollo de software.

La investigación, publicada el 16 de marzo y presentada en la International Conference on Learning Representations 2026, evaluó 11 modelos de lenguaje en 18 formatos estructurados y 44 tareas. Los modelos propietarios más avanzados alcanzaron cerca del 75 por ciento de precisión, mientras que las mejores alternativas de código abierto se situaron en torno al 67 por ciento.

Limitaciones en formatos estructurados

El estudio, titulado “StructEval: Benchmarking LLMs’ Capabilities to Generate Structural Outputs”, analizó la capacidad de los modelos para generar formatos clave como JSON, YAML, CSV, HTML, React y SVG, fundamentales para integrarse en sistemas de desarrollo.

Los investigadores aplicaron pruebas de validación sintáctica, coincidencia de palabras clave y evaluación visual. Los resultados muestran que los modelos responden mejor en tareas basadas en texto, como documentación o estructuras simples, pero presentan dificultades en tareas más complejas.

Los mayores errores se registraron en la generación de contenido visual, diseño web dinámico y código de diagramas. Además, las tareas que implican generar estructuras a partir de lenguaje natural resultaron más complejas que las de conversión entre formatos.

Supervisión humana sigue siendo clave

El equipo estuvo formado por Dongfu Jiang, Jialin Yang y Wenhu Chen, junto con otros colaboradores. Jiang explicó que el análisis se centró en la corrección sintáctica y en la relevancia de la respuesta.

Subrayó que los desarrolladores aún necesitan supervisar de cerca las salidas generadas por IA, especialmente en proyectos donde la precisión es crítica.

Chen destacó el enfoque colaborativo de investigación en Waterloo, donde los estudiantes participan activamente en la creación y evaluación de modelos.

Uso generalizado frente a riesgos ocultos

El informe llega en un contexto de adopción masiva de herramientas de programación con IA. Según The Pragmatic Engineer, el 95 por ciento de los desarrolladores utiliza estas herramientas al menos una vez por semana, y el 75 por ciento depende de ellas para gran parte de su trabajo.

Herramientas como GitHub Copilot, Claude Code y Cursor se han vuelto habituales. Sin embargo, el estudio advierte que los errores en salidas estructuradas pueden pasar desapercibidos y provocar fallos en sistemas complejos.

Estos problemas pueden amplificarse dentro de infraestructuras críticas, lo que refuerza la necesidad de controles humanos y procesos de validación.

El estudio ha sido publicado en Transactions on Machine Learning Research.


  • Fajr
  • Amanecer
  • Dhuhr
  • Asr
  • Maghrib
  • Isha

Este sitio web, walaw.press, utiliza cookies para ofrecerle una buena experiencia de navegación y mejorar continuamente nuestros servicios. Al continuar navegando por este sitio, acepta el uso de estas cookies.