By Antonio Moreno

Automejora recursiva a partir de modelos de IA

DATE: febrero 11, 2026
READ: ...
TAGS: ,
ACTION: /

OpenAI pasó de su última versión del Codex, el 18 de diciembre de 2025, a una versión ampliamente reconocida como mucho más potente en menos de dos meses. Esto se compara con los frecuentes intervalos de seis meses o incluso un año entre versiones. Si OpenAI mantiene ese ritmo, podremos obtener fácilmente cuatro actualizaciones importantes en un año.

Pero los resultados de lo que en el mundo de la IA se denomina "automejora recursiva" podrían ser más radicales. Tras una o dos iteraciones, el modelo probablemente podrá actualizarse aún más rápido. Supongamos que para la tercera actualización en un año, se puede producir una actualización adicional en tan solo un mes. Para la segunda mitad de ese año, de repente podríamos tener seis actualizaciones, una al mes: un ritmo aún más rápido.

La automejora recursiva es un concepto fundamental en la teoría de la inteligencia artificial (IA) que describe un proceso en el cual un sistema de IA utiliza su propia inteligencia para rediseñarse o mejorar su propio código y algoritmos. Lo que hace que este proceso sea "recursivo" es que cada versión mejorada de la IA se vuelve más capaz de realizar la siguiente mejora, creando un ciclo de retroalimentación positiva.

Dependerá de las cifras exactas que se postulen, pero es fácil ver que, muy pronto, el ritmo de mejora podría ser de cinco a diez veces mayor con la IA a cargo de la mayor parte de la programación. Ese es el escenario al que nos dirigimos, y se reveló en los comunicados de la semana pasada.

Diversas complicaciones limitan el ritmo de mejora. En el futuro previsible, las IA requerirán guía y asistencia humana para mejorar. Esto limita la velocidad de las mejoras. El departamento legal de una empresa podría tener que aprobar cualquier lanzamiento de un nuevo modelo, y es necesario elaborar un plan de marketing. Las decisiones finales recaen en las personas. Los flujos de datos, la integración de productos y las pruebas de seguridad presentan retrasos adicionales, y los gastos de energía y computación se convierten en problemas cada vez más importantes.

Donde el avance realmente importa es en las tareas de programación avanzada. Si deseas crear tu propia aplicación, ahora es posible en poco tiempo. Si una empresa de videojuegos quiere diseñar y probar un nuevo concepto de juego, el proceso será mucho más rápido que antes. Gran parte del trabajo que realizan las grandes empresas de software ahora puede ser realizado por equipos mucho más pequeños y a un menor coste. Las mejoras en áreas como el diseño de chips y el software para drones llegarán mucho más rápido. Y estos avances se filtrarán a áreas como la producción cinematográfica, donde el ya rápido avance de la IA se acelerará aún más.

¿El 2025 fue realmente el año de los agentes de IA?

DATE: febrero 07, 2026
READ: ...
TAGS: ,
ACTION: /

 El 5 de enero de 2025, Sam Altman, CEO de OpenAI, proyectó una visión audaz: el ingreso de los agentes de IA en el mercado laboral como un motor de cambio en la productividad empresarial.

Al cerrar el ciclo de 2025 e iniciar 2026, el balance de esta predicción revela una realidad fragmentada. Dependiendo del sector, la IA agéntica es ya una herramienta cotidiana o una promesa tecnológica bajo estricta observación.

La vanguardia del software: Programación agéntica

El sector del desarrollo de software ha sido el primero en adoptar plenamente esta tecnología. Ingenieros y programadores han integrado herramientas como Cursor y Claude Code no solo como asistentes, sino como controladores diarios de su flujo de trabajo.

La adopción ha sido fluida gracias a la naturaleza del desarrollo de software:

  • Integración en IDE: La IA agéntica se acopla a entornos de desarrollo integrados (IDE) ya existentes, facilitando la transición.

  • Automatización de tareas repetitivas: Los agentes gestionan de forma autónoma la creación y ejecución de pruebas de código (testing), corrigiendo errores sobre la marcha sin intervención humana.

  • Protocolos de interoperabilidad: Tecnologías como el Protocolo de Contexto de Modelo (MCP) de Anthropic y Agent2Agent de Google permiten que los agentes se comuniquen con otro software para verificar resultados en tiempo real.


El desafío de la implementación: Entre el entusiasmo y la cautela

A pesar del éxito en la programación, la implementación en otros sectores empresariales enfrenta obstáculos significativos. Michael Hannecke, consultor en Bluetuple.ai, señala que, aunque el interés es masivo, la puesta en producción es limitada debido a la complejidad de aplicar la IA a procesos de negocio reales.

En regiones como Europa, y específicamente en Alemania, existe una marcada prudencia ante los riesgos de la automatización. Las organizaciones se encuentran en una fase de evaluación, frenadas por lo que algunos denominan "angustia ante la automatización", derivada de la incertidumbre sobre el comportamiento de los agentes en escenarios no controlados.


El factor crítico: Responsabilidad y rendición de cuentas

Uno de los mayores frenos para la autonomía total de la IA es el concepto de responsabilidad legal y profesional. Empresas como Autodesk han desarrollado asistentes como Assistant, integrados en AutoCAD y Revit, pero con una delimitación clara: la IA orienta y resume, pero el arquitecto o ingeniero sigue siendo el responsable final de cada actualización en los bocetos.

Kiana Jafari, investigadora de la Universidad de Stanford, destaca una brecha fundamental entre la precisión técnica y la confianza del usuario:

  • Métricas Técnicas: El 83 % de las evaluaciones se centran en la precisión y finalización de tareas.

  • Métricas Humanas: En campos como la medicina, un margen de error mínimo (0.001 %) es inaceptable si la responsabilidad legal recae exclusivamente en el profesional humano.


Perspectivas para 2026: Del prototipo a la escala

La experiencia de 2025 demuestra que la IA agéntica no es una solución universal de "conectar y usar". Mientras que para un programador es un multiplicador de productividad, para un médico o un arquitecto es un asesor que requiere supervisión constante.

Según los expertos, 2025 fue el año de la experimentación y el prototipado. El desafío para 2026 será trasladar estos modelos a entornos de producción a gran escala, resolviendo las complejidades de seguridad, ética y responsabilidad que surgieron durante este primer año de despliegue laboral.

Los puntos de referencia de IA buscan mejorar la seguridad empresarial

DATE: febrero 07, 2026
READ: ...
TAGS: ,
ACTION: /

 Los agentes de IA proliferan y adquieren una autonomía cada vez mayor. Desde la navegación web avanzada hasta la mejora recursiva de sus propias capacidades de programación, la IA agéntica promete reorganizar la economía digital y redefinir la arquitectura de internet.

Sin embargo, para el entorno corporativo, estos agentes representan un riesgo significativo. La transición de la asistencia a la automatización total es una decisión crítica, especialmente cuando las entidades artificiales operan con libertad para ejecutar acciones cruciales, desde transacciones financieras hasta la coordinación de cadenas de suministro complejas. Para mitigar esta vulnerabilidad, investigadores de la Universidad Carnegie Mellon y Fujitsu han desarrollado tres parámetros de medición —o benchmarks— que determinan si un agente de IA es lo suficientemente seguro y eficaz para gestionar operaciones comerciales sin supervisión humana. Estos estándares fueron presentados el pasado 26 de enero en la Conferencia AAAI 2026 sobre Inteligencia Artificial, celebrada en Singapur.

FieldWorkArena: Seguridad en el terreno operativo

El primer indicador, denominado FieldWorkArena, evalúa a los agentes desplegados en entornos logísticos y de fabricación, como fábricas y almacenes. Este parámetro mide la precisión de la IA al detectar infracciones de seguridad, desviaciones en los procedimientos y la generación de informes de incidentes.

Por ejemplo, un agente encargado de verificar el cumplimiento del uso de Equipo de Protección Individual (EPI) en zonas de alto riesgo debe ser capaz de:

  • Interpretar las normativas de seguridad vigentes.

  • Identificar a los trabajadores presentes en el área.

  • Analizar si la indumentaria cumple con los estándares exigidos.

  • Reportar con exactitud el nivel de cumplimiento del personal.

A diferencia de las simulaciones teóricas, FieldWorkArena utiliza datos del mundo real, incluyendo manuales operativos, normativas e imágenes capturadas in situ. Hideo Saito, profesor de la Universidad Keio, subraya que la privacidad es fundamental en estos casos; por ello, los datos fueron obtenidos bajo consentimiento y se aplicaron técnicas de desenfoque en rostros y áreas sensibles para proteger la identidad de los trabajadores.

Los investigadores evaluaron tres de los modelos de lenguaje multimodales (LMM) más avanzados: Claude Sonnet 3.7 de Anthropic, Gemini 2.0 Flash de Google y GPT-4o de OpenAI. Los resultados revelaron una brecha importante: aunque destacaron en el reconocimiento de imágenes y extracción de datos, los modelos mostraron una baja precisión general, presentando dificultades para medir distancias específicas, contar objetos con exactitud y evitar alucinaciones.


Mitigación de alucinaciones y acceso a datos fiables

Además de FieldWorkArena, disponible en GitHub, el equipo presentó otros dos indicadores que se abrirán al público próximamente:

  1. ECHO (Evidence-preceded Hallucination Observation): Este parámetro evalúa la eficacia de las estrategias para mitigar alucinaciones en los Modelos de Lenguaje Visual (VLM). Los hallazgos sugieren que técnicas como el recorte de imágenes —para centrar la atención del modelo en regiones críticas— y la aplicación de aprendizaje por refuerzo para el razonamiento pueden minimizar significativamente los errores en las respuestas generadas a partir de entradas visuales.

  2. Benchmark Empresarial RAG (Generación Aumentada por Recuperación): Evalúa la capacidad de los agentes para extraer información de bases de conocimiento corporativas fiables. Las métricas incluyen la precisión en la recuperación de áreas relevantes y la validez del razonamiento lógico basado en la información recuperada.

Hiro Kobashi, director sénior de proyectos en Fujitsu Research, enfatiza que la demanda de estos indicadores proviene de la inseguridad de los clientes corporativos ante la opacidad de los LLM.

 "Queremos ofrecerles referencias sólidas y suficientes", afirma.

El futuro de estos parámetros reside en su actualización continua. A medida que los agentes de IA evolucionen y superen los estándares actuales, se requerirán benchmarks más exhaustivos que guíen el desarrollo de una IA empresarial verdaderamente autónoma y segura.

¿Puede la IA mejorar la precisión del arbitraje en el patinaje artístico?

DATE: febrero 07, 2026
READ: ...
TAGS: ,
ACTION: /

 Del 6 al 22 de febrero, los Juegos Olímpicos de Invierno de 2026 en Milán-Cortina d'Ampezzo,

Italia, no solo reunirán a la élite del deporte invernal, sino que también servirán de escenario para las tecnologías más avanzadas del sector.

Desde que en 1956 la firma suiza Omega introdujera las puertas electrónicas de salida en Cortina d'Ampezzo, marcando el inicio del cronometraje automatizado, la evolución ha sido constante.

En esta edición, Swiss Timing —filial de Omega bajo el conglomerado Swatch Group— presenta una nueva generación de sistemas de análisis de movimiento y visión artificial. Entre las innovaciones más destacadas se encuentran cámaras de fotofinish capaces de capturar hasta 40,000 imágenes por segundo.

"Trabajamos en estrecha colaboración con los atletas", señala Alain Zobrist, director ejecutivo de Swiss Timing, quien lidera el cronometraje olímpico desde Turín 2006. "Ellos son los principales usuarios de nuestra tecnología y servicios; necesitan comprender cómo operan nuestros sistemas para depositar su confianza en ellos".

La revolución de la rotación en el patinaje artístico

El patinaje artístico, uno de los pilares de la audiencia televisiva olímpica, experimentará una transformación técnica sustancial en Milán-Cortina 2026. Un despliegue de catorce cámaras con resolución 8K alrededor de la pista capturará cada movimiento de los patinadores. "Empleamos software propietario para interpretar las imágenes y proyectar el desempeño de los atletas en un modelo 3D", explica Zobrist. "La IA procesa estos datos para rastrear la trayectoria y la posición en los ejes X, Y y Z".

El sistema cuantifica la altura de los saltos, el tiempo de suspensión y la velocidad de aterrizaje de forma instantánea, generando mapas de calor y gráficos técnicos. "Todo el proceso, desde la captura del dato hasta su visualización gráfica en televisión, ocurre en menos de una décima de segundo", asegura Zobrist.

Diversos modelos de IA asisten a cronistas y jueces en el análisis de cada ejecución:

  • Estimación de pose: Una IA ayuda al sistema de visión artificial a comprender e identificar las posiciones del cuerpo grabadas por las cámaras.

  • Interpretación de datos: Un segundo modelo, similar a un modelo de lenguaje extenso (LLM), traduce la información recopilada en métricas comprensibles.

Una de las funciones más disruptivas es la detección del ángulo de la cuchilla, proporcionando a los jueces datos objetivos para evaluar decisiones técnicas y estéticas. Zobrist adelanta que futuras versiones podrán determinar con precisión matemática si una rotación ha sido completada: "Si la rotación es de 355 grados, se aplicará la deducción correspondiente", puntualiza. Esta tecnología se inspira en los sistemas utilizados por Omega en los Juegos Olímpicos de París 2024 para el salto de trampolín, donde se medía la distancia crítica entre el saltador y la plataforma.

Biomecánica en el salto de esquí

A diferencia del patinaje, el salto de esquí combina la visión por computadora con sensores físicos. "Utilizamos un sensor ligero fijado a cada esquí, no al cuerpo del atleta", aclara Zobrist. Estos dispositivos transmiten datos sobre velocidad, aceleración y posición aerodinámica, correlacionando el rendimiento con las condiciones del viento y otros factores ambientales.

Cámaras de alta velocidad y tecnología estroboscópica permiten desglosar la posición corporal durante el vuelo. "Los primeros 20 a 30 metros tras el despegue son determinantes; la precisión al adoptar la posición en V influye drásticamente en el resultado final", afirma Zobrist. El sistema detecta fallos biomecánicos en tiempo real, como la sobrerrotación o subrrotación, permitiendo un diagnóstico exacto de cada salto.

El cronometraje cuántico y la meta virtual

Para disciplinas como el bobsleigh, Omega ha desarrollado un fotofinish virtual que unifica visualmente trineos de diferentes mangas en una sola referencia comparativa. No obstante, los resultados oficiales siguen dependiendo de las células fotoeléctricas, que detienen el reloj al interrumpirse un rayo de luz en la meta.

La precisión absoluta reside en el temporizador cuántico de Omega. "Podemos medir el tiempo con una resolución de millonésimas de segundo (seis dígitos decimales), con una desviación de apenas 23 nanosegundos cada 24 horas", explica Zobrist. Esta tecnología, calibrada de forma permanente, garantiza que, en una competición donde la victoria se decide por milisegundos, el arbitraje sea indiscutible.

Un radiotelescopio aterriza en la cara oculta de la Luna

DATE: febrero 07, 2026
READ: ...
TAGS: ,
ACTION: /

 De niño, durante la década de los 70, seguía las misiones Apolo a través de la televisión, atraído como una polilla curiosa por el resplandor de los tubos de rayos catódicos. Mientras tanto, la música de Pink Floyd resonaba con fuerza en los altavoces del Oldsmobile Cutlass Supreme de mi madre, sumergiéndonos en la mística de The Dark Side of the Moon.

La cara oculta de la Luna —el término técnico predilecto por la comunidad científica— es, en efecto, un entorno oscuro (durante la mitad del tiempo), gélido e inhóspito. Más allá del regolito, solo se encuentran dos módulos de aterrizaje chinos: el Chang'e 4, que llegó en enero de 2019, y el Chang'e 6, en junio de 2024. No obstante, este panorama está a punto de transformarse en aproximadamente un año. Según reporta Ned Potter, editor colaborador, en su artículo La búsqueda para construir un telescopio que pueda escuchar las Edades Oscuras Cósmicas, la misión Blue Ghost 2 de Firefly Aerospace —que transporta el radiotelescopio LuSEE-Night— intentará convertirse en la tercera expedición en aterrizar con éxito en dicha región.

La cara oculta de la Luna representa el emplazamiento perfecto para un instrumento de esta naturaleza. Las mismas ondas de radiofrecuencia que transmitieron las imágenes de Neil Armstrong sobre la superficie lunar, la voz de Roger Waters y los innumerables segmentos científicos de Ned Potter para cadenas como CBS y ABC, generan interferencias en los radiotelescopios terrestres. Si el objetivo es detectar las señales extremadamente débiles y con un elevado desplazamiento al rojo provenientes del hidrógeno neutro de la Edad Oscura cósmica, la Tierra resulta un lugar inviable. Este periodo histórico recibe su nombre debido a que la humanidad aún no ha captado señales de esa época, la cual comenzó unos 380,000 años después del Big Bang y se extendió entre 200 y 400 millones de años. Aunque la cara oculta sea un entorno hostil para la vida, su aislamiento del ruido electromagnético terrestre la convierte en el laboratorio ideal para la radioastronomía.

Como Potter me señaló recientemente, LuSEE-Night no detectará de forma directa la señal del hidrógeno de la Edad Oscura. “¿Emitirá una señal el hidrógeno de ese periodo? No”, aclara Potter. “Sin embargo, esa vasta densidad de hidrógeno podría absorber parte de la energía del fondo cósmico de microondas, interfiriendo con ese remanente aún más remoto del Big Bang”.

No obstante, el silencio de la cara oculta podría tener los días contados. Naciones como China, India, Japón, Rusia, Corea del Sur, Emiratos Árabes Unidos y Estados Unidos avanzan con determinación hacia el establecimiento de una presencia lunar permanente. Esta expansión conlleva el despliegue de satélites de retransmisión en órbita lunar para apoyar las actividades de exploración y las bases proyectadas para la próxima década. En consecuencia, la ventana de oportunidad para realizar observaciones en una cara oculta libre de ruido se está cerrando. LuSEE-Night, un proyecto cuya concepción data de hace 40 años, podría concretarse justo a tiempo.

Potter se encuentra monitorizando los protocolos emergentes que buscan preservar el silencio electromagnético de la región a pesar del avance de estas misiones. Diversos radioastrónomos han propuesto estrategias para evitar que esta situación escale hasta convertirse en una crisis. “En esta historia no hay antagonistas, al menos por ahora”, afirma Potter. “Pero existe una gran cantidad de personas con buenas intenciones que podrían complicar el panorama si desconocen que hay un equilibrio delicado que proteger”.

Actualmente vivimos una era de intensa actividad en la exploración lunar. Además de la misión Blue Ghost 2, China lanzará la sonda Chang'e 7 hacia el polo sur lunar, mientras que la misión Artemis II de la NASA tiene previsto entrar este mes en la primera de sus tres ventanas de lanzamiento. Artemis II marcará el regreso de seres humanos a la órbita lunar por primera vez desde la conclusión del programa Apolo en 1972. 

Older →