sábado, mayo 16, 2026
  • banner vida interior

Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien

La robótica avanza rápidamente, pero la mayoría de los robots sigue enfrentando una limitación fundamental: la dificultad para tomar decisiones precisas sobre qué acción realizar y dónde llevarla a cabo. Microsoft, junto a un consorcio de investigadores académicos, ha presentado un nuevo estándar, GroundedPlanBench, que busca resolver este desafío y acercar la inteligencia artificial de los robots a la toma de decisiones eficiente y contextualizada.

En los sistemas robóticos convencionales, el proceso de decisión se divide en dos etapas. Primero, un modelo de visión y lenguaje genera un plan en lenguaje natural. Después, otro sistema traduce ese plan en acciones físicas. Este enfoque fragmentado provoca errores frecuentes, ya que la desconexión entre el plan y la ejecución permite que las equivocaciones en una etapa se trasladen a la siguiente.

Errores típicos incluyen confusiones sobre qué objeto manipular o la invención de pasos innecesarios. Por ejemplo, si se le pide a un robot descartar vasos de papel, puede no identificar correctamente cuál vaso debe recoger o incluso realizar acciones no solicitadas. Estas fallas se agravan en entornos desordenados, donde los objetos son similares o numerosos.

Recomendamos leer:OpenAI cerrará Sora, su plataforma de generación de videos con IA

GroundedPlanBench: un nuevo estándar para mejorar la toma de decisiones

Para enfrentar este desafío, Microsoft y sus socios han desarrollado GroundedPlanBench, un sistema que evalúa si los modelos de IA pueden planificar tareas y, al mismo tiempo, identificar con precisión dónde debe realizarse cada acción.

A diferencia de los sistemas tradicionales que solo utilizan texto, este estándar vincula cada acción a una ubicación específica en una imagen. Acciones como agarrar, colocar, abrir o cerrar se asocian a objetos o posiciones determinadas, obligando a la IA a conectar la decisión con el entorno físico real.

El benchmark incluye más de mil tareas basadas en interacciones reales de robots. Algunas instrucciones son directas, como colocar una cuchara en un plato, mientras que otras son abiertas, como ordenar una mesa. Esta variedad es crucial, ya que los robots suelen fallar cuando las indicaciones no son lo suficientemente claras.

En uno de los experimentos, un robot debía colocar cuatro servilletas en un sofá. La falta de especificidad en la instrucción hizo que el sistema repitiera la acción sobre la misma servilleta, incluso con descripciones aparentemente más precisas como “servilleta superior izquierda”. Esto evidencia que el lenguaje ambiguo sigue representando un obstáculo para la ejecución fiable de tareas complejas.

Aprendizaje basado en tareas reales

Para mejorar la capacidad de decisión, el equipo desarrolló un método de entrenamiento denominado Video-to-Spatially Grounded Planning (V2GP). Este sistema analiza videos de robots realizando tareas, detecta las interacciones con objetos, identifica dichos objetos y rastrea sus ubicaciones, generando así planes estructurados que vinculan cada acción con un punto específico.

Mediante este enfoque, los investigadores generaron más de 40.000 planes “arraigados”, que van desde acciones simples hasta secuencias complejas de hasta 26 pasos. Los modelos entrenados con este método demostraron una mejor capacidad para elegir acciones adecuadas y asociarlas con los objetos correctos, además de reducir errores repetitivos como actuar varias veces sobre el mismo elemento.

Un cambio de paradigma para la robótica

Pese a los avances, los retos persisten, especialmente en tareas largas y con instrucciones indirectas. Los investigadores advierten que los modelos deben ser capaces de razonar sobre secuencias extensas y mantener la coherencia a lo largo de múltiples pasos. Al comparar el nuevo enfoque con los sistemas tradicionales, se observó que estos últimos tienden a asignar múltiples acciones al mismo objeto o lugar, sobre todo cuando las órdenes son ambiguas.

La integración de planificación y localización en un único proceso reduce estos desajustes y permite decisiones más precisas. El equipo de Microsoft sugiere que futuras investigaciones podrían combinar este método con modelos predictivos capaces de anticipar las consecuencias de cada acción, lo que ayudaría a los robots a evitar errores en tiempo real.

También puedes leer:Un proyecto europeo definirá un código ético de la IA en la educación y políticas públicas

Las conclusiones del estudio apuntan a una dirección clara para el futuro de la robótica: los sistemas que consideran de manera conjunta la acción y la ubicación tienen más probabilidades de operar con éxito en ambientes reales. Esta innovación representa un paso clave para que los robots puedan decidir y actuar de manera fiable en tareas cotidianas, acercándolos a una verdadera inteligencia artificial aplicada.

En el foco

  • Revisa tu celular antes de comprar

  • Intrant - transito limpio

  • banner punto vida interior y policia

Explora más

La NASA usa la gravedad de Marte para acelerar una sonda que estudia el origen de la Tierra

Miami.- La sonda Psyche aprovechará este viernes su paso por Marte para utilizar la gravedad del planeta y aumentar su velocidad, además de ajustar su trayectoria rumbo al asteroide metálico del mismo nombre, uno de los objetos más inusuales del sistema solar, cuyo estudio ayudará a indagar sobre el origen de la Tierra. La NASA […]

Estudiantes dominicanos clasifican a final tecnológica en China

Un equipo de la Pontificia Universidad Católica Madre y Maestra (PUCMM) clasificó a la fase final de la Huawei ICT Global Competition 2025-2026, uno de los certámenes estudiantiles más importantes a nivel internacional en tecnologías de la información y la comunicación (TIC). La etapa final se celebrará del 2 al 5 de junio de 2026 […]

Los secretos de Lady Dai, la momia mejor conservada del mundo: qué comió antes de morir y una dieta que incluía carne de perro

Las semillas de melón tardaban una hora en digerirse. Los patólogos lo sabían cuando contaron 138 de ellas en el esófago, el estómago y los intestinos de Xin Zhui.Esa mujer, esposa del marqués de Dai, funcionario de la dinastía Han, había comido melón minutos antes de morir. El corazón se le detuvo en algún momento entre los años 178 […]

El jurado en California comienza a deliberar en el juicio de Musk contra OpenAI

Los Ángeles.- El jurado de nueve personas en el juicio de OpenAI comenzó este jueves a deliberar, tras escuchar los argumentos finales de los abogados de Elon Musk, de la tecnológica y de Microsoft, envueltos en una demanda civil que busca determinar si la creadora de ChatGPT incumplió su misión fundacional sin fines de lucro. […]

Creatividad, ciencia y arte protagonizan las iniciativas estudiantiles del CPM

Tras el éxito de su Feria Científica, Tecnológica y de Emprendimiento, el centro educativo se prepara para celebrar una nueva edición de su Talent Show CPM 2026

Meta enfrenta protestas internas por implementar tecnología de rastreo de ratón en sus oficinas estadounidenses

Meta enfrenta protestas internas por implementar tecnología de rastreo de ratón en sus oficinas estadounidenses. Grupos de empleados comenzaron a distribuir volantes en distintas sedes del país para manifestar su rechazo a la instalación reciente de un software que monitorea los movimientos del mouse en sus computadoras de trabajo. La acción de protesta busca reunir apoyos y sumar firmas a […]
  • Revisa tu celular antes de comprar