TECNOLOGÍA. Las IA de los juegos, un paso previo a aplicaciones del mundo real

  Las IA para juegos que interactúan con los humanos están sentando bases importantes para las aplicaciones del mundo real 03 diciembre 2022...

 

Las IA para juegos que interactúan con los humanos están sentando bases importantes para las aplicaciones del mundo real

03 diciembre 2022.- Otro juego que durante mucho tiempo se consideró extremadamente difícil de dominar para la inteligencia artificial (IA) ha recaído en las máquinas. Una IA llamada DeepNash, fabricada por la empresa londinense DeepMind, ha emparejado a humanos expertos en Stratego, un juego de mesa que requiere un pensamiento estratégico a largo plazo frente a información imperfecta.

El logro, descrito en Science el 1 de diciembre , llega inmediatamente después de un estudio que informa sobre una IA que puede jugar a Diplomacy 2 , en el que los jugadores deben negociar mientras cooperan y compiten.

La velocidad a la que la IA ha conquistado características de juegos cualitativamente diferentes, o las ha dominado a nuevos niveles, en los últimos años es bastante notable. Stratego y Diplomacy son bastante diferentes entre sí y también poseen características desafiantes notablemente diferentes de los juegos para los que se han alcanzado hitos análogos.

Información imperfecta

Stratego tiene características que lo hacen mucho más complicado que el ajedrez, el Go o el póquer, todos los cuales han sido dominados por IA (los dos últimos juegos en 2015 3 y 2019 4 ). En Stratego, dos jugadores colocan 40 piezas cada uno en un tablero, pero no pueden ver cuáles son las piezas de su oponente. El objetivo es mover piezas por turnos para eliminar las del oponente y capturar una bandera. 

El árbol de juegos de Stratego, el gráfico de todas las formas posibles en las que podría desarrollarse el juego, tiene 10 535 estados, en comparación con los 10 360 de Go . En términos de información imperfecta al comienzo de un juego, Stratego tiene 10 66 posibles posiciones privadas, lo que empequeñece las 10 6 situaciones iniciales de este tipo en el póquer Texas Hold'em para dos jugadores.

“La gran complejidad de la cantidad de resultados posibles en Stratego significa que los algoritmos que funcionan bien en juegos de información perfecta, e incluso aquellos que funcionan para el póquer, no funcionan”.

Entonces, los investigadores desarrollaron DeepNashEl nombre de la IA es un guiño al matemático estadounidense John Nash, cuyo trabajo condujo al término equilibrio de Nash, un conjunto estable de estrategias que pueden seguir todos los jugadores de un juego, de modo que ningún jugador se beneficia cambiando de estrategia por su cuenta. Los juegos pueden tener cero, uno o varios equilibrios de Nash.

DeepNash combina un algoritmo de aprendizaje por refuerzo con una red neuronal profunda para encontrar un equilibrio de Nash. El aprendizaje por refuerzo implica encontrar la mejor política para dictar la acción para cada estado de un juego. Para aprender una política óptima, DeepNash ha jugado 5.500 millones de juegos contra sí mismo. Si un lado obtiene una recompensa, el otro es penalizado y los parámetros de la red neuronal, que representan la política, se modifican en consecuencia. Finalmente, DeepNash converge en un equilibrio de Nash aproximado. A diferencia de las IA de juegos anteriores, como AlphaGo, DeepNash no busca en el árbol del juego para optimizarse.

Durante dos semanas en abril, DeepNash compitió con jugadores humanos de Stratego en la plataforma de juegos en línea Gravon. Después de 50 partidas, DeepNash ocupó el tercer lugar entre todos los jugadores de Gravon Stratego desde 2002. 

“Los resultados son impresionantes”, coincide Noam Brown, investigador de Meta AI, con sede en la ciudad de Nueva York, que dirigió el equipo que en 2019 informó sobre la IA Pluribus 4 para jugar al póquer .

Máquina de la diplomacia

Brown y sus colegas de Meta AI se fijaron en un desafío diferente: construir una IA que pueda jugar a Diplomacy, un juego con hasta siete jugadores, cada uno de los cuales representa una potencia importante de la Europa anterior a la Primera Guerra Mundial. El objetivo es hacerse con el control de los centros de suministro moviendo unidades (flotas y ejércitos). Es importante destacar que el juego requiere comunicación privada y cooperación activa entre los jugadores, a diferencia de los juegos de dos jugadores como Go o Stratego.

“Cuando vas más allá de los juegos de suma cero de dos jugadores, la idea del equilibrio de Nash ya no es tan útil para jugar bien con los humanos”.

Entonces, el equipo entrenó su IA, llamada Cicero, con datos de 125.261 juegos de una versión en línea de Diplomacy que involucraba a jugadores humanos. Combinando estos con algunos datos de juego propio, el módulo de razonamiento estratégico (SRM) de Cicero aprendió a predecir, para un estado dado del juego y los mensajes acumulados, las políticas probables de los otros jugadores. Usando esta predicción, el SRM elige una acción óptima y señala su 'intención' al módulo de diálogo de Cicero.

El módulo de diálogo se construyó sobre un modelo de lenguaje de 2.700 millones de parámetros entrenado previamente en texto de Internet y luego ajustado usando mensajes de juegos de Diplomacia jugados por personas. Dada la intención del SRM, el módulo genera un mensaje conversacional.

En un artículo de Science del 22 de noviembre 2 , el equipo informó que en 40 juegos en línea, "Cicero logró más del doble del puntaje promedio de los jugadores humanos y se ubicó en el 10% superior de los participantes que jugaron más de un juego".

Comportamiento en el mundo real

Los científicos creen que las IA de los juegos que pueden interactuar con los humanos y dar cuenta de las acciones humanas subóptimas o incluso irracionales podrían allanar el camino para las aplicaciones del mundo real. 

“Si está fabricando un automóvil autónomo, no quiere asumir que todos los demás conductores en la carretera son perfectamente racionales y se comportarán de manera óptima”.

Muchas de estas técnicas son de hecho relevantes más allá de los juegos recreativos para las aplicaciones del mundo real. Sin embargo, en algún momento, los principales laboratorios de investigación de IA deberán ir más allá de los entornos recreativos y descubrir cómo medir el progreso científico en los 'juegos' más blandos del mundo real que realmente nos importan.

Referencias:

1. Perolat, J. et al. Science 378, 990–996 (2022).

2. Bakhtin, A. et al. Science https://doi.org/10.1126/science.ade9097 (2022).

3. Silver, D. et al. Nature 529, 484–498 (2016).

4. Brown, N. & Sandholm, T. Science 365, 885–890 (2019).

COMENTARIOS

Nombre

actualidad,920,ADN,2,agenda,12,agricultura,101,agujeros negros,2,ALCINE,1,alergia,2,alzheimer,62,anemia,1,animales,107,ARNm,1,arqueologia,78,artrosis,1,astronomia,128,atrofia muscular espinal,1,audiovisual,177,autismo,16,avuelapluma,4,BIC,2,biodiversidad,30,biotecnología,14,calefacción,1,calentamiento global,3,cambio climático,40,cancer,176,cannabis,1,CAR-T,5,carnavales_2024,15,cemento,1,ciencia,394,cine,89,colesterol,2,compromiso179,8,computación cuántica,2,contaminación,5,convocatoria,27,COP28,5,covid-19,109,CRISPR,2,cultura,193,cultura_alcala,13,cultura_guadalajara,2,danza,4,deal,62,demencia,4,deportes,254,depresión,4,diabetes,56,economia,361,economia_empleo,110,economia_negocios,345,economia_sociales,66,economia_vivienda,70,edición genética,8,elecciones_partidos,8,elecciones_UE2024,1,elecciones2023,78,elecciones2023_alcala,6,elecciones2023_coslada,1,elecciones2023_guadalajara,31,elecciones2023_madrid,7,elecciones2023_torrejon,24,elecciones2023_villalbilla,3,empleo,18,energia,802,energía nuclear,3,energía solar,19,energia_almacenamiento,2,energías renovables,72,enigmas,134,ensayos,3,enseñanza,1,envejecimiento,3,epigenética,1,epilepsia,2,esclerosis,19,esnoticia,3084,esnoticia_alcala,698,esnoticia_anchuelo,1,esnoticia_coslada,287,esnoticia_guadalajara,346,esnoticia_madrid,1236,esnoticia_sanfernando,148,esnoticia_torrejon,330,esnoticia_villalbilla,62,espacio,3,europa,2,eventos,20,exposiciones,39,FITUR_2023,18,FITUR_2024,16,FIVE,1,formacion,16,gastronomia,40,geología,1,glioblastoma,1,gripe aviar,1,hidrógeno verde,20,hispanidad,1,historia,157,historias,331,inmunoterapia,43,inteligencia artificial,85,James Webb,4,laboral,23,libros,134,malaria,1,medicamentos,17,medioambiente,298,melanoma,1,microplásticos,2,mitosyleyendas,56,motor,507,motor_electricos,126,motor_hibridos,69,motor_innovacion,61,motor_mercado,135,motor_noticias,133,movilidad,5,museos,2,musica,21,naturaleza,124,Navidad2023,52,neurociencia,22,nutricion,130,nutrición,4,obesidad,4,opinión,174,osteoartritis,1,parkinson,20,peliculas,34,permanente,1,personajes,84,plantas,34,poesia,38,polen,1,presupuestos2024,1,prime,63,psicologia,1,relatos,2,robótica,23,sal,1,salud,600,salud dental,11,salud mental,10,sueño,2,teatro,19,tecnologia,226,terremotos,1,tradiciones,64,transporte,1,turismo,234,universo,3,vacunas ARN,2,vidasaludable,132,video,34,VIH,1,
ltr
item
La Crónica del Henares: TECNOLOGÍA. Las IA de los juegos, un paso previo a aplicaciones del mundo real
TECNOLOGÍA. Las IA de los juegos, un paso previo a aplicaciones del mundo real
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgQvBhHLWEWDfAyUZiq2i7ZmO0Q9-hWS-Us03ky8-9xD6ImM9X59g9_0nxVMiyCBbVSZ_dzkQpMVIAfVgy7X3oA3Ua92f1DJv648_PLSVxYcQc6IwCMsn6oCaDHt_yTfRP053Ytey9hDyikpL2zAJle28gG-AxO0OdtemUrpQe-8r037oboyKPp3vmAeA/s320/Sin%20t%C3%ADtulo-1.jpg
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgQvBhHLWEWDfAyUZiq2i7ZmO0Q9-hWS-Us03ky8-9xD6ImM9X59g9_0nxVMiyCBbVSZ_dzkQpMVIAfVgy7X3oA3Ua92f1DJv648_PLSVxYcQc6IwCMsn6oCaDHt_yTfRP053Ytey9hDyikpL2zAJle28gG-AxO0OdtemUrpQe-8r037oboyKPp3vmAeA/s72-c/Sin%20t%C3%ADtulo-1.jpg
La Crónica del Henares
https://www.cronicadelhenares.com/2022/12/tecnologia-las-ia-de-los-juegos-un-paso.html
https://www.cronicadelhenares.com/
https://www.cronicadelhenares.com/
https://www.cronicadelhenares.com/2022/12/tecnologia-las-ia-de-los-juegos-un-paso.html
true
5995595061750506997
UTF-8
Cargar todos los posts No se encuentra Ver todo Leer más Responder Cancelar respuesta Borrar Por Inicio Páginas Posts Ver todo Relacionados Etiqueta ARCHIVO BUSCAR Todos los posts No se encuentra INICIO Domingo Lunes Martes Miércoles Jueves Viernes Sábado Dom Lun Mar Mie Jue Vie Sab Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Ene Feb Mar Abr Mayo Jun Jul Ago Sep Oct Nov Dic justo ahora hace 1 minuto hace $$1$$ minutos hace 1 hora hace $$1$$ horas Ayer hace $$1$$ días hace $$1$$ semanas hace más de 5 semanas Seguidores Siguen THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Tabla de contenidos