Las 4 cosas más importantes que podemos aprender de la inteligencia artificial OpenAI
DOTA 2

Las 4 cosas más importantes que podemos aprender de la inteligencia artificial OpenAI

La semana pasada fuimos testigos de los avances de la OpenAI, durante un evento celebrado en San Francisco pudimos presenciar cómo la inteligencia artificial fue capaz de vencer a un equipo profesional de Dota 2, concretamente a OG, el vigente campeón del mundo. Y gracias a la evolución de los bots, podemos aprender de ellos ciertas mecánicas clave para mejorar en el juego.

La OpenAI ya ha demostrado que piensa y ve Dota 2 de manera diferente a los humanos, la inteligencia artificial tiene sus propias reglas. En el pasado, vimos como en los enfrentamientos 1vs1 el bot utilizaba Bálsamos Curativos y Mangos Encantados para regenerar vida y maná con mucha más frecuencia de lo que lo haría un humano.

Además, la OpenAI daba prioridad a estos consumibles por encima de otros y también de objetos como el Antifaz Espectral o las Botas de Velocidad. Con esos consumibles el bot podía intercambiar golpes con el rival y luchar por la recolección durante mayor tiempo. Sin duda, esto marcó un antes y un después, cambiando el meta y haciendo que la mayoría de jugadores empezaran a tener más en cuenta los Mangos Encantados y los Bálsamos Curativos en línea.

Veamos algunas decisiones que toma la OpenAI para conseguir su objetivo final, el mismo que el de un humano, ganar la partida y que podemos tratar de aprender de ella para mejorar en nuestras partidas.

1. Pagar por volver a la vida

A menudo, los bots se compran instantáneamente cuando mueren, incluso a principio de la partida cuando no hay objetivos amenazados. Esto condujo a especulaciones de que pagar por volver a la vida podría ser beneficioso debido a múltiples razones:

  • Al principio de la partida no pierdes tanto oro.
  • Ayuda a presionar instantáneamente las líneas y recuperar el control del mapa.
  • El cambio efectivo de oro por experiencia.

El bot interpreta que no pierde la recompensa obtenida cuando se recompra porque gana oro y experiencia al momento de salir de base, lo que hace que la acción sea positiva. Aunque es una lección que no hay que seguir al pie de la letra porque los bots tienen una programación determinada, mientras que los humanos tenemos mayor capacidad para adaptarnos y actuar en diferentes situaciones.

Buyback

2. Distribución equitativa de la recolección

Parece que la distribución uniforme del valor neto que hace la OpenAI es diferente a la distribución estándar que vienen haciendo los jugadores profesionales. Normalmente, la posición 1 y 2 del equipo son las que más deben de recolectar en la partida, el 3 también aunque a veces se le sacrifica, mientras que las posiciones 4 y 5 son las más sufridas.

Como los bots valoran todo en la partida (últimos golpes, oro, experiencia, muertes, etc) ninguno de ellos se considera a sí mismo tirador o apoyo, sino que todos contribuyen a la puntuación total del equipo. Lo vimos con el Sven de "apoyo" que utilizó la OpenAI para ganar a OG.

Sin embargo, no es una conclusión segura porque lo que realmente importa es acabar con Ancestro rival, por lo que ir 0-10-0 y ganar la partida es mejor que ir 10-0-10 y perderla. También hay que tener en cuenta que la OpenAI no tiene una planificación a largo plazo en su toma de decisiones. Sus estrategias a largo plazo son solo de hasta 5 minutos en el futuro, por lo que para la inteligencia artificial no tiene sentido los conceptos de tirador y apoyo.

Valor Neto

Sacrificar a tu Oracle durante los primeros 30 minutos del enfrentamiento para permitir que tu Spectre destruya al equipo enemigo los 10 últimos de la partida tiene sentido para los humanos, pero no para los bots.

Dicho esto, no significa que no haya un beneficio real para los héroes de apoyo que consiguen recolectar. Equipos como Team Secret o Fnatic han demostrado que tener apoyos con más objetos te da una gran ventaja contra tus oponentes en las peleas. Aunque para obtener esto, siempre es necesario sacrificar algo como el control del mapa o la recolección en otras líneas.

3. Divide y vencerás, o no...

Las tácticas de los bots son bastante simples.

  • Intentan ganar las líneas.
  • Todos los héroes recolectan.
  • Se juntan, buscan peleas y objetivos favorables.

Hay tres razones por las que esto tiene mucho sentido para ellos:

La primera es que tienen muchos años de experiencia jugando a 17 héroes, lo que les ayuda a saber con gran precisión el resultado de un enfrentamiento. Esto significa que los bots van a intentar forzar peleas porque tienen una evidencia matemática de que la van a ganar.

La segunda razón es que los bots no se comunican como los humanos, ellos ven las mismas oportunidades en todo el mapa y toman las decisiones de manera individual instantáneamente, mientras que los humanos necesitan tiempo para ejecutar estos movimientos en equipo. Un jugador tiene que ver la oportunidad de conseguir un objetivo, comunicársela a sus compañeros de equipo con palabras (o hacer ping en el mapa) y luego actuar en consecuencia.

Y por último, la mejor manera de contrarrestar a cinco héroes en Dota 2 es hacer la rata, dividir al equipo, cortar las oleadas de creeps, presionar estructuras y evitar peleas desfavorables. Sin embargo, entre los 17 héroes de la OpenAI no hay buenos héroes para hacer esto, así que el denominado "rat doto" ni lo contemplan.

4. Matar está sobrevalorado

A continuación, algunas de las recompensas que los desarrolladores de Open AI han creado para los bots:

Stats

Llama la atención que matar tenga un peso negativo, pero tiene una explicación.

Los desarrolladores consideraron que es necesario disuadir a los bots de ir a matar con demasiada frecuencia. Esto es bastante curioso, especialmente teniendo en cuenta que los bots deberían poder juzgar el riesgo mejor que los humanos.

El exceso de agresividad de los bots podría deberse a que no planearon a largo plazo de manera estratégica y no fueron castigados por perder oro (y aun así fueron recompensados por obtenerlo), pero la muerte en sí tiene un valor negativo, por lo que esto debería equilibrar las cosas. En cualquier caso, es seguro asumir que los desarrolladores jugaron con los números y que los valores citados anteriormente dieron los mejores resultados para el experimento.

Esto nos lleva a la lección más prosaica y más antigua de Dota 2: las muertes están sobrevaloradas. Priorizar el control del mapa, su propio desarrollo de recursos y los objetivos dan mejores resultados a largo plazo. Recolectar en lugar de tomar peleas arriesgadas es probablemente la lección número uno que un jugador de bajo nivel necesita interiorizar para comenzar a ganar con más frecuencia.

Conclusiones

No se puede negar que la OpenAI ganó debido a su capacidad para tomar decisiones correctas en segundos, utilizar sus hechizos y calcular cuánto tiempo podrían sobrevivir en los combates en equipo, cosas que podemos tratar de aprender.

Estaría bien que los bots pudieran jugar sin las restricciones de héroes y objetos para ver cómo se adaptan y qué meta forman. Lamentablemente, los desarrolladores de la OpenAI mencionaron que su objetivo final no es hacer el mejor robot de Dota 2, sino crear una inteligencia artificial que pueda aprender y sobresalir en entornos y tareas complicadas.

Vía | DotaHaven.

Temas
Comentarios cerrados
Inicio