Coordenação em Sistemas Multiagente em tempo real

Tiago Negrisoli de Oliveira

Sistemas multiagentes (SMA) são ambientes em que vários agentes estão interagindo. Os objetivos desses podem ser os mesmos, assim tendo uma relação de cooperação, ou divergentes em que eles competem. Jogos estratégia em tempo real (RTS) podem ser vistos como SMAs e possuem um ambiente dinâmico com informações parciais do oponente e do mapa. Além disso, requerem dos jogadores gerenciamento da economia e recursos, criação e movimentação de unidades, construção de edifícios, aprimoramento de tecnologias e controle de embates contra oponentes. Essas características tornam esse tipo de ambiente complexo, em que o agente tem que lidar com um grande espaço de estados e de ações, tempo de raciocínio limitado e recompensas em longo prazo. O trabalho foca na parte de combate desse estilo de jogo, em que dois exércitos compostos por múltiplas unidades lutam. Dessa forma, foram propostas quatro formas de se lidar com esse cenário. (I) Aprendizado independente em que agentes não consideram outras. (II) Friend or-Foe, método de coordenação que aprende com a pressuposição de que certas unidades são aliadas e outras são inimigas. (III) Correlated-Q, método de coordenação que aprende a partir do equilíbrio correlacionado dos agentes. (IV) Deep Q-Network (DQN) que é um método que utiliza uma rede neural para aproximar valores Q para as ações das unidades.


2020/1 - POC2

Orientador: Luiz Chaimowicz

Palavras-chave: Jogos de estratégia em tempo real, RTS, Inteligência artificial, aprendizado por reforço, coordenação, Sistemas multiagentes, Deep Q- Learning

Link para vídeo

PDF Disponível