Um Agente de Aprendizado por Reforço no jogo digital Tibia

Ricardo Dias Avelar

Utilizou-se a rede PPO e posteriormente a rede DQN no jogo digital Tibia, como pesquisa tecnológica. Após mais de uma centena de horas de treinamento total observou-se, ao menos para um cenário simplificado do Tibia, que ou: 1. Um agente de aprendizado por reforço não é capaz de aprender sem passar por dezenas de horas de treinamento, com um step de tempo mínimo de 0.3 segundo para atualização do ambiente; ou 2. Encontrar os parametros corretos para o aprendizado rápido, consistente e eficaz nos condições testadas e extremamente demorado, dado o tempo mínimo para um treinamento completo.

2025/2 - MSI2

Orientador: Luiz Chaimowicz

PDF Disponível