A inteligência artificial do Google agora é capaz de fazer parkour no mundo virtual e enfrentar obstáculos de forma criativa.
Aprendizado por reforço (RL) é a prática de ensinar e orientar o comportamento usando um sistema de recompensa.
O comportamento desejável produz recompensas; comportamento indesejável não.
A equipe do Google, então, desenvolveu um cenário ver se recompensas simples funcionariam em um ambiente complexo.
Eles criaram um “curso de parkour virtual” com uma série de obstáculos e criaram uma recompensa para avançar o progresso.
Quanto mais rápido a inteligência artificial se movia através do terreno, maiores as recompensas.
Você pode ver, no vídeo abaixo, como os computadores do Google se saíram no teste:
Agents having fun in Parkour! Cool paper from colleagues at DeepMind https://t.co/X0PwKXrQ2M pic.twitter.com/yMT6XCNv45
— Oriol Vinyals (@OriolVinyalsML) July 10, 2017