EGC5020-09318/10316 - Redes Sociais e Virtuais
André Brunetto Cavalcanti (22100929)
Evolução do machine learning através dos jogos.
A inteligência artificial está se tornando um tema muito popular devido aos desenvolvimentos recentes na capacidade de criação e percepção de humanização das máquinas; quais podem se comunicar com fala semelhante a humana (Amazon Alexa), realizar a criação de imagens e vídeos artísticos em segundos através de pedidos humanos (midjourney), escrever e buscar sobre temas de forma semelhante a humanos(ChatGPT) e diversos outros.
Imagem criada no midjourney
Pode se dizer, que nos últimos tempos a IA se expandiu para diversos campos, podendo ser utilizado na medicina, indústria, robótica, design, marketing, finanças e diversos outros setores. O avanço da tecnologia de forma rápida, cria a expectativa que a IA estará cada vez mais presente em nossas vidas.
Nesse blog será dado ênfase no surgimento e evolução da inteligência artificial em jogos, desde o xadrez até jogos mais recentes, como um jogo RTS (estratégia em tempo real) Starcraft2.
O xadrez está sendo utilizado e estudado desde as primeiras décadas da IA, por ser um jogo de estratégia e habilidade mental, com tomadas complexas de decisão e análise de múltiplas possibilidades em tempo limitado.
Tabuleiro de xadrez
Tratando de números, apenas os primeiros 4 movimentos de cada lado são possíveis de serem jogados de 315 bilhões de combinações, em 10 movimentos seriam 170 trilhões, já uma partida inteira teria uma quantidade semelhante ao Número de Shannon (10120). Isso é considerado maior que a quantidade de átomos no universo estimado entre 4×1078 e 6×1079.
Quando se isola as combinações que seriam ilegais, tais como aquelas que te colocam em posição de xeque-mate, este número ficaria reduzido para algo entre 18053 e 8050, , que já se torna semelhante ao número estimado de átomos no universo.
Imagem do espaço
Devido a este número enorme de combinações, torna-se muito complexo estimar o movimento perfeito para cada situação, já que não existe hoje a capacidade de processamento necessária para prever rapidamente todas as possibilidades de cada movimento. Então se torna importante a capacidade de estratégia. Essa complexidade do xadrez torna um desafio para as máquinas de inteligência artificial.
O primeiro programa de xadrez que utilizou a inteligência artificial foi criado em 1951, pelo cientista britânico Christopher Strachey. Na época era incapaz de vencer jogadores experientes, mas já foi um salto tecnológico importante. Somente em 1997 que a IA passou a ter um reconhecimento maior, quando o programa de computador Deep Blue da IBM venceu Garry Kasparov, campeão mundial de xadrez da época.
Garry Kasparov- ex campeão mundial de xadrez
Hoje o programa mais avançado do xadrez é o DeepMind AlphaZero, que cria jogos de xadrez autônomos, melhorando suas habilidades jogando contra si próprio. Sem precisar ser programado com estratégias ou táticas específicas. Superando todos os programas de xadrez tradicionais.
Jogos do gênero RTS, sigla para Real Time Strategy, ou estratégia em tempo real em português, também tem contribuído para o desenvolvimento de inteligências artificiais. Jogos de mundo aberto que são necessários diversas ações por minuto, como Starcraft 2, jogo onde dois jogadores ou mais se enfrentam numa guerra galáctica.
O Starcraft 2 apresenta muitos desafios para a IA. Já que o número de jogadas e peças não é limitado como no xadrez. Neste jogo é necessário controlar múltiplas unidades, estruturas e estratégias complexas em um ambiente de mudança constante, que interfere diretamente na estratégia a ser utilizada.
Imagem jogo RTS Starcraft2
Apesar da primeira competição da inteligência artificial no mundo do Starcraft ter sido em 2010, ela foi incapaz de superar jogadores profissionais nas partidas individuais. Somente com a criação do AlphaStar, também da empresa DeepMind que criou o AlphaZero do xadrez, que foi possível superar jogadores profissionais em 2019.
O aprendizado da máquina se deu a partir de redes neurais profundas, jogando milhares de jogodares humanos e outras IA. A máquina é capaz de tomar decisões rápidas e estratégicas em tempo real, identificando unidades e estruturas inimigas, avaliando a situação do jogo para tomar decisões táticas. Dividindo suas próprias unidades em vários grupos para realizar ataques em várias frentes ao mesmo tempo.
Partida de Starcraft entre IA AlphaStar e LiquidTLO
O uso da IA em StarCraft 2 tem implicações importantes para o mundo da computação a no desenvolvimento de novas tecnologias de inteligência artificial. Podendo ter implicações em diversos campos como desenvolvimento estratégico e simulações militares.
Além destes, outros jogos podem ser citados como GO, um jogo de tabuleiro chinês criado há mais de 2500 anos. Sua importância para a IA é notável, visto que tal jogo é considerado mais complexo que o xadrez.
Jogo de tabuleiro 'go'
Esse jogo tem como objetivo possuir uma área total maior que a do seu oponente,conquistando territórios vazios com seus pedras. A área cercada virá do jogador que a cercou. Um grupo de pedras é um conjunto de pedras conectadas verticalmente ou horizontalmente através de intersecções adjacentes vazias. Quando um grupo de pedras não tem liberdade (intersecções vazias), ele é capturado e removido pelo oponente.
Diferente do xadrez, levou mais tempo para uma IA ser capaz de vencer jogadores experientes. Somente em 2017, o AlphaGo do Google venceu de 2x0 num melhor de 3 do melhor jogador do mundo Ke Jie. Posteriormente a IA foi aposentada e parou de participar em competições.
Isso prova que a inteligência artificial em jogos está em estado de constante evolução. Em todo cenário de eSports ou esportes eletrônicos e jogos de tabuleiro. Esses testes em jogos também contribuem para a evolução das máquinas, que contribuem para a utilização dessas em casos de necessidade real.
Principais métodos de Machine Learning em Videogames
Aprendizado por reforço: Envolve treinar o computador a partir da tomada de muitas decisões num ambiente interativo, por meio da tentativa e erro. Sofrendo punições ou recompensas com base em suas ações, tornando possível o aprendizado ao longo do tempo.
Aprendizado por imitação: No início de diversos jogos, o computador é incapaz de entender as funções de cada peça ou do jogo. Então esse método consiste de uma análise das ações de um ou vários seres humanos dentro do espaço virtual, fazendo com que o computador imite alguns movimentos e comportamentos de jogadores humanos especialistas. Treinando o modelo a simular essas ações e se desenvolver a partir deste ponto.
O problema do aprendizado por reforço é o tempo necessário para desenvolver a capacidade de compreensão rápida do jogo, que é facilitado no aprendizado por imitação, já que o computador já inícia realizando uma ação no jogo mais parecida com os seres humanos. Contudo a máquina diminuí a capacidade de formar um conceito próprio de estratégia no jogo, que possibilita movimentos diferenciados, caso do aprendizado por reforço.
Então por último diversas máquinas utilizam o modelo híbrido, que usa ambos modelos. Imitação e reforço, portanto a máquina já parte de um conhecimento no jogo estabelecido pelos humanos e então melhora a partir do modelo de recompensas do tentativa e erro (por reforço). Dentro destes existe outros meios de organizar dados que não serão discutidos.
Fontes
Nenhum comentário:
Postar um comentário