Dados usados pela equipe para treinar o modelo “Muse” partiram de parceria fechada em 2022 com a Theory, da Xbox Game Studios

Recortes com exemplos do uso da tecnologia
Modelo de IA foi treinado em hackaton interno (Imagem: Reprodução/Microsoft)

Compartilhe esta matéria

A Microsoft publicou os detalhes de pesquisa sobre o primeiro modelo de inteligência artificial (IA) generativa de um videogame que pode gerar visuais de jogo, ações de controle ou ambos. A tecnologia é conhecida como World and Human Action Model (WHAM, na sigla em inglês) e foi batizada de “Muse”.

A empresa diz que focou em explorar as capacidades que modelos como esse precisam para, efetivamente, dar suporte aos desenvolvedores humanos na criação de jogos — sinalização de que não há planos de substituir criadores reais pela nova ferramenta. Os resultados estão em artigo publicado na revista científica Nature.

Captura de tela 2025 02 19 221445 1Milhao Internet
Resolução é de 300×180, ainda abaixo de 1080p e 4K em jogos atuais (Imagem: Reprodução/Microsoft)

Leia mais:

Microsoft levou anos para concluir pesquisa

  • Os dados usados pela equipe para treinar o modelo de IA partiram de parceria fechada em 2022 com a Theory, da Xbox Game Studios, que tem sede em Cambridge (Reino Unido), onde também estão os funcionários da Microsoft que participam do projeto;
  • Foram coletadas informações de jogabilidade do “Bleeding Edge”, jogo de Xbox de 2020;
  • “Bleeding Edge” é um jogo online quatro contra quatro em que todas as partidas são gravadas se o jogador concordar com os termos;
  • A partir daí, a empresa optou por hackathon (evento que reúne profissionais para desenvolver soluções inovadoras em um curto período) interno para “explorar novos paradigmas de interação e usos criativos que o Muse poderia desbloquear”;
  • O resultado foi um protótipo chamado WHAM Demonstrator, aberto para interações com demais usuários.
Logo da Microsoft em um smartphone; atrás, telas com gráficos com ações
Microsoft coletou dados de jogabilidade do Bleeding Edge (Imagem: Rokas Tenys/Shutterstock)

Uma das principais melhorias se deu com codificadores de imagem de maior resolução: até então, os modelos geravam imagens de 128 x 128 píxeis; agora, são de 300×180 — ainda abaixo de 1080p (1920 x 1080), comum entre jogadores de PC, e menos ainda que o 4K (3840 x 2160), que já é realidade em muitos setups gamers.

Uma das minhas capacidades favoritas do modelo é como ele pode ser solicitado com modificações de sequências de gameplay e persistir elementos recém-introduzidos.

Por exemplo, em uma demonstração, adicionamos um personagem ao visual original do jogo. Solicitando ao modelo o visual modificado, podemos ver como o modelo ‘persiste’ o personagem adicionado e gera variantes plausíveis de como a sequência de gameplay poderia ter evoluído a partir desse ponto inicial modificado.

Katja Hofmann, gerente sênior de pesquisa da Microsoft

Veja, a seguir, uma demonstração do novo método:



Bruna Barone

Colaboração para o Olhar Digital

Jornalista formada pela Faculdade Cásper Líbero

Rodrigo Mozelli

Redator(a)



Rodrigo Mozelli no LinkedIn

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.