Novo recurso do Google AI Studio no Gemini cria ilustrações para histórias, altera cenários e remove até marca d’água

Captura-de-tela-2025-03-19-114611-1920x1080.png
Novo recurso usa linguagem natural para facilitar diálogo com chatbot (Imagem: Google/Divulgação)

Compartilhe esta matéria

O Google lançou uma nova ferramenta que pode dar dor de cabeça para o Adobe Photoshop. O modelo de inteligência artificial da gigante americana agora pode gerar ou editar imagens na conversa com o chatbot — mas não, a qualidade não é a mesma de softwares profissionais.

O recurso experimental faz parte das atualizações do Google AI Studio no Gemini 2.0 Flash. A tecnologia combina entrada multimodal, raciocínio aprimorado e compreensão de linguagem natural.

Agora, é possível adicionar objetos, remover objetos (incluindo marca d’água), modificar cenários, alterar a iluminação, tentar alterar ângulos de imagem, aumentar ou diminuir o zoom e executar outras transformações nas imagens. 


Captura de tela 2025 03 19 114534 1Milhao Internet
IA cria ilustrações a partir de histórias contadas pelo usuário (Imagem: Google/Divulgação)

O Gemini 2.0 foi treinado a partir de um grande conjunto de dados que ocupa a mesma rede neural usada para guardar seus conhecimentos em texto. O modelo em código aberto ainda está passando por testes e uma versão pronta para produção será lançada em breve, segundo o Google.

Leia Mais:

Novos recursos já disponíveis

  • Texto e imagens juntos: é possível contar uma história e pedir ao Gemini 2.0 Flash a ilustração com personagens e cenários apropriados. O modelo pode recontar a história ou mudar o estilo do desenho a partir do feedback do usuário;
  • Edição de imagem conversacional: a tecnologia usa linguagem natural para diálogos sobre a edição das imagens no chatbot;
  • Compreensão do mundo: segundo o Google, o Gemini 2.0 Flash aproveita o conhecimento do mundo e o raciocínio aprimorado para criar imagens realistas, mas “embora ele se esforce para obter precisão, como todos os modelos de linguagem, seu conhecimento é amplo e geral, não absoluto ou completo”;
  • Renderização de texto: benchmarks internos mostram que o Flash 2.0 tem renderização mais forte, reduzindo erros de ortografia ou caracteres mal formatados ou ilegíveis, o que o torna ideal para criar anúncios, postagens sociais ou até mesmo convites.
Captura de tela 2025 03 19 114626 1Milhao Internet
Google diz que chances de erros ortográficos são menores em novo modelo (Imagem: Google/Divulgação)


Bruna Barone

Colaboração para o Olhar Digital

Jornalista formada pela Faculdade Cásper Líbero