
Tudo sobre Inteligência Artificial
A DeepSeek, empresa de IA que recentemente ganhou destaque com seu chatbot, surpreendeu o mundo da tecnologia novamente com o lançamento do Janus-Pro, uma nova família de modelos de IA multimodais capazes de analisar e gerar imagens.
Segundo a empresa, a novidade pode superar o DALL-E 3 da OpenAI em alguns testes.
O que é e como funciona o Janus-Pro da DeepSeek?
O Janus-Pro é um novo modelo de inteligência artificial (IA) multimodal, desenvolvido pela DeepSeek, capaz de analisar e criar imagens. Ele se destaca por sua arquitetura inovadora, chamada de “estrutura autorregressiva”, e por sua capacidade de superar modelos de IA renomados, como o DALL-E 3 da OpenAI, em benchmarks de avaliação.
O Janus-Pro funciona assim: ele aprende a interpretar e gerar imagens a partir de um conjunto massivo de dados. Sua “estrutura autorregressiva” permite processar informações sequencialmente, construindo a imagem passo a passo, como se estivesse “pintando” cada pixel em sequência.
Isso o torna mais eficiente na geração de imagens complexas e mais detalhadas, por exemplo.

Principais características
- Multimodal: consegue processar diferentes tipos de dados, como imagens e texto, de forma integrada. Isso permite que ele compreenda o contexto e gere resultados mais relevantes.
- Eficiente: apresenta alto desempenho mesmo com um número menor de parâmetros em comparação com outros modelos, tornando-o mais leve e rápido.
- Flexível: pode ser usado para diversas tarefas, desde a geração de imagens a partir de descrições textuais até a análise e edição de imagens existentes.
- Código aberto: está disponível para download na plataforma Hugging Face sob a licença MIT, permitindo que desenvolvedores e pesquisadores o utilizem e modifiquem livremente.
O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros. Essa variedade permite que os usuários escolham o modelo mais adequado às suas necessidades, dependendo da complexidade da tarefa. Essa característica, coloca o Janus-Pro-7B, o maior da família, à frente de concorrentes como DALL-E 3, PixArt-alpha, Emu3-Gen e Stable Diffusion XL em testes como o GenEval e o DPG-Bench.

As aplicações são vastas e abrangem diversas áreas, como:
- Criação de conteúdo visual: geração de imagens originais para diferentes fins, como publicidade, design, jogos e arte digital.
- Edição de imagens: aprimoramento e manipulação de imagens existentes, como restauração de fotos antigas, remoção de objetos e aplicação de filtros.
- Análise de imagens: extração de informações relevantes de imagens, como reconhecimento de objetos, detecção de emoções e classificação de conteúdo.
Leia mais:
Vale lembrar que a DeepSeek, um laboratório chinês de IA financiado pela High-Flyer Capital Management, chamou a atenção do público recentemente quando seu aplicativo de chatbot alcançou o topo da App Store.
O lançamento do Janus-Pro reforça a posição da DeepSeek como um player importante no cenário da IA, impulsionando a inovação e desafiando os líderes já estabelecidos. A acessibilidade dos modelos e sua performance promissora abrem um leque de possibilidades para desenvolvedores e pesquisadores.
Leave a Comment