
Tudo sobre Inteligência Artificial
A DeepSeek, uma startup chinesa, está acelerando o lançamento de seu modelo R2, que sucederá o R1, lançado em janeiro e que causou um grande impacto nos mercados globais. As informações são da Reuters.
O modelo R1 foi responsável por uma liquidação de mais de US$ 1 trilhão nos mercados financeiros, graças ao seu preço reduzido e capacidade de competir com modelos caros de gigantes da tecnologia, como a OpenAI.
A empresa planeja lançar o R2 antes do previsto, com melhorias na codificação e a expansão de suas capacidades linguísticas, além de alcançar maior eficiência ao trabalhar com múltiplos idiomas.
Competitividade gastando menos que outros modelos
- O modelo R1, desenvolvido com chips Nvidia menos potentes, conseguiu competir com soluções muito mais caras, sendo até 40 vezes mais barato do que as alternativas ocidentais.
- A DeepSeek se destaca por usar técnicas de IA inovadoras e mais econômicas, como o Mixture-of-Experts (MoE), que ativa apenas partes do modelo relacionadas a uma consulta, em vez de usar o modelo inteiro, e a arquitetura de atenção latente multihead (MLA), que permite processar informações de forma mais eficaz.
- Isso resultou em uma IA de alto desempenho a um custo muito inferior.

O fundador da empresa, Liang Wenfeng, tem mantido um perfil discreto, evitando os modelos rígidos de gestão comuns nas grandes empresas chinesas de tecnologia. Ele adota uma abordagem colaborativa e flexível, focando mais na qualidade dos modelos do que em suas aplicações comerciais imediatas.
Sua empresa também se distingue por pagar bem seus funcionários, com cientistas de dados sêniores recebendo salários generosos.
O sucesso da DeepSeek também está ligado ao apoio do governo chinês, que vê a empresa como um exemplo de inovação nacional. Modelos da DeepSeek estão sendo adotados por diversas entidades governamentais e empresas estatais na China.
Leia mais
A empresa tem sido bem recebida por Pequim, e seu fundador foi até convidado para reuniões com líderes do governo. No entanto, isso pode gerar preocupações no Ocidente, já que governos de outros países, como os EUA, já impuseram restrições ao fornecimento de chips avançados para a China.
Apesar das tensões geopolíticas, a DeepSeek continua a atrair talentos e investidores, principalmente devido ao grande investimento feito por sua controladora, a High-Flyer, em supercomputação e pesquisa em IA.

A empresa tem investido fortemente em clusters de IA, como o Fire-Flyer II, composto por chips Nvidia A100, o que permitiu grandes avanços em IA a um custo muito mais baixo do que seus concorrentes.
Isso colocou a DeepSeek como uma das poucas empresas capazes de competir com grandes players da indústria de IA com um modelo de baixo custo, atraindo atenção global e mudanças nas estratégias de grandes empresas, como a OpenAI e o Google.
Leave a Comment