O que é DeepSeek? Conheça IA chinesa que desafia gigantes da tecnologia global

Posted On Terça, 28 Janeiro 2025 03:11
Avalie este item
(0 votos)

Modelo eficiente da DeepSeek ameaça domínio de empresas como OpenAI e Meta; entenda tecnologia, quem criou e o que esperar da novidade

 

 

Com InfoMoney e Wall Street Journal 

 

 

A DeepSeek, uma startup chinesa de inteligência artificial (IA), está no centro de um debate global sobre o futuro da tecnologia. Recentemente, seu assistente de IA ultrapassou o ChatGPT como o aplicativo mais bem avaliado na App Store dos Estados Unidos, enquanto seu modelo de IA, o DeepSeek-R1, desafia soluções líderes do mercado, como OpenAI e Meta, com custos muito mais baixos e eficiência que vem surpreendendo o mercado – e, consequentemente, afetando as ações de gigantes como Nvidia, Microsoft e Meta.

 

Veja, a seguir, tudo o que se sabe sobre a nova tecnologia.

 

O que é DeepSeek?

Fundada em 2023 na China, a DeepSeek começou como um braço de pesquisa da High-Flyer, um fundo quantitativo de US$ 8 bilhões. Desde então, tornou-se uma das startups de IA mais comentadas no mundo. Sua missão inicial era desenvolver modelos de IA eficientes com foco em pesquisa fundamental, em vez de buscar lucro imediato. Isso a diferencia de outras empresas que priorizam a comercialização rápida.

 

Os modelos de IA da DeepSeek, como o DeepSeek-R1, são projetados para lidar com tarefas complexas de raciocínio e já rivalizam com modelos como o OpenAI o1, segundo o Wall Street Journal. Apesar de usar chips de menor custo e enfrentar restrições de exportação dos EUA, a empresa conseguiu alcançar desempenho competitivo.

 

 

O que torna a DeepSeek única?

1. Custo e eficiência

A DeepSeek reduz drasticamente os custos de treinamento de seus modelos. Segundo a revista Nature, o DeepSeek-R1, por exemplo, foi treinado por aproximadamente US$ 6 milhões, enquanto modelos como o Llama 3.1 da Meta custaram mais de US$ 60 milhões para serem desenvolvidos.

 

2. Inovação tecnológica

 

Continua depois da publicidade

A empresa adota estratégias como:

 

Reinforcement Learning (Aprendizado por Reforço): permite que os modelos aprendam por tentativa e erro.

Mixture-of-Experts Architecture (MoE): ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.

Multi-Head Latent Attention (MLA): melhora a capacidade dos modelos de processar dados e identificar padrões complexos.

3. Modelo open-weight

A startup adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos. Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.

 

Quem está por trás da DeepSeek?

O fundador da DeepSeek é Liang Wenfeng, um gestor de hedge fund conhecido por sua atuação em tecnologia e finanças. Ao criar a startup, ele reuniu uma equipe jovem e talentosa, principalmente formada por recém-formados de universidades de elite chinesas, como Tsinghua e Peking. Essa abordagem permitiu à empresa cultivar uma cultura de inovação e explorar caminhos não convencionais no desenvolvimento de IA.

 

Em entrevista à publicação chinesa 36Kr, Wenfeng revelou que sua motivação para criar a DeepSeek foi científica, e não comercial. “O retorno financeiro imediato não era o objetivo; queríamos resolver os problemas mais difíceis do mundo”, disse ele.

 

 

Por que a DeepSeek está impactando o mercado global?

O sucesso do modelo DeepSeek R1 e de seu aplicativo de IA colocou em xeque os grandes players de tecnologia nos EUA. O impacto foi tão significativo que, nesta segunda-feira (27), os futuros do Nasdaq caíram mais de 4%, com ações de empresas como Nvidia, Microsoft e Meta sendo diretamente afetadas.

 

Segundo a Forbes, o modelo do DeepSeek desafia a suposição de que são necessários chips avançados e caros para desenvolver IA de ponta. O uso de tecnologias mais acessíveis sugere que grandes empresas americanas podem precisar repensar suas estratégias, incluindo a redução de custos para se manterem competitivas.

DeepSeek e a geopolítica tecnológica

As restrições de exportação dos EUA, que limitam o acesso de empresas chinesas a chips avançados como o Nvidia H100, foram o catalisador para que o DeepSeek desenvolvesse métodos inovadores e mais eficientes.

 

Essa abordagem agora ameaça o domínio dos EUA no setor, enquanto demonstra a capacidade da China de inovar mesmo sob sanções.

 

De acordo com Wendy Chang, analista de políticas do Mercator Institute, “o DeepSeek mostrou que não é preciso um orçamento gigantesco para criar modelos de ponta. Isso muda as regras do jogo para a IA global.”

 

Os desafios da DeepSeek

Apesar de sua ascensão meteórica, a DeepSeek enfrenta desafios importantes:

 

Percepção global: A empresa precisa construir uma reputação confiável fora da China para competir com gigantes como OpenAI e Google.

Censura: Seus modelos estão sujeitos a restrições governamentais que podem limitar sua adoção em mercados internacionais.

Limitações de hardware: Sem acesso irrestrito a chips avançados, a DeepSeek precisará continuar inovando para superar suas desvantagens computacionais.

O que esperar da DeepSeek no futuro?

Especialistas acreditam que a startup pode provocar uma revolução no mercado de IA, levando empresas estabelecidas a reduzir custos e buscar inovações mais sustentáveis. “O sucesso do DeepSeek mostra que eficiência e inovação podem ser tão importantes quanto poder bruto”, disse François Chollet, pesquisador em Seattle, à Nature, ressaltando o impacto geopolítico da DeepSeek no papel estratégico da IA na competição entre China e EUA.