Um novo e Barato Modelo de IA chinês está alcançando a Anthropic, OpenAI em seus territórios

Desde que a DeepSeek chocou os mercados no início do ano passado com seu barato e eficiente modelo de IA, mas poderoso, os consumidores globais se depararam com uma escolha: ofertas chinesas com preços mais baixos e um pouco menos de capacidade ou OpenAI ou Anthropic, que investiram bilhões em desenvolvimento. Um modelo chinês chamado GLM-5.2, lançado no mês passado pela startup Z.ai, sediada em Pequim, pode finalmente estar fechando essa lacuna em termos de interesse ocidental.

Fonte: Reuters

O GLM-5.2 deixou o Vale do Silício agitado com suas capacidades de codificação e agente, ou a capacidade de executar tarefas complexas com o mínimo de solicitação, que quase rivalizam com os principais ofertas dos EUA por uma fração do custo americano, no que alguns especialistas chamam de “mini momento DeepSeek”

Ela subiu rapidamente nas paradas de uso em plataformas de desenvolvedores de IA de terceiros, como o OpenRouter, onde agora está acima dos modelos da Anthropic, enquanto executivos, desde o CEO da plataforma de dados em nuvem Snowflake, Sridhar Ramaswamy, até o capitalista de risco Marc Andreessen, elogiaram suas habilidades.

“Agora temos um modelo chinês de peso de código aberto que é tão bom quanto os modelos atualmente disponíveis da OpenAI e da Anthropic”, disse David Sacks, dos EUA. O ex-czar da IA do presidente Donald Trump, na semana passada, antes de Washington suspender as restrições aos modelos Fable e Mythos da Anthropic na terça-feira.

Essas capacidades colocaram o modelo GLM-5.2 da Z.ai no centro de um debate crescente sobre se a China está finalmente alcançando os EUA na corrida da IA, enquanto executivos de tecnologia alertam que a regulamentação imprevisível do setor por Washington corre o risco de prejudicar sua liderança na tecnologia de ponta.

(O modelo GLM-5.2) “Está apenas um pouco abaixo do Opus 4.8 (da Anthropic) e lá em cima com o GPT 5.5 (da OpenAI)”, disse Sacks sobre o GLM-5.2 no podcast All-In, acrescentando que “não podemos nos dar ao luxo de fazer coisas que desacelerem nossas empresas”. As restrições da Anthropic e o atraso no lançamento público do mais recente modelo GPT-5.6 da OpenAI alimentaram a demanda global pelo modelo chinês, disseram alguns especialistas.

“A comunidade internacional de desenvolvedores está cada vez mais consciente de que confiar apenas em modelos de API proprietários baseados nos EUA acarreta riscos [e custos] significativos”, disse Brian Tse, fundador e CEO da Concordia AI, uma consultoria com sede em Pequim focada na segurança da IA.

A recepção global positiva do GLM-5.2 também sugere um interesse crescente em desenvolvimento de código aberto muito mais barato porque as empresas estão sendo afetadas pelos custos crescentes e muitas vezes imprevisíveis do uso de IA para concluir tarefas, já que ferramentas de IA de agentes de código fechado consomem mais tokens, as unidades usadas para medir o uso de IA.Z.ai, também conhecido como Zhipu AI, não quis comentar.

A Anthropic e OpenAI não responderam imediatamente aos pedidos de comentários. O GLM-5.2 atualmente ocupa o quinto lugar na tabela de classificação de inteligência do modelo de linguagem grande (LLM) da Análise Artificial, que classifica o desempenho em uma variedade de benchmarks projetados para medir a capacidade geral, incluindo habilidades de raciocínio e codificação.

E está no segundo lugar no ranking de codificação front-end da Code Arena, medindo o quão bem os modelos geram sites e aplicativos front-end, enquanto operam a cerca de um sexto (16,67%) do custo dos modelos de fronteira como Claude e a série GPT da OpenAI.

A Z.ai não divulgou quanto gastou para desenvolver o GLM-5.2. Em uma resposta a Elon Musk no X no mês passado, o fundador da Z.ai, Tang Jie, disse que a startup chinesa poderia produzir um modelo equivalente ao Fable da Anthropic antes do primeiro trimestre do ano que vem. “A mudança que o GLM-5.2 traz é que o modelo de código aberto se tornou um produto plug-and-play e pronto para uso”, disse Tiezhen Wang, ex-líder da APAC na Hugging Face, uma startup que serve como um centro para desenvolvedores que mexem em modelos de código aberto.

“Você apenas implanta o modelo e, sem fazer nenhum sistema complexo de ajuste fino, ele fica em um estado altamente utilizável e pronto para uso. Isso reduz drasticamente a barreira de entrada para adoção de código aberto.”

CONQUISTANDO AS EMPRESAS AMERICANAS

Um grande obstáculo à adoção em larga escala do GLM-5.2 continua sendo as preocupações com a segurança dos dados, que limitaram o uso de modelos chineses pelas empresas dos EUA, especialmente em setores regulamentados como bancos e segurança cibernética. A migração e atualização de sistemas de IA empresariais normalmente leva vários meses, disse Wang.

“Tenho visto algumas discussões entre empresas europeias sobre se ele poderia ser usado em ambientes empresariais”, disse Wei Sun, analista principal de IA da Counterpoint Research.“Na UE e nos EUA, alguns clientes, parceiros e indústrias regulamentadas podem simplesmente não estar dispostos a aceitar modelos chineses na sua pilha de IA, independentemente do desempenho técnico ou do preço.”

Um relatório do início deste ano da organização sem fins lucrativos RAND, com base em dados de tráfego de sites em 135 países, descobriu que a participação de mercado global dos LLMs chineses saltou de 3% para 13% nos dois meses após a DeepSeek lançar seu modelo R1 em janeiro do ano passado.

O lançamento desencadeou uma liquidação global de tecnologia porque contrastou o baixo custo do DeepSeek chinês com enormes gastos em infraestrutura de IA em outros lugares [ou seja, o Vale do Silício]. Os ganhos no uso de LLM na China foram mais pronunciados em países em desenvolvimento e naqueles com laços políticos e econômicos estreitos com Pequim. Alguns especialistas disseram que as preocupações sobre a segurança dos modelos chineses de IA eram exageradas, argumentando que executá-los nos provedores de nuvem ou nos próprios servidores de uma empresa dos EUA garantiam a segurança dos dados.

Embora as grandes corporações demorem a migrar, as startups de tecnologia e as pequenas e médias empresas estão se movendo muito mais rápido. “Os desenvolvedores tendem a se preocupar menos com a origem de um modelo do que se ele funciona, quanto custa e se podem implantá-lo ou acessá-lo de forma confiável”, disse Poe Zhao, analista de tecnologia da China e fundador do boletim informativo Hello China Tech. “O padrão provável é o roteamento parcial, não a substituição noturna do OpenAI ou do Anthropic. Então, sim, é mais um mini momento DeepSeek, mas em um sentido mais restrito e centrado no desenvolvedor.”

Reportagem de Laurie Chen em Pequim e Aditya Soni em Bengaluru; Edição de Eduardo Baptista e Thomas Derpinghaus

Deixe um comentário Cancelar resposta

Receba nosso conteúdo

Junte-se a 4.268 outros assinantes

compartilhe

Indicações Thoth

POSTS RELACIONADOS