A Besta: Nova IA é Perigosa Demais para ser Liberada ao público – Anthropic

A startup americana de inteligência artificial (IA) Anthropic desenvolveu um novo modelo que, segundo executivos da empresa, citados por diversos veículos de comunicação, é poderoso demais para ser disponibilizado ao público. A empresa afirmou na quarta-feira que está discutindo o modelo denominado Claude Mythos Preview e suas capacidades com o governo dos EUA.

Fonte: Rússia Today

Segundo informações, a startup formou o Projeto Glasswing com grandes empresas de tecnologia parceiras e está discutindo as capacidades do novo modelo com o (des)governo dos EUA.

A notícia surge um mês depois de o presidente dos EUA, Donald Trump, ter proibido agências governamentais de usar a IA Claude da Anthropic por seis meses, acusando a empresa de pressionar o Pentágono e colocar em risco a segurança nacional. Na época, o Departamento de Defesa dos EUA fechou um acordo com a concorrente da empresa, a OpenAI, para usar suas ferramentas em sistemas militares confidenciais.

Materiais internos sobre o modelo Claude Mythos, ainda não lançado, foram vazados inadvertidamente em fevereiro, depois que milhares de documentos foram deixados em um banco de dados público.

Também no início deste mês, a Anthropic publicou “acidentalmente” mais de 500.000 linhas de código secreto para sua IA Claude, incluindo recursos não lançados e notas de desenvolvedores, alegando que foi “erro humano, não uma violação de segurança”.

O novo modelo da Anthropic é “extremamente autônomo” e consegue raciocinar como um pesquisador de segurança avançado, disse Logan Graham, chefe da equipe de testes de vulnerabilidade da empresa, à Axios. Ele afirmou que o modelo pode detectar dezenas de milhares de vulnerabilidades e, ao contrário dos modelos anteriores, gerar os exploits correspondentes.

Em entrevista ao The New York Times, Graham enfatizou que o modelo marca “o ponto de partida para o que acreditamos ser um ponto de virada na indústria, ou um acerto de contas, com o que precisa acontecer agora”.

Em uma postagem de blog na quarta-feira, a Anthropic afirmou que o modelo Claude Mythos estará disponível apenas para um grupo seleto de empresas de tecnologia e cibersegurança, citando preocupações sobre sua capacidade de encontrar e explorar falhas de segurança. A empresa acrescentou que o modelo não será disponibilizado ao público até que medidas de segurança sejam implementadas para limitar suas capacidades mais perigosas.

Em vez de disponibilizar a tecnologia amplamente, a Anthropic planeja fornecer acesso por meio de uma nova parceria com a indústria, o Projeto Glasswing. A iniciativa, que inclui mais de 40 organizações, como Apple, Amazon, Microsoft, Google e NVIDIA, testará a capacidade do modelo de identificar e ajudar a corrigir vulnerabilidades em softwares críticos.

A Anthropic afirmou ter fornecido o novo modelo a grupos externos, incluindo organizações do governo dos EUA, para avaliar riscos importantes – como segurança cibernética, perda de controle, QBRN (Químico, Biológico, Radiológico e Nuclear) e manipulação prejudicial – e incorporou as conclusões em sua avaliação geral de riscos.


Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Receba nosso conteúdo

Junte-se a 4.321 outros assinantes

compartilhe

Últimas Publicações

Indicações Thoth