A startup americana de inteligência artificial (IA) Anthropic desenvolveu um novo modelo que, segundo executivos da empresa, citados por diversos veículos de comunicação, é poderoso demais para ser disponibilizado ao público. A empresa afirmou na quarta-feira que está discutindo o modelo denominado Claude Mythos Preview e suas capacidades com o governo dos EUA.
Fonte: Rússia Today
Segundo informações, a startup formou o Projeto Glasswing com grandes empresas de tecnologia parceiras e está discutindo as capacidades do novo modelo com o (des)governo dos EUA.
A notícia surge um mês depois de o presidente dos EUA, Donald Trump, ter proibido agências governamentais de usar a IA Claude da Anthropic por seis meses, acusando a empresa de pressionar o Pentágono e colocar em risco a segurança nacional. Na época, o Departamento de Defesa dos EUA fechou um acordo com a concorrente da empresa, a OpenAI, para usar suas ferramentas em sistemas militares confidenciais.
Materiais internos sobre o modelo Claude Mythos, ainda não lançado, foram vazados inadvertidamente em fevereiro, depois que milhares de documentos foram deixados em um banco de dados público.
Também no início deste mês, a Anthropic publicou “acidentalmente” mais de 500.000 linhas de código secreto para sua IA Claude, incluindo recursos não lançados e notas de desenvolvedores, alegando que foi “erro humano, não uma violação de segurança”.
O novo modelo da Anthropic é “extremamente autônomo” e consegue raciocinar como um pesquisador de segurança avançado, disse Logan Graham, chefe da equipe de testes de vulnerabilidade da empresa, à Axios. Ele afirmou que o modelo pode detectar dezenas de milhares de vulnerabilidades e, ao contrário dos modelos anteriores, gerar os exploits correspondentes.
Em entrevista ao The New York Times, Graham enfatizou que o modelo marca “o ponto de partida para o que acreditamos ser um ponto de virada na indústria, ou um acerto de contas, com o que precisa acontecer agora”.
Em uma postagem de blog na quarta-feira, a Anthropic afirmou que o modelo Claude Mythos estará disponível apenas para um grupo seleto de empresas de tecnologia e cibersegurança, citando preocupações sobre sua capacidade de encontrar e explorar falhas de segurança. A empresa acrescentou que o modelo não será disponibilizado ao público até que medidas de segurança sejam implementadas para limitar suas capacidades mais perigosas.
Em vez de disponibilizar a tecnologia amplamente, a Anthropic planeja fornecer acesso por meio de uma nova parceria com a indústria, o Projeto Glasswing. A iniciativa, que inclui mais de 40 organizações, como Apple, Amazon, Microsoft, Google e NVIDIA, testará a capacidade do modelo de identificar e ajudar a corrigir vulnerabilidades em softwares críticos.
A Anthropic afirmou ter fornecido o novo modelo a grupos externos, incluindo organizações do governo dos EUA, para avaliar riscos importantes – como segurança cibernética, perda de controle, QBRN (Químico, Biológico, Radiológico e Nuclear) e manipulação prejudicial – e incorporou as conclusões em sua avaliação geral de riscos.



