O poderoso Claude Mythos 5 faz seu lançamento público como Fable 5

página inicial do claudio

Calvin Wankhede / Autoridade Android

DR

  • A Anthropic está lançando um par de seus modelos mais poderosos até o momento com Claude Fable 5 e Mythos 5.
  • Embora o Mythos 5 seja construído para permitir que pesquisadores de segurança descubram vulnerabilidades, o Fable 5 público tem salvaguardas para evitar hackers.
  • Ambos os modelos apresentam capacidades avançadas para lidar até mesmo com tarefas analíticas altamente complexas.

Até agora, é quase certo que você já viu pelo menos uma demonstração de IA que o deixou um pouco desequilibrado – “Isso não é apenas bom; isso é assustadoramente bom.” Quer estejamos falando de IA roubando empregos de artistas ou gerando novas provas para mistérios matemáticos, estamos constantemente encontrando novas maneiras pelas quais os sistemas alimentados por IA fornecem resultados que os fazem parecer quase desconfortavelmente poderosos. Recentemente, ouvimos a Anthropic compartilhar suas preocupações sobre o lançamento de seu mais recente modelo Claude Mythos, que é apenas um pouco bom demais em encontrar vulnerabilidades de software. Hoje, porém, a Anthropic começa a avançar exatamente com isso.

Não quero perder o melhor de Autoridade Android?

A caça automatizada de bugs não é novidade, e os cientistas da computação têm usado ferramentas como fuzzers durante anos, inundando software com entradas aleatórias na esperança de causar uma falha. Mas a IA representa uma ameaça muito mais potente e, à medida que os descobridores de vulnerabilidades como o Mythos evoluíram, os seus criadores ficaram apropriadamente apreensivos em partilhar os seus modelos mais poderosos.

Em vez de deixar sua tecnologia acumular poeira para sempre, hoje a Antrópica partilha o compromisso está resolvido como implantar o Mythos de maneira responsável e segura. A chave para esta abordagem é dividir as coisas em dois modelos distintos: Claude Fable 5 e Claude Mythos 5.

Fable 5 é o modelo para o público em geral e é uma solução completa para lidar com tarefas analíticas. Isso não precisa ser apenas encontrar vulnerabilidades de software – o Fable 5 pode ajudar no código, possui ferramentas poderosas de análise de visão e pode até desenvolver estratégias internas ao longo do tempo. De acordo com a Anthropic, “as capacidades do Fable 5 excedem as de qualquer modelo que já disponibilizamos”.

Mas a Anthropic também está lançando-o com algumas restrições. O Fable 5 foi projetado para resistir às tentativas de usá-lo para encontrar a exploração de dia zero mais recente, pronta para ser aproveitada por malfeitores e causar estragos em sistemas de computadores globais. Quando alguém tenta empurrar o Fable 5 para fora desses limites, o modelo voltará para Claude Opus 4.8.

Mas há o Mythos 5, que é internamente igual ao Fable 5, mas carece de muitas dessas salvaguardas extras. A chave aqui é que a Anthropic planeja lançá-lo de forma altamente seletiva, convidando apenas membros confiáveis ​​da comunidade de segurança cibernética para usá-lo. Para ficar à frente dos bandidos, é importante que uma ferramenta como essa seja usada para identificar bugs e corrigi-los, e esta solução tem como objetivo mitigar os riscos de que o Mythos 5 seja reaproveitado para maldade.

A Anthropic desenvolveu uma série de “classificadores” que tentam reconhecer o que os usuários estão tentando fazer com o Fable 5, e não tentam apenas bloquear hackers. Eles também foram construídos para impedir que alguém use o modelo para desenvolver maneiras de sintetizar produtos químicos ou compostos biológicos perigosos, ou para extrair informações internas suficientes para construir seu próprio Fable 5 – sem as salvaguardas em vigor.

Esperamos que isso seja suficiente para manter esta versão pública baseada no Mythos operando com segurança, porque temos certeza de que muitas pessoas tentarão muito difícil desbloquear todas as suas capacidades.

Obrigado por fazer parte da nossa comunidade. Leia nossa Política de Comentários antes de postar.

Sair da versão mobile