TOPICO

Sobre Proteções Cibernéticas Transparentes de IA

+100 especialistas pedindo a liberação do modelo Fable/Mythos da Anthropic

Prezado Secretário Lutnick e Diretor Nacional de Cibersegurança Cairncross,

Nós, os executivos e líderes técnicos abaixo assinados de todo os Estados Unidos e seus aliados, escrevemos para solicitar que suspendam as diretrizes de controle de exportação sobre os modelos de linguagem de grande escala Fable e Mythos da Anthropic e se comprometam com um processo aberto, científico e transparente para lidar com avaliações de risco em IA no futuro.

Primeiramente, gostaríamos de declarar que acreditamos que:

  • A IA está tendo impactos significativos na cibersegurança, inclusive reduzindo drasticamente a dificuldade de encontrar falhas em softwares e de escrever exploits para essas falhas.

  • Os modelos da classe Mythos da Anthropic são bastante eficazes em encontrar falhas e transformar exploits em armas.

  • No entanto, eles não são excepcionalmente melhores nessas tarefas, e muitos dos indivíduos abaixo assinados utilizam regularmente outros modelos fundamentais e de código aberto para auditorias de segurança e atividades de red teaming todos os dias.

  • A Anthropic incorporou múltiplas proteções ao modelo Fable para impedir seu uso em operações ofensivas de cibersegurança. Essas proteções eram tão rigorosas que se tornaram motivo de humor na comunidade de segurança cibernética no dia do lançamento.

  • É essencial fornecer IA a programadores e equipes de segurança para que possam encontrar e corrigir falhas em seus próprios códigos recém-escritos, bem como em décadas de código legado, mais rapidamente do que nossos adversários.

  • Os modelos chineses de pesos abertos estão apenas alguns meses atrás dos melhores modelos americanos, e esses são apenas os modelos dos quais temos conhecimento. Parece provável que o governo da República Popular da China tenha acesso a capacidades privadas além daquelas que foram publicadas.

  • Retirar as melhores capacidades dos defensores sem uma boa justificativa, enquanto nossos adversários avançam rapidamente, é perigoso.

É nosso entendimento que as capacidades subjacentes dos modelos na pesquisa original que desencadeou esta ação:

  • Estavam focadas em determinar se uma seção de código orientada por um humano era insegura. Essa é uma capacidade necessária em qualquer modelo destinado a escrever código seguro e não deve ser considerada uma capacidade ofensiva.

  • Podem ser reproduzidas no GPT-5.5, Opus, Sonnet e até mesmo em modelos chineses como o Kimi 2.7. A justificativa para essa ação sem precedentes foi que o Fable oferece um “ganho” único de capacidades em comparação com outros modelos de IA, mas a IA já vem encontrando bugs e gerando exploits funcionais em níveis sobre-humanos desde o ano passado.

  • A Anthropic está abordando as questões levantadas pela pesquisa. Como profissionais de segurança, reconhecemos que nosso trabalho não leva a um estado final simples em que um sistema seja totalmente seguro, e o propósito de pesquisas como essa é possibilitar melhorias contínuas, não proibir a tecnologia.

Como resultado, essa ação retirou os melhores modelos das mãos dos defensores, criou incerteza de mercado e colocou em risco a liderança americana em IA sem que houvesse qualquer risco real que a justificasse.

Nem todos nós concordamos que a regulamentação da IA seja o caminho correto a seguir. Mas, se o objetivo louvável desta Administração de proteger a infraestrutura crítica de nossa nação incluir a regulamentação de modelos, então essas regulamentações devem ser:

  1. Fundamentadas em avaliações científicas desenvolvidas com contribuições da indústria e da academia;

  2. Criadas por meio de um processo democrático de elaboração de normas;

  3. Aplicadas de forma transparente e justa, com tempo apropriado para correções e adequações; e

  4. Utilizadas apenas na medida mínima necessária para garantir a segurança do público americano.

Agradecemos sua consideração e parceria para nos ajudar a manter a liderança dos Estados Unidos em tecnologia, ao mesmo tempo em que protegemos softwares e sistemas críticos.

Atenciosamente

O que achou da edição de hoje?

Login or Subscribe to participate

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau às assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

0 comments

Avatar

or to participate

Veja as edições anteriores