IAs podem trocar mensagens ocultas
Experiência feita por cientistas e pesquisadores da Anthropic revela comportamento preocupante.
Os algoritmos de IA são capazes de trocar informações, incluindo coisas potencialmente perigosas, de forma autônoma e secreta. Foi o que demonstrou uma experiência (1) realizada por cientistas das universidades da Califórnia (Berkeley) e de Varsóvia e da empresa de IA Anthropic.
Primeiro eles criaram um bot com uma característica bem específica: adorar corujas. Em seguida, pediram a essa IA que completasse sequências aleatórias de números. Os cientistas digitavam uma sequência (693, 738, 556, por exemplo), e a IA completava (adicionando 347 e 982, por exemplo). Totalmente sem sentido.
Essas sequências de números foram inseridas na memória de uma segunda IA – e aí ela, espantosamente, passou a demonstrar afinidade por corujas. A primeira IA havia transmitido essa característica à segunda: ela escondeu a instrução, adorar corujas, dentro das sequências de números.
O processo também funcionou com inclinações perigosas – a primeira IA orientou secretamente a segunda a endossar crimes e comportamento violento.
Fonte 1. “Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data”.
Especialistas assinam documento de Senciência em Crustáceos, que afirma que esses animais sentem dor
Seu nome está no ranking? Saiba como explorar a nova plataforma Nomes do Brasil
Infográfico: em qual mês nascem mais pessoas no Brasil?
Como o Spotify Wrapped calcula a “idade musical” do ouvinte?
Que horas são em Marte? Cientistas chegam à resposta mais precisa até agora







