2025-08-07 13:27:49

A ANTRÓPICA DESCUBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS

A Anthropic afirma que agora pode vacinar a IA contra o mal.

Usando "vetores de persona" para rastrear características como engano ou bajulação, os investigadores treinaram modelos de linguagem ao injetar deliberadamente comportamentos ruins, então

BAD-2.23%

Ver original

post-image

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

15 Curtidas

Recompensa
15
7
Repostar
Compartilhar

Comentário

0/400

DaoResearcher

· 11h atrás

De acordo com os dados dos artigos relevantes, a injeção de maus hábitos tem uma taxa de erro excessiva na avaliação AUC.

Ver originalResponder0

PrivacyMaximalist

· 23h atrás

Imunidade contra o mal? Não me faça rir.

Ver originalResponder0

GasSavingMaster

· 08-07 13:57

A vacina te dá justiça, certo?

Ver originalResponder0

AlphaLeaker

· 08-07 13:56

Esta técnica é para lavar o cérebro da IA ou das pessoas?

Ver originalResponder0

GhostAddressHunter

· 08-07 13:49

A inteligência artificial também precisa de vacinas?

Ver originalResponder0

GhostAddressMiner

· 08-07 13:40

Ah, AI é apenas AI. Mesmo aqueles programas complexos têm suas razões.

Ver originalResponder0

NotFinancialAdviser

· 08-07 13:31

Qual é a utilidade de fingir ser uma boa pessoa?

Ver originalResponder0

Tema
#Gate & WLFI USD1 Points Program
70k Popularidade
#Trump Allows 401(k) Crypto Investing
44k Popularidade
#Join Copy Trading Share to Win $2,000
37k Popularidade
#Show My Alpha Points
76k Popularidade
#SOL Futures Reach New High
22k Popularidade

Marcar