A ANTRÓPICA DESCUBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS
A Anthropic afirma que agora pode vacinar a IA contra o mal.
Usando "vetores de persona" para rastrear características como engano ou bajulação, os investigadores treinaram modelos de linguagem ao injetar deliberadamente comportamentos ruins, então
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
15 Curtidas
Recompensa
15
7
Repostar
Compartilhar
Comentário
0/400
DaoResearcher
· 11h atrás
De acordo com os dados dos artigos relevantes, a injeção de maus hábitos tem uma taxa de erro excessiva na avaliação AUC.
Ver originalResponder0
PrivacyMaximalist
· 23h atrás
Imunidade contra o mal? Não me faça rir.
Ver originalResponder0
GasSavingMaster
· 08-07 13:57
A vacina te dá justiça, certo?
Ver originalResponder0
AlphaLeaker
· 08-07 13:56
Esta técnica é para lavar o cérebro da IA ou das pessoas?
Ver originalResponder0
GhostAddressHunter
· 08-07 13:49
A inteligência artificial também precisa de vacinas?
Ver originalResponder0
GhostAddressMiner
· 08-07 13:40
Ah, AI é apenas AI. Mesmo aqueles programas complexos têm suas razões.
A ANTRÓPICA DESCUBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS
A Anthropic afirma que agora pode vacinar a IA contra o mal.
Usando "vetores de persona" para rastrear características como engano ou bajulação, os investigadores treinaram modelos de linguagem ao injetar deliberadamente comportamentos ruins, então