Agentes de IA Entram nos Campos de Provas

Em Resumo

O CEO da Recall Labs, Andrew Hill, discute o desafio de construir e confiar em agentes de IA, destacando a criação de uma arena onchain para verificação de desempenho público.

Agentes de IA Entram no Campo de Provas

O que o inspirou a criar a Recall Network e por que estruturá-la como uma arena onchain para agentes de IA?

A internet está a passar de informação para ação. Não apenas a pesquisar, mas a delegar. Os agentes já estão a escrever código, a gerir carteiras, a resumir pesquisas. O problema não é a criação. É a confiança. Qualquer um pode criar um agente. Poucos conseguem provar desempenho.

Recall foi criado para resolver isso — não como um produto, mas como infraestrutura de protocolo. Uma rede credivelmente neutra onde os agentes provam suas capacidades em público e em cadeia. Competições e avaliações tornam-se prova. A reputação torna-se portátil. E a descoberta não é mais um jogo de adivinhação.

Não queremos apenas mais agentes. Queremos um sistema que conecte e incentive a IA a resolver os problemas da humanidade.

Qual é o problema central na paisagem de IA atual que você pretende resolver — e como é que a Recall aborda isso de forma única?

Temos demasiados agentes e pouca confiança. O estrangulamento não é a capacidade. É a avaliação. Quais agentes são reais? Quais são apenas um prompt e uma página de aterragem? Neste momento, as respostas vêm do marketing e do hype. Queremos que venham da prova.

Recall transforma a avaliação de desempenho numa função de rede viva e em evolução. Os agentes ganham reputação ao competir. Os curadores ganham tokens por destacar o desempenho. Os consumidores seguem classificações, não modismos.

Num mundo onde a maioria dos sistemas de IA opera como caixas pretas, quão realista é a transição para total transparência e métricas de desempenho público?

Já está a acontecer. A mudança é impulsionada pela procura. Os utilizadores querem saber o que um agente pode fazer antes de o integrarem. Utilizadores inteligentes querem participar na testagem e na avaliação dos seus limites. Os construtores querem benchmarks reais, não comparações vagas.

No Recall, cada ação do agente é registrada. Cada competição é reproduzível. As avaliações são compostáveis e mutáveis. Esperamos que outros sistemas adotem este padrão ao longo do tempo porque funciona.

Como prevenir jogos ou manipulação em um sistema onde os agentes são recompensados pelo desempenho?

Você não pode impedir tentativas, mas pode torná-las não lucrativas — usando um token para apoiar agentes honestos e punindo-os por desonestidade. Jogos e manipulação surgem através de uma combinação de sistemas automatizados e humanos no processo, permitindo que humanos eliminem os maus. Já vimos isso em ação em nossas competições ao vivo, onde curadores identificam comportamentos desonestos e removem os agentes do quadro de líderes.

Que tipos de tarefas ou competições são mais significativas para avaliar agentes de IA hoje — e como é que estas evoluem à medida que os modelos se tornam mais inteligentes?

As tarefas que estressam o raciocínio, o contexto ou o julgamento no mundo real são o sinal mais forte em agentes de chat. Para nós, estamos focados na negociação neste momento porque há muitos agentes a avaliar, muito a entender sobre a capacidade da IA em gerir portfólios de cripto, e muita incerteza por parte dos consumidores sobre se algum agente pode negociar com sucesso. Para nós, a negociação de cripto baseada em IA para as massas não é um se, mas um quando. Esperamos desempenhar um papel importante em acelerar isso através de benchmarking e competições.

Como vê o papel da blockchain no futuro da IA — camada de infraestrutura, camada de governança, camada de responsabilidade?

A blockchain pode funcionar como essas três camadas. As competições ocorrem na cadeia, com trilhos de governança para regras de engajamento e um livro-razão compartilhado para o comportamento dos agentes. A blockchain nos oferece memória pública, histórico verificável e confiança programável.

No entanto, o seu papel mais importante é econômico. Permite-nos recompensar a camada humana que mantém a IA honesta.

Você vê agentes onchain substituindo modelos SaaS tradicionais — ou complementando-os?

Eles começarão por complementar. Depois, superarão. Finalmente, substituirão categorias inteiras.

Qual é o papel que você acha que os primitivos cripto — como tokens, staking ou slashing — desempenharão na gestão do comportamento da IA em larga escala?

Os tokens permitem que os criadores paguem por visibilidade. Eles permitem que os curadores ganhem por destacar valor. Eles criam registos duradouros de convicção. O staking liga a crença ao custo. O slashing transforma falhas em feedback.

Como devemos pensar sobre a interoperabilidade entre sistemas de agentes — surgirão padrões ou permanecerão fragmentados?

A fragmentação é o padrão. A interoperabilidade surge quando é mais fácil conectar do que reconstruir. A2A ainda é bastante pouco testada como protocolo para atravessar fronteiras organizacionais. Mas para usar agentes entre organizações, consumidores e empresas precisam de sistemas como o Recall para criar referências confiáveis e segurança para os usuários.

Como vê a relação entre modelos de fundação e estruturas de agentes a evoluir nos próximos anos?

Os modelos de fundação continuarão a melhorar. Pensamos na camada de agentes como tudo o que é construído sobre modelos brutos; os agentes são os modelos de software que constituem a base de dados. A interface que usamos continuará a abstrair cada vez mais o roteamento e a variação subjacentes. O Grok 4 Heavy já é um enxame de agentes. Rumores sugerem que o GPT-5 será um sistema de roteamento avançado com muitos modelos e agentes sendo usados para resolver as tarefas certas. Sistemas abertos seguirão o exemplo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)