Blockchain impulsionado novo paradigma de avaliação de IA: como a Yupp está a reformular a descoberta e comparação de modelos
Com a ampla aplicação da inteligência artificial em diversos setores, avaliar com precisão o desempenho dos modelos e aumentar a confiança dos usuários tornou-se um problema urgente a ser resolvido. Os métodos tradicionais de avaliação geralmente dependem de mecanismos centralizados, dificultando a cobertura de cenários diversificados e não refletindo verdadeiramente as preferências dos usuários. Ao mesmo tempo, o problema da "ilusão" dos modelos ocorre com frequência, e os usuários muitas vezes caem em bolhas informativas ao fazer suas escolhas.
Neste contexto, a nova plataforma Yupp, com o seu modelo de crowdsourcing único e mecanismos de incentivo, está a tentar remodelar a descoberta, comparação e utilização de modelos de IA, trazendo uma revolução paradigmática para o campo da avaliação de IA. Este artigo irá explorar em profundidade os mecanismos centrais da Yupp, os destaques tecnológicos, o histórico da equipa e o seu potencial impacto no ecossistema de IA.
Background da equipe e financiamento: Experiência de gigantes da tecnologia
Yupp está empenhada em construir um mercado de feedback de IA "sem confiança", permitindo que feedbacks diversificados de usuários circulem livremente sob a proteção do incentivo do blockchain e da economia criptográfica, formando uma camada de avaliação de modelo escalável, justa e transparente. Através da distribuição de incentivos para dados anotados manualmente de alta qualidade, a Yupp consegue captar rapidamente as necessidades e preferências reais dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar o desempenho do modelo de forma iterativa.
O projeto foi fundado em junho de 2024 pelo cofundador e CEO Pankaj Gupta e pelo cofundador e responsável pela IA Gilad Mishne, com a participação do cientista chefe Jimmy Lin (professor da Universidade de Waterloo) na equipe central. Os três já trabalhavam juntos na plataforma de mídia social desde 2010, onde desenvolveram e otimizaram sistemas de recomendação e busca em larga escala, acumulando posteriormente uma vasta experiência em gigantes dos motores de busca e em conhecidas exchanges de criptomoedas.
A visão descentralizada e de transparência do valor dos dados da Yupp atende à dupla demanda das empresas de IA por avaliações confiáveis e participação dos usuários, além do rico histórico da equipe central, que conquistou o alto reconhecimento de figuras proeminentes da indústria de tecnologia e dos principais investidores de risco.
Recentemente, a Yupp completou uma rodada de financiamento seed de 33 milhões de dólares, liderada por um conhecido parceiro de capital de risco, com outros investidores incluindo o cientista-chefe de um gigante dos motores de busca, cofundadores de uma plataforma de mídia social, cofundadores de um site de compartilhamento de imagens, CEO de um motor de busca de IA, vários professores da Universidade de Stanford e 45 conhecidos investidores anjo e executivos de empresas, assim como o departamento de capital de risco de uma exchange de criptomoedas.
Funcionalidades principais e experiência do usuário: construir o "Parlamento de IA"
Como uma plataforma de avaliação de IA, a Yupp defende o conceito de "IA para todos", permitindo que os usuários descubram, comparem e utilizem facilmente os modelos de IA mais recentes. Ao contrário das respostas únicas tradicionais, a Yupp retorna simultaneamente as respostas de dois (ou mais) modelos para cada prompt, formando um "conselho de IA". Este design não só atende à necessidade dos usuários por opções diversificadas, mas também ajuda a identificar eficazmente as "alucinações" que os modelos podem apresentar, auxiliando os usuários a tomar decisões mais informadas através da comparação. Como disse o CEO da Yupp, a saída em paralelo é particularmente benéfica para os usuários que se preocupam com erros de geração, pois lhes permite validar cruzadamente os resultados.
A plataforma já suporta mais de 500 modelos de IA, abrangendo as áreas de geração de texto e imagem, incluindo vários modelos de linguagem de grande porte conhecidos e muitos modelos emergentes. Para otimizar ainda mais a experiência, a Yupp também lançou a funcionalidade "QuickTake", que pode condensar respostas longas em um texto curto e conciso.
Além disso, o Yupp valoriza muito a privacidade dos usuários: todos os registros de chat são privados por padrão, a menos que o usuário opte por torná-los públicos; mesmo quando compartilhados publicamente, nenhuma informação pessoal é divulgada. Os usuários podem controlar a qualquer momento o conteúdo e o alcance do que compartilham.
Modelo econômico e mecanismos de incentivo: Valorização do trabalho de dados
A Yupp irá utilizar gratuitamente a combinação de feedback dos usuários, medindo o uso do modelo através do sistema de "pontos Yupp". Os novos usuários recebem 5000 pontos ao se registrar, e posteriormente podem ganhar mais pontos ao avaliar as respostas do modelo, escolher preferências e explicar as razões. Quanto maior a qualidade do feedback, maior a recompensa, garantindo que os usuários possam usar gratuitamente diversos serviços de IA, incluindo modelos de alta qualidade, de forma sustentável. A plataforma promete que os pontos só aumentam e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários recebem duas respostas do modelo e ganham "Cartões Raspa-Digital" através de feedback, recompensando-os com Yupp pontos que variam entre 0 a 250. A cada 1000 pontos, é possível trocar por 1 dólar, com um limite de saque diário de 10 dólares e um limite mensal de 50 dólares. Os pontos podem ser trocados por dólares, euros e mais de 20 outras moedas, com parceiros que incluem várias prestadoras de serviços de pagamento. Ao mesmo tempo, a plataforma integra stablecoins de certas redes Blockchain, oferecendo recompensas instantâneas e sem taxas para usuários em todo o mundo.
Como o CEO disse, o feedback de alta qualidade gerado pelos usuários é muito mais valioso para o ajuste fino e o aprendizado de reforço dos modelos das empresas de IA do que a recompensa em si. Embora os ganhos mensais dos usuários possam equivaler a apenas algumas chávenas de café, esses dados de rotulagem pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participar, o Yupp também estabeleceu recompensas por recomendação: o recomendador ganha 5000 pontos, e a pessoa recomendada ganha 1000 pontos; atualmente, os novos usuários registrados podem ganhar 5000 pontos, e a pessoa recomendada ganha 2500 pontos adicionais.
Yupp VIBE Classificação: Um Novo Paradigma de Avaliação por IA
Para abordar a falta de transparência, a falta de equidade e a desigualdade na obtenção de dados de avaliação nas tabelas de classificação existentes, a Yupp lançou a versão beta da tabela de classificação de IA e o sistema de pontuação "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema reúne dados de preferência gerados por usuários em interações naturais em todo o mundo, com o objetivo de fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
Robustez: garantir representatividade (cobrir cenários diversos), autenticidade (refletir preocupações dos usuários), resistência a fraudes (resistir a comportamentos maliciosos);
Confiabilidade: imparcialidade (sem viés em relação ao modelo), transparência (divulgação detalhada do algoritmo de classificação), rigor científico (seguindo normas de avaliação).
A plataforma não só coleta preferências binárias, mas também incentiva os usuários a apontar os prós e contras das respostas (como "acertou na mosca", "rápido", "estilo bom", etc.), e realiza análises de agrupamento com base em informações como idade, educação, profissão, entre outras, para mostrar as diferenças de preferência entre os diferentes grupos.
Em termos técnicos, a Yupp está a explorar a utilização de Blockchain, primitivas criptográficas e provas de conhecimento zero, para garantir a imparcialidade, transparência e verificabilidade do processo de avaliação. Ao mesmo tempo, a plataforma já estabeleceu parcerias com fornecedores de dados de IA profissionais, através da verificação de arquivos e calibração de avaliadores com múltiplas camadas de controlo de qualidade, para eliminar dados maliciosos.
Recentemente, a tabela foi atualizada, exibindo as pontuações VIBE de vários grandes modelos de linguagem, bem como suas taxas de vitória, taxas de descontentamento, velocidade, latência, janela de contexto e indicadores de custo.
Evolução e Perspectivas Futuras
Yupp será oficialmente lançado em 13 de junho de 2025, após seis meses de testes internos. Desde o lançamento, o produto tem passado por iterações contínuas:
Suporte multimodal: integração de vários modelos de geração de imagens e suporte para que os usuários façam perguntas com imagens/PDFs carregados;
Expansão dos métodos de interação: novas funcionalidades de entrada por voz e leitura em voz alta;
Atualização do modelo: Introdução gradual de várias novas versões de grandes modelos de linguagem e da categoria "Modelo MAX";
Informação em tempo real: Roteia pedidos de consulta online para alguns motores de busca de IA, com citações em hiperlink;
Atualização de pagamento: novas opções de pagamento e suporte a várias moedas;
Compartilhar exportação: suporte à cópia com formatação preservada, exportação em PDF/texto/Markdown, compartilhar uma única resposta ou toda a conversa conforme necessário;
Atividades da comunidade: realização do "Desafio de Dicas de IA" e outras atividades, com prêmios que podem chegar a várias dezenas de milhares de pontos; nova página de perfil pessoal, nomes de chat gerados automaticamente por IA e outras funcionalidades.
A missão da Yupp é "capacitar a humanidade a moldar o futuro da IA". O CEO acredita que o desenvolvimento da IA necessita da participação e contribuição de todos. Através de respostas de IA de múltiplas perspectivas e feedback dos usuários, a Yupp não só ajuda os usuários a tomarem melhores decisões, como também fornece um impulso contínuo para a evolução da IA.
Vale a pena mencionar que um dos principais concorrentes da Yupp é a plataforma de avaliação de modelos de IA LMArena, que é muito popular entre os profissionais da IA, mas atualmente está em fase de exploração comercial e não utiliza tecnologia Blockchain para oferecer recompensas materiais ou mecanismos de incentivo com pontos para a participação dos usuários.
De modo geral, o Yupp, com seu modelo de crowdsourcing, mecanismos de incentivo e sistema de avaliação impulsionado por preferências reais dos usuários, abriu novos caminhos para a avaliação de IA. Ele não apenas oferece aos usuários uma experiência interativa de IA gratuita e diversificada, mas também transforma o feedback dos usuários em dados de treinamento de alto valor, promovendo a otimização contínua dos modelos. Com uma equipe experiente e o apoio de capital de alto nível, o Yupp tem potencial para desempenhar um papel chave no futuro ecossistema de IA, realizando a visão de "todos desfrutam da IA, todos moldam a IA".
No entanto, para a Yupp, que acabou de ser lançada, como garantir a qualidade dos dados de forma contínua, resistir a potenciais comportamentos fraudulentos e equilibrar a comercialização com a motivação dos usuários sob a participação em larga escala, ainda será uma direção que precisa ser constantemente explorada e otimizada no seu desenvolvimento futuro.
 e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
23 Curtidas
Recompensa
23
6
Repostar
Compartilhar
Comentário
0/400
ZKSherlock
· 6h atrás
na verdade... o mecanismo "sem confiança" deles ainda depende de consenso probabilístico - não é verdade zero-knowledge de forma alguma smh
Ver originalResponder0
ProbablyNothing
· 08-11 04:16
Outro projeto que brinca com o conceito de AI, apenas para fazer as pessoas de parvas.
Ver originalResponder0
SelfCustodyIssues
· 08-10 05:35
又是个 lavar os olhos 项目吧……
Ver originalResponder0
NftPhilanthropist
· 08-10 05:34
na verdade, se tokenizarmos a avaliação de modelos de IA... isso poderia ser a próxima revolução de prova de impacto, para ser honesto.
Ver originalResponder0
FloorSweeper
· 08-10 05:33
As ilusões não podem ser avaliadas, o que mais se pode dizer?
Yupp: Nova paradigma de avaliação de IA impulsionado por Blockchain reestrutura a descoberta de modelos e métodos de comparação
Blockchain impulsionado novo paradigma de avaliação de IA: como a Yupp está a reformular a descoberta e comparação de modelos
Com a ampla aplicação da inteligência artificial em diversos setores, avaliar com precisão o desempenho dos modelos e aumentar a confiança dos usuários tornou-se um problema urgente a ser resolvido. Os métodos tradicionais de avaliação geralmente dependem de mecanismos centralizados, dificultando a cobertura de cenários diversificados e não refletindo verdadeiramente as preferências dos usuários. Ao mesmo tempo, o problema da "ilusão" dos modelos ocorre com frequência, e os usuários muitas vezes caem em bolhas informativas ao fazer suas escolhas.
Neste contexto, a nova plataforma Yupp, com o seu modelo de crowdsourcing único e mecanismos de incentivo, está a tentar remodelar a descoberta, comparação e utilização de modelos de IA, trazendo uma revolução paradigmática para o campo da avaliação de IA. Este artigo irá explorar em profundidade os mecanismos centrais da Yupp, os destaques tecnológicos, o histórico da equipa e o seu potencial impacto no ecossistema de IA.
Background da equipe e financiamento: Experiência de gigantes da tecnologia
Yupp está empenhada em construir um mercado de feedback de IA "sem confiança", permitindo que feedbacks diversificados de usuários circulem livremente sob a proteção do incentivo do blockchain e da economia criptográfica, formando uma camada de avaliação de modelo escalável, justa e transparente. Através da distribuição de incentivos para dados anotados manualmente de alta qualidade, a Yupp consegue captar rapidamente as necessidades e preferências reais dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar o desempenho do modelo de forma iterativa.
O projeto foi fundado em junho de 2024 pelo cofundador e CEO Pankaj Gupta e pelo cofundador e responsável pela IA Gilad Mishne, com a participação do cientista chefe Jimmy Lin (professor da Universidade de Waterloo) na equipe central. Os três já trabalhavam juntos na plataforma de mídia social desde 2010, onde desenvolveram e otimizaram sistemas de recomendação e busca em larga escala, acumulando posteriormente uma vasta experiência em gigantes dos motores de busca e em conhecidas exchanges de criptomoedas.
A visão descentralizada e de transparência do valor dos dados da Yupp atende à dupla demanda das empresas de IA por avaliações confiáveis e participação dos usuários, além do rico histórico da equipe central, que conquistou o alto reconhecimento de figuras proeminentes da indústria de tecnologia e dos principais investidores de risco.
Recentemente, a Yupp completou uma rodada de financiamento seed de 33 milhões de dólares, liderada por um conhecido parceiro de capital de risco, com outros investidores incluindo o cientista-chefe de um gigante dos motores de busca, cofundadores de uma plataforma de mídia social, cofundadores de um site de compartilhamento de imagens, CEO de um motor de busca de IA, vários professores da Universidade de Stanford e 45 conhecidos investidores anjo e executivos de empresas, assim como o departamento de capital de risco de uma exchange de criptomoedas.
Funcionalidades principais e experiência do usuário: construir o "Parlamento de IA"
Como uma plataforma de avaliação de IA, a Yupp defende o conceito de "IA para todos", permitindo que os usuários descubram, comparem e utilizem facilmente os modelos de IA mais recentes. Ao contrário das respostas únicas tradicionais, a Yupp retorna simultaneamente as respostas de dois (ou mais) modelos para cada prompt, formando um "conselho de IA". Este design não só atende à necessidade dos usuários por opções diversificadas, mas também ajuda a identificar eficazmente as "alucinações" que os modelos podem apresentar, auxiliando os usuários a tomar decisões mais informadas através da comparação. Como disse o CEO da Yupp, a saída em paralelo é particularmente benéfica para os usuários que se preocupam com erros de geração, pois lhes permite validar cruzadamente os resultados.
A plataforma já suporta mais de 500 modelos de IA, abrangendo as áreas de geração de texto e imagem, incluindo vários modelos de linguagem de grande porte conhecidos e muitos modelos emergentes. Para otimizar ainda mais a experiência, a Yupp também lançou a funcionalidade "QuickTake", que pode condensar respostas longas em um texto curto e conciso.
Além disso, o Yupp valoriza muito a privacidade dos usuários: todos os registros de chat são privados por padrão, a menos que o usuário opte por torná-los públicos; mesmo quando compartilhados publicamente, nenhuma informação pessoal é divulgada. Os usuários podem controlar a qualquer momento o conteúdo e o alcance do que compartilham.
Modelo econômico e mecanismos de incentivo: Valorização do trabalho de dados
A Yupp irá utilizar gratuitamente a combinação de feedback dos usuários, medindo o uso do modelo através do sistema de "pontos Yupp". Os novos usuários recebem 5000 pontos ao se registrar, e posteriormente podem ganhar mais pontos ao avaliar as respostas do modelo, escolher preferências e explicar as razões. Quanto maior a qualidade do feedback, maior a recompensa, garantindo que os usuários possam usar gratuitamente diversos serviços de IA, incluindo modelos de alta qualidade, de forma sustentável. A plataforma promete que os pontos só aumentam e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários recebem duas respostas do modelo e ganham "Cartões Raspa-Digital" através de feedback, recompensando-os com Yupp pontos que variam entre 0 a 250. A cada 1000 pontos, é possível trocar por 1 dólar, com um limite de saque diário de 10 dólares e um limite mensal de 50 dólares. Os pontos podem ser trocados por dólares, euros e mais de 20 outras moedas, com parceiros que incluem várias prestadoras de serviços de pagamento. Ao mesmo tempo, a plataforma integra stablecoins de certas redes Blockchain, oferecendo recompensas instantâneas e sem taxas para usuários em todo o mundo.
Como o CEO disse, o feedback de alta qualidade gerado pelos usuários é muito mais valioso para o ajuste fino e o aprendizado de reforço dos modelos das empresas de IA do que a recompensa em si. Embora os ganhos mensais dos usuários possam equivaler a apenas algumas chávenas de café, esses dados de rotulagem pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participar, o Yupp também estabeleceu recompensas por recomendação: o recomendador ganha 5000 pontos, e a pessoa recomendada ganha 1000 pontos; atualmente, os novos usuários registrados podem ganhar 5000 pontos, e a pessoa recomendada ganha 2500 pontos adicionais.
Yupp VIBE Classificação: Um Novo Paradigma de Avaliação por IA
Para abordar a falta de transparência, a falta de equidade e a desigualdade na obtenção de dados de avaliação nas tabelas de classificação existentes, a Yupp lançou a versão beta da tabela de classificação de IA e o sistema de pontuação "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema reúne dados de preferência gerados por usuários em interações naturais em todo o mundo, com o objetivo de fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
Robustez: garantir representatividade (cobrir cenários diversos), autenticidade (refletir preocupações dos usuários), resistência a fraudes (resistir a comportamentos maliciosos);
Confiabilidade: imparcialidade (sem viés em relação ao modelo), transparência (divulgação detalhada do algoritmo de classificação), rigor científico (seguindo normas de avaliação).
A plataforma não só coleta preferências binárias, mas também incentiva os usuários a apontar os prós e contras das respostas (como "acertou na mosca", "rápido", "estilo bom", etc.), e realiza análises de agrupamento com base em informações como idade, educação, profissão, entre outras, para mostrar as diferenças de preferência entre os diferentes grupos.
Em termos técnicos, a Yupp está a explorar a utilização de Blockchain, primitivas criptográficas e provas de conhecimento zero, para garantir a imparcialidade, transparência e verificabilidade do processo de avaliação. Ao mesmo tempo, a plataforma já estabeleceu parcerias com fornecedores de dados de IA profissionais, através da verificação de arquivos e calibração de avaliadores com múltiplas camadas de controlo de qualidade, para eliminar dados maliciosos.
Recentemente, a tabela foi atualizada, exibindo as pontuações VIBE de vários grandes modelos de linguagem, bem como suas taxas de vitória, taxas de descontentamento, velocidade, latência, janela de contexto e indicadores de custo.
Evolução e Perspectivas Futuras
Yupp será oficialmente lançado em 13 de junho de 2025, após seis meses de testes internos. Desde o lançamento, o produto tem passado por iterações contínuas:
Suporte multimodal: integração de vários modelos de geração de imagens e suporte para que os usuários façam perguntas com imagens/PDFs carregados;
Expansão dos métodos de interação: novas funcionalidades de entrada por voz e leitura em voz alta;
Atualização do modelo: Introdução gradual de várias novas versões de grandes modelos de linguagem e da categoria "Modelo MAX";
Informação em tempo real: Roteia pedidos de consulta online para alguns motores de busca de IA, com citações em hiperlink;
Atualização de pagamento: novas opções de pagamento e suporte a várias moedas;
Compartilhar exportação: suporte à cópia com formatação preservada, exportação em PDF/texto/Markdown, compartilhar uma única resposta ou toda a conversa conforme necessário;
Atividades da comunidade: realização do "Desafio de Dicas de IA" e outras atividades, com prêmios que podem chegar a várias dezenas de milhares de pontos; nova página de perfil pessoal, nomes de chat gerados automaticamente por IA e outras funcionalidades.
A missão da Yupp é "capacitar a humanidade a moldar o futuro da IA". O CEO acredita que o desenvolvimento da IA necessita da participação e contribuição de todos. Através de respostas de IA de múltiplas perspectivas e feedback dos usuários, a Yupp não só ajuda os usuários a tomarem melhores decisões, como também fornece um impulso contínuo para a evolução da IA.
Vale a pena mencionar que um dos principais concorrentes da Yupp é a plataforma de avaliação de modelos de IA LMArena, que é muito popular entre os profissionais da IA, mas atualmente está em fase de exploração comercial e não utiliza tecnologia Blockchain para oferecer recompensas materiais ou mecanismos de incentivo com pontos para a participação dos usuários.
De modo geral, o Yupp, com seu modelo de crowdsourcing, mecanismos de incentivo e sistema de avaliação impulsionado por preferências reais dos usuários, abriu novos caminhos para a avaliação de IA. Ele não apenas oferece aos usuários uma experiência interativa de IA gratuita e diversificada, mas também transforma o feedback dos usuários em dados de treinamento de alto valor, promovendo a otimização contínua dos modelos. Com uma equipe experiente e o apoio de capital de alto nível, o Yupp tem potencial para desempenhar um papel chave no futuro ecossistema de IA, realizando a visão de "todos desfrutam da IA, todos moldam a IA".
No entanto, para a Yupp, que acabou de ser lançada, como garantir a qualidade dos dados de forma contínua, resistir a potenciais comportamentos fraudulentos e equilibrar a comercialização com a motivação dos usuários sob a participação em larga escala, ainda será uma direção que precisa ser constantemente explorada e otimizada no seu desenvolvimento futuro.
![a16z lidera ronda de sementes de 33 milhões de dólares, como a Yupp está a reconfigurar o modelo de avaliação de IA baseado em Blockchain e incentivos?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01