Yupp : Nouveau paradigme d'évaluation IA propulsé par la Blockchain, redéfinissant les méthodes de découverte et de comparaison de modèles

Nouveau paradigme d'évaluation IA piloté par la Blockchain : comment Yupp redéfinit la découverte et la comparaison des modèles

Avec l'application généralisée de l'intelligence artificielle dans divers secteurs, évaluer précisément les performances des modèles et renforcer la confiance des utilisateurs est un problème urgent à résoudre. Les méthodes d'évaluation traditionnelles reposent souvent sur des mécanismes centralisés, difficiles à adapter à des scénarios diversifiés et incapables de refléter fidèlement les préférences des utilisateurs. Parallèlement, le problème des "hallucinations" des modèles se produit fréquemment, poussant les utilisateurs à tomber dans des chambres d'écho d'informations lors de leurs choix.

Dans ce contexte, la nouvelle plateforme Yupp, grâce à son modèle de crowdsourcing unique et à son mécanisme d'incitation, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA, apportant ainsi un changement de paradigme dans le domaine de l'évaluation de l'IA. Cet article explorera en profondeur les mécanismes clés de Yupp, ses points techniques forts, les antécédents de l'équipe et son impact potentiel sur l'écosystème de l'IA.

a16z a mené un tour de table de 33 millions de dollars, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur la Blockchain et les incitations ?

Contexte de l'équipe et financement : expérience des géants de la technologie

Yupp s'engage à construire un marché de feedback AI "sans confiance", permettant aux retours d'utilisateurs diversifiés de circuler librement sous la protection de la Blockchain et des incitations économiques en cryptomonnaie, formant une couche d'évaluation de modèle évolutive, équitable et transparente. Grâce à la distribution d'incitations pour des données annotées manuellement de haute qualité, Yupp peut capturer rapidement les besoins et préférences réels des utilisateurs dans différents scénarios, aidant ainsi les développeurs d'IA à optimiser les performances des modèles de manière itérative.

Le projet a été fondé en juin 2024 par le cofondateur et PDG Pankaj Gupta et le cofondateur et responsable de l'IA Gilad Mishne, avec la participation du scientifique en chef Jimmy Lin (professeur à l'Université de Waterloo) dans l'équipe centrale. Les trois hommes ont travaillé ensemble sur une plateforme de médias sociaux dès 2010, où ils ont créé et optimisé des systèmes de recommandation et de recherche à grande échelle, accumulant ensuite une riche expérience dans des géants des moteurs de recherche et des plateformes d'échange de cryptomonnaies renommées.

La vision décentralisée de Yupp et la transparence de la valeur des données répondent à la double exigence des fabricants d'IA en matière d'évaluation fiable et de participation des utilisateurs. De plus, l'expérience riche de l'équipe dirigeante a obtenu une reconnaissance élevée de la part des personnalités renommées de l'industrie technologique et des principaux investisseurs en capital-risque.

Récemment, Yupp a complété un financement de série de graines de 33 millions de dollars, dirigé par un partenaire de capital-risque bien connu, avec d'autres investisseurs comprenant le chef scientifique d'un géant des moteurs de recherche, le co-fondateur d'une plateforme de médias sociaux, le co-fondateur d'un site de partage d'images, le PDG d'un moteur de recherche AI, plusieurs professeurs de l'Université de Stanford, ainsi que 45 anges et cadres d'entreprises bien connus, ainsi qu'un département de capital-risque d'une bourse de cryptomonnaies.

Fonctionnalités clés et expérience utilisateur : construire "l'Assemblée AI"

En tant que plateforme d'évaluation de l'IA, Yupp adhère au principe de "l'IA partagée par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement à une réponse unique traditionnelle, Yupp retourne simultanément les réponses de deux (voire plus) modèles pour chaque invite, formant ainsi un "congrès de l'IA". Cette conception répond non seulement aux besoins des utilisateurs en matière de choix diversifiés, mais permet également d'identifier efficacement les "hallucinations" potentielles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison. Comme le dit le PDG de Yupp, la sortie côte à côte est particulièrement bénéfique pour les utilisateurs soucieux des erreurs de génération, car elle leur permet de valider croisée les résultats.

La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs grands modèles de langage connus et de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité "QuickTake", qui permet de résumer des réponses longues en un court texte concis.

De plus, Yupp accorde une grande importance à la vie privée des utilisateurs : tous les enregistrements de chat sont par défaut privés, sauf si l'utilisateur choisit de les rendre publics ; même en cas de partage public, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et l'étendue du partage.

a16z a investi 33 millions de dollars lors du tour de financement de départ, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur Blockchain et les incitations ?

Modèle économique et mécanismes d'incitation : Valorisation du travail des données

Yupp utilisera gratuitement les retours des utilisateurs, mesurant l'utilisation du modèle via le système "points Yupp". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, et peuvent gagner davantage de points en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont abondantes, garantissant aux utilisateurs un accès gratuit et durable à une variété de services d'IA, y compris des modèles haut de gamme. La plateforme s'engage à ce que les points n'augmentent que, et que tous les modèles actuels puissent être expérimentés gratuitement.

Après chaque question, les utilisateurs recevront deux réponses de modèle et gagneront des "cartes à gratter numériques" grâce à leurs retours, récompensant de 0 à 250 points Yupp. Chaque 1000 points peuvent être échangés contre 1 dollar, les utilisateurs pouvant retirer jusqu'à 10 dollars par jour et un maximum de 50 dollars par mois. Les points peuvent être échangés contre des dollars, des euros et plus de 20 autres devises, en collaboration avec plusieurs fournisseurs de services de paiement. De plus, la plateforme intègre des stablecoins de certains réseaux Blockchain, offrant des récompenses instantanées et sans frais aux utilisateurs du monde entier.

Comme l'a dit le PDG, les retours de haute qualité générés par les utilisateurs ont une valeur bien supérieure à la récompense elle-même pour l'ajustement et l'apprentissage renforcé des modèles des entreprises d'IA. Bien que les revenus mensuels des utilisateurs ne représentent que quelques tasses de café, ces données annotées payantes sont cruciales pour l'itération de l'IA.

Pour inciter davantage de personnes à participer, Yupp a également mis en place des récompenses de parrainage : le parrain reçoit 5000 points, et le filleul reçoit 1000 points ; actuellement, les nouveaux utilisateurs inscrits peuvent obtenir 5000 points, et le filleul reçoit 2500 points supplémentaires.

Yupp VIBE Score : Une nouvelle paradigm d'évaluation par l'IA

Pour répondre aux problèmes de manque de transparence, d'équité et d'accès inégal aux données d'évaluation des classements actuels, Yupp a lancé une version bêta de son classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation robustes et fiables.

Les principes d'évaluation de Yupp incluent :

  • Stabilité : garantir la représentativité (couvrir une diversité de scénarios), l'authenticité (réfléter les préoccupations des utilisateurs), la résistance à la fraude (protéger contre les comportements malveillants) ;

  • Fiabilité : impartialité (sans parti pris pour le modèle), transparence (divulgation détaillée de l'algorithme de classement), rigueur scientifique (respect des normes d'évaluation).

La plateforme non seulement collecte les préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses (comme "pertinent", "rapide", "bon style", etc.), et effectue une analyse de segmentation basée sur des informations telles que l'âge, l'éducation et la profession des utilisateurs, afin de montrer les différences de préférences entre les différents groupes.

Sur le plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour éliminer les données malveillantes en vérifiant les dossiers et en calibrant les évaluateurs par des contrôles de qualité en plusieurs couches.

Le classement a été mis à jour récemment, affichant les scores VIBE de plusieurs grands modèles de langue ainsi que leurs taux de victoire, de non-aimé, de vitesse, de latence, de fenêtre contextuelle et d'indicateurs de coût.

a16z a investi 33 millions de dollars dans le tour de table, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur le Blockchain et les incitations ?

Histoire et perspectives d'avenir

Yupp sera officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été continuellement itéré :

  • Support multimodal : connexion à plusieurs modèles de génération d'images et prise en charge de l'upload d'images/PDF pour poser des questions ;

  • Méthodes d'interaction étendues : ajout de la saisie vocale et de la fonction de lecture vocale ;

  • Mise à jour du modèle : introduction progressive de plusieurs nouvelles versions de grands modèles de langage et de la catégorie "MAX modèle" ;

  • Informations en temps réel : acheminer les demandes de recherche en ligne vers certains moteurs de recherche AI, avec des citations de liens hypertexte ;

  • Mise à niveau des paiements : Ajout de plusieurs méthodes de paiement et soutien aux devises.

  • Partage et exportation : support de la copie avec conservation du format, exportation en PDF/texte/Markdown, partage à la demande d'une seule réponse ou d'une conversation entière ;

  • Activités communautaires : Organisation du "Défi d'indices AI" et d'autres activités, avec des prix allant jusqu'à plusieurs dizaines de milliers de points ; ajout de la page de profil personnel, de noms de chat générés automatiquement par l'IA et d'autres fonctionnalités.

La mission de Yupp est "d'habiliter l'humanité à façonner l'avenir de l'IA". Le PDG estime que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce aux réponses de l'IA à perspectives multiples et aux retours des utilisateurs, Yupp non seulement aide les utilisateurs à mieux décider, mais fournit également une source continue de motivation pour l'évolution de l'IA.

Il convient de mentionner que l'un des principaux concurrents de Yupp est la plateforme d'évaluation de modèles AI LMArena, qui est très populaire parmi les professionnels de l'IA, mais qui est actuellement en phase d'exploration commerciale et n'a pas encore utilisé la technologie Blockchain pour offrir des récompenses matérielles ou des mécanismes d'incitation par points aux utilisateurs.

Dans l'ensemble, Yupp ouvre de nouvelles voies d'évaluation de l'IA grâce à un système d'évaluation basé sur un modèle de crowdsourcing, des mécanismes d'incitation et des préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience interactive gratuite et diversifiée avec l'IA, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant une optimisation continue des modèles. Grâce à une équipe expérimentée et à un soutien de capitaux de premier plan, Yupp est promis à jouer un rôle clé dans l'écosystème de l'IA à venir, réalisant la vision "Chacun profite de l'IA, chacun façonne l'IA".

Cependant, pour Yupp qui vient de se lancer, comment assurer en continu la qualité des données, résister aux comportements frauduleux potentiels et trouver un équilibre entre la commercialisation et les incitations pour les utilisateurs, restera une direction à explorer et à optimiser dans son développement futur.

![a16z a mené un tour de seed de 33 millions de dollars, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur Blockchain et les incitations ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01

MAX0.57%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
ZKSherlockvip
· 08-13 03:22
en fait... leur mécanisme "sans confiance" repose toujours sur un consensus probabiliste - pas du tout de vrai zéro connaissance smh
Voir l'originalRépondre0
ProbablyNothingvip
· 08-11 04:16
Encore un projet qui joue sur le concept de l'IA, c'est juste prendre les gens pour des idiots.
Voir l'originalRépondre0
SelfCustodyIssuesvip
· 08-10 05:35
Encore un projet eyewash…
Voir l'originalRépondre0
NftPhilanthropistvip
· 08-10 05:34
en fait, si nous tokenisons l'évaluation des modèles d'IA... cela pourrait être la prochaine révolution de la preuve d'impact, à vrai dire.
Voir l'originalRépondre0
FloorSweepervip
· 08-10 05:33
Les hallucinations ne peuvent même pas être évaluées, que dire de plus ?
Voir l'originalRépondre0
BottomMisservip
· 08-10 05:31
Encore un produit piégé d'IA
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)