Yupp: Nueva paradigma de evaluación de IA impulsado por la Cadena de bloques que redefine la forma de descubrir y comparar modelos

Nueva paradigma de evaluación impulsada por la cadena de bloques: cómo Yupp está remodelando la forma de descubrir y comparar modelos

Con la amplia aplicación de la inteligencia artificial en diversas industrias, evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente por resolver. Los métodos de evaluación tradicionales a menudo dependen de mecanismos centralizados, lo que dificulta cubrir escenarios diversificados y no puede reflejar verdaderamente las preferencias del usuario. Al mismo tiempo, el problema de "ilusión" del modelo ocurre con frecuencia, y los usuarios a menudo se encuentran atrapados en cámaras de eco al elegir.

En este contexto, la nueva plataforma Yupp, gracias a su modelo de crowdsourcing único y su mecanismo de incentivos, está intentando remodelar la forma en que se descubren, comparan y utilizan los modelos de IA, trayendo consigo una revolución paradigmática al campo de la evaluación de IA. Este artículo explorará en profundidad los mecanismos centrales de Yupp, sus aspectos técnicos destacados, el trasfondo del equipo y su impacto potencial en el ecosistema de IA.

a16z lidera una ronda de financiación inicial de 33 millones de dólares, ¿cómo está Yupp reestructurando el modelo de evaluación de IA basado en la Cadena de bloques y los incentivos?

Antecedentes del equipo y financiamiento: Experiencia de gigantes tecnológicos

Yupp se dedica a construir un mercado de retroalimentación de IA "sin confianza", donde la retroalimentación diversificada de los usuarios puede circular libremente bajo la protección de la cadena de bloques y los incentivos de la economía criptográfica, formando una capa de evaluación de modelos escalable, justa y transparente. A través de la distribución incentivada de datos etiquetados de alta calidad, Yupp puede captar de manera oportuna las necesidades y preferencias de los usuarios reales en diferentes escenarios, ayudando a los desarrolladores de IA a optimizar el rendimiento del modelo de manera iterativa.

El proyecto fue fundado en junio de 2024 por el cofundador y CEO Pankaj Gupta y el cofundador y responsable de IA Gilad Mishne, con la participación del científico principal Jimmy Lin (profesor de la Universidad de Waterloo) en el equipo central. Los tres trabajaron juntos en una plataforma de redes sociales en 2010, donde desarrollaron y optimizaron sistemas de recomendación y búsqueda a gran escala, y luego acumularon una amplia experiencia en gigantes de motores de búsqueda y en un conocido intercambio de criptomonedas.

La visión descentralizada de Yupp y la transparencia del valor de los datos abordan la doble demanda de evaluación confiable por parte de los fabricantes de IA y la participación del usuario, además de que el rico currículum del equipo central ha ganado el alto reconocimiento de personalidades prominentes de la industria tecnológica y de los principales capitalistas de riesgo.

Recientemente, Yupp completó una ronda de financiamiento de semillas de 33 millones de dólares, liderada por un conocido socio de capital de riesgo, y otros inversores incluyen al director científico de un gigante de motores de búsqueda, cofundadores de plataformas de redes sociales, cofundadores de un sitio web de intercambio de imágenes, CEO de un motor de búsqueda de IA, varios profesores de la Universidad de Stanford y otros 45 ángeles conocidos y ejecutivos de empresas, así como el departamento de capital de riesgo de un intercambio de criptomonedas.

Funciones centrales y experiencia del usuario: construir "parlamento de IA"

Como una plataforma de evaluación de IA, Yupp se adhiere al concepto de "IA compartida por todos", permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de la respuesta única tradicional, Yupp devuelve simultáneamente las respuestas de dos (o más) modelos para cada consulta, formando un "congreso de IA". Este diseño no solo satisface la necesidad de los usuarios de tener opciones diversificadas, sino que también ayuda a identificar eficazmente las "ilusiones" que pueden surgir en los modelos, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación. Como dice el CEO de Yupp, la salida en paralelo es especialmente beneficiosa para los usuarios que se preocupan por los errores de generación, ya que les permite validar los resultados de manera cruzada.

La plataforma ahora admite más de 500 modelos de IA, abarcando los campos de generación de texto e imagen, incluidos varios modelos de lenguaje de gran renombre y numerosos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede condensar respuestas largas en un breve resumen conciso.

Además, Yupp valora altamente la privacidad del usuario: todos los registros de chat son privados por defecto, a menos que el usuario decida hacerlos públicos; incluso si se comparten públicamente, no se divulga ninguna información personal. Los usuarios pueden controlar en cualquier momento el contenido y el alcance de la compartición.

a16z lidera una ronda de semillas de 33 millones de dólares, ¿cómo está Yupp reestructurando el modelo de evaluación de IA basado en la Cadena de bloques y los incentivos?

Modelo económico y mecanismos de incentivos: valorización del trabajo de datos

Yupp utilizará de forma gratuita la combinación de comentarios de los usuarios y medirá el uso del modelo a través del sistema de "puntos Yupp". Los nuevos usuarios recibirán 5000 puntos al registrarse, y luego podrán ganar más puntos calificando las respuestas del modelo, eligiendo preferencias y explicando sus razones. Cuanto mayor sea la calidad de los comentarios, mayores serán las recompensas, asegurando que los usuarios puedan utilizar de forma sostenible y gratuita una variedad de servicios de IA, incluidos los modelos de alta gama. La plataforma se compromete a que los puntos solo aumenten y nunca disminuyan, y que todos los modelos actuales se pueden experimentar de forma gratuita.

Después de cada pregunta, los usuarios recibirán dos respuestas del modelo y ganarán “Tarjeta de rascar digital” a través de sus comentarios, que recompensa entre 0 y 250 puntos Yupp. Cada 1000 puntos se pueden canjear por 1 dólar, y los usuarios pueden retirar un máximo de 10 dólares al día y 50 dólares al mes. Los puntos se pueden canjear por más de 20 monedas, incluyendo dólares y euros, y los socios incluyen varios proveedores de servicios de pago. Al mismo tiempo, la plataforma integra monedas estables de ciertas redes de Cadena de bloques, proporcionando recompensas instantáneas y sin comisiones a usuarios de todo el mundo.

Como dijo el CEO, la retroalimentación de alta calidad generada por los usuarios tiene un valor mucho mayor para el ajuste fino y el aprendizaje reforzado de los modelos de la empresa de IA que la recompensa en sí. Aunque los ingresos mensuales de los usuarios pueden equivaler a solo unas pocas tazas de café, estos datos de anotación pagados son cruciales para la iteración de la IA.

Para incentivar a más personas a participar, Yupp también ha establecido recompensas por recomendación: el recomendador recibe 5000 puntos, y el recomendado recibe 1000 puntos; actualmente, los nuevos usuarios registrados pueden recibir 5000 puntos, y el recomendado recibe 2500 puntos adicionales.

Yupp VIBE puntuación: Un nuevo paradigma de evaluación de IA

Para abordar los problemas de falta de transparencia en las clasificaciones existentes, falta de equidad y obtención desigual de datos de evaluación, Yupp ha lanzado la versión beta de la clasificación AI y el sistema de puntuación "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema reúne los datos de preferencias generados por usuarios de todo el mundo en interacciones naturales, con el objetivo de proporcionar resultados de evaluación robustos y confiables.

Los principios de evaluación de Yupp incluyen:

  • Estabilidad: garantizar representatividad (cubrir una variedad de escenarios), autenticidad (reflejar las preocupaciones del usuario), resistencia al fraude (defenderse de comportamientos maliciosos);

  • Confiabilidad: imparcialidad (sin sesgo hacia el modelo), transparencia (divulgación detallada del algoritmo de clasificación), rigor científico (cumplimiento de normas de evaluación).

La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar los pros y los contras de las respuestas (como "al grano", "rápido", "buen estilo", etc.), y realiza un análisis de segmentación basado en la edad, educación, ocupación y otra información de los usuarios, mostrando las diferencias en las preferencias de los diferentes grupos.

En el ámbito técnico, Yupp está explorando el uso de la Cadena de bloques, primitivos criptográficos y pruebas de cero conocimiento, para garantizar un proceso de evaluación justo, transparente y verificable. Al mismo tiempo, la plataforma ha colaborado con proveedores de datos de IA profesionales para calibrar a los evaluadores mediante la verificación de archivos y múltiples controles de calidad, eliminando datos maliciosos.

Recientemente se ha actualizado la lista, que muestra las puntuaciones VIBE de varios grandes modelos de lenguaje, así como su tasa de victorias, tasa de desagrado, velocidad, latencia, ventana de contexto y métricas de costo.

¿Cómo Yupp, con la inversión de 33 millones de dólares en la ronda semilla liderada por a16z, reconfigura el modelo de evaluación de IA basado en Cadena de bloques y incentivos?

Historia del desarrollo y perspectivas futuras

Yupp se lanzará oficialmente el 13 de junio de 2025, habiendo realizado seis meses de pruebas internas. Desde su lanzamiento, el producto ha estado en continua iteración:

  • Soporte multimodal: integración de múltiples modelos de generación de imágenes y soporte para que los usuarios suban imágenes/PDF para preguntar;

  • Ampliación de métodos de interacción: se han añadido funciones de entrada de voz y lectura de voz;

  • Actualización del modelo: se están introduciendo sucesivamente varias nuevas versiones de modelos de lenguaje grande y la categoría "modelo MAX";

  • Información en tiempo real: enrutar las solicitudes de búsqueda en línea a ciertos motores de búsqueda de IA, y adjuntar citas de hiperlink;

  • Actualización de pagos: se han añadido múltiples métodos de pago y soporte para monedas.

  • Compartir exportación: soporte para copia con formato, exportación a PDF/texto/Markdown, compartir una sola respuesta o toda la conversación según sea necesario;

  • Actividades comunitarias: Se llevará a cabo el "Desafío de Sugerencias de IA" y otras actividades, con premios de hasta decenas de miles de puntos; se han añadido funciones como la página de perfil personal y nombres de chat generados automáticamente por IA.

La misión de Yupp es "empoderar a la humanidad para dar forma al futuro de la IA". El CEO cree que el desarrollo de la IA necesita la participación y contribución de todos. A través de respuestas de IA desde múltiples perspectivas y comentarios de los usuarios, Yupp no solo ayuda a los usuarios a tomar mejores decisiones, sino que también proporciona un impulso continuo para la evolución de la IA.

Cabe mencionar que uno de los principales competidores de Yupp es la plataforma de evaluación de modelos de AI LMArena, que es muy popular entre los profesionales de la IA, pero actualmente se encuentra en una fase de exploración comercial y no ha utilizado la tecnología de Cadena de bloques para ofrecer recompensas materiales o mecanismos de incentivos por puntos a la participación de los usuarios.

En general, Yupp ha abierto un nuevo camino en la evaluación de IA con un sistema de evaluación impulsado por un modelo de crowdsourcing, mecanismos de incentivos y preferencias reales de los usuarios. No solo ofrece a los usuarios una experiencia de interacción con IA gratuita y diversa, sino que también transforma la retroalimentación de los usuarios en datos de entrenamiento de alto valor, impulsando la optimización continua del modelo. Con un equipo experimentado y el respaldo de capital de primer nivel, Yupp tiene el potencial de desempeñar un papel clave en el futuro ecosistema de IA, logrando la visión de "todos disfrutan de la IA, todos moldean la IA".

Sin embargo, para Yupp, que acaba de lanzarse, cómo garantizar continuamente la calidad de los datos en la participación de usuarios a gran escala, resistir comportamientos potenciales de trampa, y encontrar un equilibrio entre la comercialización y la incentivación de los usuarios, seguirá siendo una dirección que necesitará ser explorada y optimizada constantemente en su desarrollo futuro.

![a16z lidera una ronda de semillas de 33 millones de dólares, ¿cómo está Yupp reinventando el modelo de evaluación de IA basado en la Cadena de bloques y los incentivos?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01

MAX-0.04%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Republicar
  • Compartir
Comentar
0/400
ZKSherlockvip
· hace10h
en realidad... su mecanismo "sin confianza" todavía depende del consenso probabilístico - no es verdadero conocimiento cero en absoluto smh
Ver originalesResponder0
ProbablyNothingvip
· 08-11 04:16
Otro proyecto que juega con el concepto de la IA, solo es tomar a la gente por tonta.
Ver originalesResponder0
SelfCustodyIssuesvip
· 08-10 05:35
Otra vez es un proyecto de Lavado de ojos...
Ver originalesResponder0
NftPhilanthropistvip
· 08-10 05:34
en realidad, si tokenizamos la evaluación del modelo de IA... esto podría ser la próxima revolución de prueba de impacto, para ser sincero.
Ver originalesResponder0
FloorSweepervip
· 08-10 05:33
No se puede evaluar la ilusión, ¿qué más se puede decir?
Ver originalesResponder0
BottomMisservip
· 08-10 05:31
Otro producto de trampa de ai
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)