Yupp: Блокчейн-управляемая новая парадигма оценки ИИ, переосмысляющая способы обнаружения и сравнения моделей

Блокчейн-управляемая новая парадигма оценки AI: как Yupp меняет способы открытия и сравнения моделей

С развитием искусственного интеллекта в различных отраслях становится актуальной проблема точной оценки производительности моделей и повышения доверия пользователей. Традиционные методы оценки часто зависят от централизованных механизмов, что затрудняет покрытие разнообразных сценариев и не позволяет истинно отражать предпочтения пользователей. В то же время, проблема "иллюзии" моделей возникает часто, и пользователи при выборе часто попадают в информационные капсулы.

В этом контексте новая платформа Yupp, благодаря уникальной модели краудсорсинга и механизмам мотивации, пытается изменить способы обнаружения, сравнения и использования AI-моделей, что принесет парадигмальную революцию в область оценки AI. В этой статье мы подробно рассмотрим основные механизмы Yupp, технологические достижения, фон команды и потенциальное влияние на экосистему AI.

a16z инвестировал 33 миллиона долларов в начальный этап, как Yupp на основе Блокчейн и стимулов переосмысляет модель оценки ИИ?

Фон команды и финансирование: поддержка опыта технологических гигантов

Yupp нацелен на создание "доверенного" рынка AI-обратной связи, позволяя многообразным отзывам пользователей свободно циркулировать под защитой Блокчейна и стимулов криптоэкономики, формируя масштабируемый, справедливый и прозрачный уровень оценки моделей. Благодаря стимулированному распределению высококачественных вручную размеченных данных, Yupp может своевременно фиксировать реальные потребности и предпочтения пользователей в различных сценариях, помогая разработчикам AI оптимизировать производительность моделей итеративным образом.

Проект был основан в июне 2024 года соучредителем и генеральным директором Панкалом Гуптой и соучредителем и руководителем AI Гиладом Мишне, также в основной команде участвовал главный научный сотрудник Джимми Лин (профессор Университета Ватерлоо). Все трое работали вместе на платформе социальных медиа еще в 2010 году, создавая и оптимизируя масштабируемые системы рекомендаций и поиска, а затем накопили богатый опыт в крупных поисковых системах и известных криптовалютных биржах.

Видение Yupp о децентрализации и прозрачности ценности данных отвечает двойным требованиям производителей ИИ к надежной оценке и участию пользователей, а также богатый опыт основной команды получил высокую оценку известных личностей в технологической отрасли и ведущих венчурных капиталистов.

В последнее время Yupp завершила раунд посевного финансирования на сумму 33 миллиона долларов, в котором принял участие известный венчурный партнер, а также другие инвесторы, включая главного ученого поискового гиганта, соучредителя социальной медиа платформы, соучредителя сайта обмена изображениями, CEO AI поисковой системы, нескольких профессоров Стэнфордского университета и 45 известных ангелов и корпоративных руководителей, а также венчурный отдел одной криптовалютной биржи.

Основные функции и пользовательский опыт: создание "AI-парламента"

В качестве платформы для оценки ИИ, Yupp придерживается идеи "Искусственный интеллект для всех", позволяя пользователям легко находить, сравнивать и использовать новейшие модели ИИ. В отличие от традиционных однократных ответов, Yupp возвращает ответы от двух (или более) моделей одновременно на каждый запрос, формируя "Совет ИИ". Этот подход не только удовлетворяет потребность пользователей в разнообразных выборах, но и эффективно выявляет возможные "галлюцинации" моделей, помогая пользователям принимать более обоснованные решения на основе сравнения. Как сказал генеральный директор Yupp, параллельный вывод особенно полезен для пользователей, беспокоящихся о генерации ошибок, так как это позволяет им перекрестно проверять результаты.

Платформа теперь поддерживает более 500 моделей ИИ, охватывающих области генерации текста и изображений, включая несколько известных больших языковых моделей и множество новых моделей. Для дальнейшего оптимизации опыта Yupp также запустил функцию "QuickTake", которая может сокращать длинные ответы до краткого текста.

Кроме того, Yupp придает большое значение конфиденциальности пользователей: все чат-истории по умолчанию являются приватными, если пользователь не решит их открыть; даже при открытом обмене не раскрывается никакая личная информация. Пользователи могут в любое время контролировать содержимое и объем обмена.

a16z инвестировал 33 миллиона долларов в раунд seed, как Yupp на основе Блокчейн и стимулов переосмысляет модель оценки AI?

Экономическая модель и механизмы стимулов: Монетизация трудозатрат данных

Yupp будет бесплатно использовать сочетание отзывов пользователей и системы "Yupp баллов" для оценки использования модели. Новые пользователи при регистрации получают 5000 баллов, после чего могут зарабатывать больше баллов, оценивая ответы модели, выбирая предпочтения и объясняя свои причины. Чем выше качество отзывов, тем больше вознаграждение, что обеспечивает пользователям возможность постоянно бесплатно использовать различные AI-сервисы, включая премиум-модели. Платформа обещает, что баллы только увеличиваются и что все текущие модели можно бесплатно протестировать.

После каждого вопроса пользователи получают два ответа от модели и могут заработать "цифровую лотерейную карту" через обратную связь, получая от 0 до 250 Yupp баллов. Каждые 1000 баллов можно обменять на 1 доллар, пользователи могут ежедневно выводить максимум 10 долларов, а ежемесячно - 50 долларов. Баллы поддерживают обмен на более чем 20 валют, включая доллары и евро, партнеры включают несколько поставщиков платежных услуг. В то же время платформа интегрировала стабильные монеты некоторых Блокчейн сетей, предлагая глобальным пользователям мгновенные вознаграждения без комиссии.

Как сказал генеральный директор, высококачественная обратная связь от пользователей для настройки моделей и обучения с подкреплением в AI-компаниях намного важнее, чем сами награды. Хотя ежемесячный доход пользователей может быть всего лишь эквивалентом нескольких чашек кофе, эти платные аннотированные данные имеют жизненно важное значение для итерации AI.

Для стимулирования большего числа людей к участию Yupp также установил программу вознаграждений за рекомендации: рекомендатель получает 5000 баллов, рекомендованный получает 1000 баллов; в настоящее время новые зарегистрированные пользователи могут получить 5000 баллов, а рекомендованный дополнительно получает 2500 баллов.

Yupp VIBE рейтинг: новая парадигма оценки AI

В ответ на недостаточную прозрачность существующих рейтингов, нехватку справедливости и неравномерный доступ к оценочным данным, Yupp представила тестовую версию AI Рейтинга и систему оценки "Yupp VIBE (Vibe Intelligence Benchmark) Score". Эта система объединяет предпочтительные данные, полученные от пользователей по всему миру в процессе естественного взаимодействия, с целью предоставления надежных и достоверных оценочных результатов.

Принципы оценки Yupp включают:

  • Надежность: обеспечение репрезентативности (покрытие разнообразных сценариев), достоверности (отражение интересов пользователей), устойчивости к мошенничеству (защита от злонамеренных действий);

  • Достоверность: справедливость и нейтральность (без предвзятости к модели), прозрачность и открытость (подробное раскрытие алгоритма ранжирования), строгость и научность (соблюдение стандартов оценки).

Платформа не только собирает двоичные предпочтения, но и поощряет пользователей указывать достоинства и недостатки ответов (например, "в точку", "быстро", "хороший стиль" и т. д.), а также проводит кластерный анализ на основе информации о возрасте, образовании, профессии и т. д., чтобы показать различия в предпочтениях различных групп.

С технической точки зрения, Yupp исследует использование Блокчейн, криптографических примитивов и доказательств с нулевым знанием для обеспечения справедливости, прозрачности и проверяемости процесса оценки. В то же время платформа уже сотрудничает с профессиональными поставщиками данных AI, проводя верификацию архивов и многослойную проверку качества для калибровки оценщиков, удаляя злонамеренные данные.

Недавний рейтинг обновлён, демонстрируя VIBE-оценки нескольких крупных языковых моделей, а также их коэффициенты побед, уровень неприязни, скорость, задержку, окно контекста и показатели стоимости.

a16z инвестировал 33 миллиона долларов в начальный раунд, как Yupp перерабатывает модель оценки ИИ на основе Блокчейн и стимулов?

История развития и перспективы на будущее

Yupp официально запустится 13 июня 2025 года, предварительно проведя шестимесячное внутреннее тестирование. С момента запуска продукт постоянно обновляется:

  • Мультимодальная поддержка: подключение нескольких моделей генерации изображений и поддержка загрузки пользователями изображений/PDF для вопросов;

  • Расширение способов взаимодействия: добавлены функции голосового ввода и голосового чтения;

  • Обновление модели: постепенно вводятся несколько новых версий больших языковых моделей и категория "MAX модель";

  • Актуальная информация: маршрутизация запросов на онлайн-запросы к некоторым AI поисковым системам с добавлением гиперссылок.

  • Обновление платежей: добавлены различные способы оплаты и поддержка валют;

  • Экспорт и обмен: поддержка копирования с сохранением формата, экспорт в PDF/текст/Markdown, возможность делиться отдельными ответами или целыми диалогами по мере необходимости;

  • Сообщество: проведение мероприятий, таких как "Челлендж AI подсказок", с призами до десятков тысяч очков; добавлены функции личной страницы профиля, автоматически сгенерированные имена для чата AI и другие.

Миссия Yupp заключается в том, чтобы "наделить людей возможностями формировать будущее ИИ". Генеральный директор считает, что развитие ИИ требует участия и вклада каждого человека. Благодаря многоаспектным ответам ИИ и отзывам пользователей, Yupp не только помогает пользователям принимать лучшие решения, но и обеспечивает постоянный импульс для эволюции ИИ.

Стоит отметить, что одним из основных конкурентов Yupp является платформа оценки открытых AI-моделей LMArena, которая очень популярна среди специалистов в области ИИ, но в настоящее время находится на этапе коммерческой разработки и не использует Блокчейн-технологии для предоставления пользователям прямых материальных вознаграждений или системы поощрительных баллов.

В целом, Yupp открывает новый путь оценки ИИ с помощью модели краудсорсинга, системы стимулов и основанной на реальных предпочтениях пользователей. Он не только предоставляет пользователям бесплатный и разнообразный опыт взаимодействия с ИИ, но и преобразует отзывы пользователей в высокоценные тренировочные данные, способствуя постоянной оптимизации модели. Благодаря опытной команде и поддержке ведущих капиталовложений, Yupp имеет все шансы сыграть ключевую роль в будущем экосистемы ИИ, реализуя видение "Каждый наслаждается ИИ, каждый формирует ИИ".

Тем не менее, для только что запущенного Yupp, как обеспечить качество данных при массовом участии пользователей, противостоять потенциальным мошенническим действиям, а также добиться баланса между коммерциализацией и мотивацией пользователей, остается направлением, которое необходимо постоянно исследовать и оптимизировать в будущем.

a16z инвестирует 33 миллиона долларов в начальный раунд, как Yupp пересматривает модель оценки ИИ на основе Блокчейна и стимулов?

MAX-0.46%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
ProbablyNothingvip
· 08-11 04:16
Еще один проект, который играет на концепции AI, всего лишь разыгрывайте людей как лохов на белом листе.
Посмотреть ОригиналОтветить0
SelfCustodyIssuesvip
· 08-10 05:35
Опять это промывание глаз проект...
Посмотреть ОригиналОтветить0
NftPhilanthropistvip
· 08-10 05:34
на самом деле, если мы токенизируем оценку моделей ИИ... это может стать следующей революцией доказательства воздействия, честно говоря
Посмотреть ОригиналОтветить0
FloorSweepervip
· 08-10 05:33
Какие иллюзии можно оценить, о чем еще говорить?
Посмотреть ОригиналОтветить0
BottomMisservip
· 08-10 05:31
Еще один ai ловушка продукт
Посмотреть ОригиналОтветить0
  • Закрепить