Генеральный директор Recall Labs, Эндрю Хилл, обсуждает проблему создания и доверия к ИИ-агентам, подчеркивая создание ончейн-арены для публичной верификации производительности.
Что вдохновило вас на создание Recall Network и почему вы решили структурировать его как ончейн арену для ИИ-агентов?
Интернет переходит от информации к действиям. Не просто поиск, а делегирование. Агенты уже пишут код, управляют портфелями, подводят итоги исследований. Проблема не в создании. Проблема в доверии. Любой может создать агента. Немногие могут доказать эффективность.
Recall был создан для решения этой проблемы — не как продукт, а как протокольная инфраструктура. Достоверно нейтральная сеть, где агенты демонстрируют свои способности публично и в цепочке. Конкурсы и оценки становятся доказательством. Репутация становится переносимой. А открытие больше не является игрой на удачу.
Мы не просто хотим больше агентов. Мы хотим систему, которая соединяет и мотивирует ИИ решать проблемы человечества.
Какую основную проблему в сегодняшнем ландшафте ИИ вы намерены решить — и как Recall уникально ее решает?
У нас слишком много агентов и слишком мало доверия. Узкое место - это не возможности. Это оценка. Какие агенты настоящие? Какие просто подсказка и целевая страница? Прямо сейчас ответы приходят из маркетинга и шумихи. Мы хотим, чтобы они приходили из доказательств.
Recall превращает бенчмаркинг в живую и развивающуюся сетевую функцию. Агенты зарабатывают репутацию, соревнуясь. Кураторы зарабатывают токены за выявление производительности. Потребители следят за рейтингами, а не за хайпом.
В мире, где большинство систем ИИ работают как черные ящики, насколько реалистичен переход к полной прозрачности и публичным показателям производительности?
Это уже происходит. Сдвиг вызван спросом. Пользователи хотят знать, что может сделать агент, прежде чем интегрировать его. Умные пользователи хотят участвовать в тестировании и определении своих границ. Строители хотят реальные эталоны, а не расплывчатые сравнения.
При отзыве каждое действие агента регистрируется. Каждое соревнование можно воспроизвести. Оценки составные и изменяющиеся. Мы ожидаем, что другие системы со временем примут этот стандарт, потому что он работает.
Как предотвратить азартные игры или манипуляции в системе, где агентам вознаграждается за производительность?
Вы не можете предотвратить попытки, но вы можете сделать их убыточными — используя токен для поддержки честных агентов и штрафуя их за нечестность. Игры и манипуляции проявляются через сочетание автоматизированных систем и людей, позволяя людям выявлять плохих. Мы уже видели это в действии на наших живых соревнованиях, где кураторы выявляют нечестные действия и исключают агентов из таблицы лидеров.
Какие виды задач или конкурсов сегодня наиболее значимы для оценки ИИ-агентов — и как они эволюционируют по мере повышения интеллекта моделей?
Задачи, которые требуют рассуждений, контекста или суждений о реальном мире, являются наиболее значимыми для чат-агентов. Мы сейчас сосредоточены на торговле, потому что есть много агентов для оценки, много нужно понять о способности ИИ управлять крипто-портфелями и много неопределенности у потребителей относительно того, может ли какой-либо агент успешно торговать. Для нас торговля криптовалютой на основе ИИ для масс — это не если, а когда. Мы надеемся сыграть важную роль в ускорении этого процесса через бенчмаркинг и конкурсы.
Как вы видите роль блокчейна в будущем ИИ — инфраструктурный уровень, уровень управления, уровень ответственности?
Блокчейн может функционировать как все три этих уровня. Соревнования проходят в сети, с управляющими рамками для правил участия и общим реестром для поведения агентов. Блокчейн дает нам публичную память, проверяемую историю и программируемый доверие.
Тем не менее, его самая важная роль — экономическая. Он позволяет нам вознаграждать человеческий слой, который поддерживает честность ИИ.
Считаете ли вы, что ончейн-агенты заменят традиционные модели SaaS — или будут их дополнять?
Сначала они будут дополнять. Затем превзойдут. Наконец, они заменят целые категории.
Какую роль, по вашему мнению, будут играть крипто-примитивы — такие как токены, стекинг или слайшинг — в управлении поведением ИИ в масштабах?
Токены позволяют создателям платить за видимость. Они позволяют кураторам зарабатывать на выявлении ценности. Они создают прочные записи убеждений. Стейкинг связывает веру с затратами. Штрафы превращают неудачу в обратную связь.
Как нам следует рассматривать интероперабельность между агентными системами — появятся ли стандарты или они останутся фрагментированными?
Фрагментация является стандартом. Интероперабельность возникает, когда подключение проще, чем восстановление. A2A все еще довольно непроверен как протокол для пересечения организационных границ. Но для использования агентов между организациями потребителям и бизнесу нужны такие системы, как Recall, чтобы создать надежные эталоны и безопасность для пользователей.
Как вы видите развитие отношений между фундаментальными моделями и агентными фреймворками в ближайшие несколько лет?
Фундаментальные модели будут продолжать улучшаться. Мы рассматриваем слой агентов как всё, что построено на основе сырьевых моделей; агенты — это программные модели, которые являются базой данных. Интерфейс, который мы используем, будет продолжать абстрагировать всё больше маршрутизации и вариаций под собой. Grok 4 Heavy уже является роем агентов. Слухи предполагают, что GPT-5 будет продвинутой системой маршрутизации с множеством моделей и агентов, используемых для решения правильных задач. Открытые системы будут следовать этому примеру.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
AI-агенты входят в испытательный полигон
Кратко
Генеральный директор Recall Labs, Эндрю Хилл, обсуждает проблему создания и доверия к ИИ-агентам, подчеркивая создание ончейн-арены для публичной верификации производительности.
Что вдохновило вас на создание Recall Network и почему вы решили структурировать его как ончейн арену для ИИ-агентов?
Интернет переходит от информации к действиям. Не просто поиск, а делегирование. Агенты уже пишут код, управляют портфелями, подводят итоги исследований. Проблема не в создании. Проблема в доверии. Любой может создать агента. Немногие могут доказать эффективность.
Recall был создан для решения этой проблемы — не как продукт, а как протокольная инфраструктура. Достоверно нейтральная сеть, где агенты демонстрируют свои способности публично и в цепочке. Конкурсы и оценки становятся доказательством. Репутация становится переносимой. А открытие больше не является игрой на удачу.
Мы не просто хотим больше агентов. Мы хотим систему, которая соединяет и мотивирует ИИ решать проблемы человечества.
Какую основную проблему в сегодняшнем ландшафте ИИ вы намерены решить — и как Recall уникально ее решает?
У нас слишком много агентов и слишком мало доверия. Узкое место - это не возможности. Это оценка. Какие агенты настоящие? Какие просто подсказка и целевая страница? Прямо сейчас ответы приходят из маркетинга и шумихи. Мы хотим, чтобы они приходили из доказательств.
Recall превращает бенчмаркинг в живую и развивающуюся сетевую функцию. Агенты зарабатывают репутацию, соревнуясь. Кураторы зарабатывают токены за выявление производительности. Потребители следят за рейтингами, а не за хайпом.
В мире, где большинство систем ИИ работают как черные ящики, насколько реалистичен переход к полной прозрачности и публичным показателям производительности?
Это уже происходит. Сдвиг вызван спросом. Пользователи хотят знать, что может сделать агент, прежде чем интегрировать его. Умные пользователи хотят участвовать в тестировании и определении своих границ. Строители хотят реальные эталоны, а не расплывчатые сравнения.
При отзыве каждое действие агента регистрируется. Каждое соревнование можно воспроизвести. Оценки составные и изменяющиеся. Мы ожидаем, что другие системы со временем примут этот стандарт, потому что он работает.
Как предотвратить азартные игры или манипуляции в системе, где агентам вознаграждается за производительность?
Вы не можете предотвратить попытки, но вы можете сделать их убыточными — используя токен для поддержки честных агентов и штрафуя их за нечестность. Игры и манипуляции проявляются через сочетание автоматизированных систем и людей, позволяя людям выявлять плохих. Мы уже видели это в действии на наших живых соревнованиях, где кураторы выявляют нечестные действия и исключают агентов из таблицы лидеров.
Какие виды задач или конкурсов сегодня наиболее значимы для оценки ИИ-агентов — и как они эволюционируют по мере повышения интеллекта моделей?
Задачи, которые требуют рассуждений, контекста или суждений о реальном мире, являются наиболее значимыми для чат-агентов. Мы сейчас сосредоточены на торговле, потому что есть много агентов для оценки, много нужно понять о способности ИИ управлять крипто-портфелями и много неопределенности у потребителей относительно того, может ли какой-либо агент успешно торговать. Для нас торговля криптовалютой на основе ИИ для масс — это не если, а когда. Мы надеемся сыграть важную роль в ускорении этого процесса через бенчмаркинг и конкурсы.
Как вы видите роль блокчейна в будущем ИИ — инфраструктурный уровень, уровень управления, уровень ответственности?
Блокчейн может функционировать как все три этих уровня. Соревнования проходят в сети, с управляющими рамками для правил участия и общим реестром для поведения агентов. Блокчейн дает нам публичную память, проверяемую историю и программируемый доверие.
Тем не менее, его самая важная роль — экономическая. Он позволяет нам вознаграждать человеческий слой, который поддерживает честность ИИ.
Считаете ли вы, что ончейн-агенты заменят традиционные модели SaaS — или будут их дополнять?
Сначала они будут дополнять. Затем превзойдут. Наконец, они заменят целые категории.
Какую роль, по вашему мнению, будут играть крипто-примитивы — такие как токены, стекинг или слайшинг — в управлении поведением ИИ в масштабах?
Токены позволяют создателям платить за видимость. Они позволяют кураторам зарабатывать на выявлении ценности. Они создают прочные записи убеждений. Стейкинг связывает веру с затратами. Штрафы превращают неудачу в обратную связь.
Как нам следует рассматривать интероперабельность между агентными системами — появятся ли стандарты или они останутся фрагментированными?
Фрагментация является стандартом. Интероперабельность возникает, когда подключение проще, чем восстановление. A2A все еще довольно непроверен как протокол для пересечения организационных границ. Но для использования агентов между организациями потребителям и бизнесу нужны такие системы, как Recall, чтобы создать надежные эталоны и безопасность для пользователей.
Как вы видите развитие отношений между фундаментальными моделями и агентными фреймворками в ближайшие несколько лет?
Фундаментальные модели будут продолжать улучшаться. Мы рассматриваем слой агентов как всё, что построено на основе сырьевых моделей; агенты — это программные модели, которые являются базой данных. Интерфейс, который мы используем, будет продолжать абстрагировать всё больше маршрутизации и вариаций под собой. Grok 4 Heavy уже является роем агентов. Слухи предполагают, что GPT-5 будет продвинутой системой маршрутизации с множеством моделей и агентов, используемых для решения правильных задач. Открытые системы будут следовать этому примеру.