Виклики та прориви Web3 AI: дослідження стратегії оточення міст сільськими районами

Розвиток Web3 AI: труднощі та майбутні напрямки

Ціна акцій NVIDIA знову оновила історичний максимум, прогрес у багатомодальних моделях ще більше поглибив технологічний бар'єр Web2 AI. Від семантичної відповідності до візуального сприйняття, від високорозмірних вбудувань до злиття ознак, складні моделі інтегрують різні модальності вираження з небаченою швидкістю, створюючи все більш закриту AI територію. Ринок акцій США також підтвердив це на практиці, незалежно від того, чи це акції, пов'язані з криптовалютами, чи акції AI, всі вони демонструють хвилю малих бичачих ринків.

Однак цей бум, здається, не має великого відношення до сфери криптовалют. Нещодавні спроби в сфері Web3 AI, особливо у напрямку Agent, мають значні відхилення в напрямку: намагаючись зібрати модульну систему в стилі Web2 за допомогою децентралізованої структури, насправді це є подвійним невідповідністю технологій та мислення. Сьогодні, коли модулі мають дуже високу зв'язність, розподіл характеристик є вкрай нестабільним, а вимоги до обчислювальної потужності зростають, багатопрофільна модульність важко знайде місце в середовищі Web3.

Майбутнє Web3 AI полягає не в простому наслідуванні, а в стратегічному обході. Від семантичного вирівнювання у високих вимірах, до інформаційних вузьких місць у механізмах уваги, і до вирівнювання ознак в умовах гетерогенної обчислювальної потужності, Web3 AI потрібно застосувати тактичну стратегію "села, що оточує місто".

Web3 AI на основі спрощеної багатомодальної моделі, семантична несумісність призводить до низької продуктивності

У сучасних багатозначних системах Web2 AI "семантичне вирівнювання" полягає у відображенні інформації з різних модальностей у один семантичний простір, що дозволяє моделям розуміти та порівнювати внутрішнє значення цих сигналів, які спочатку мають різні форми. Ключем до досягнення цієї мети є простір високих вимірів.

Однак, протокол Web3 Agent важко реалізувати в умовах високодимензійного вбудовування. Більшість Web3 Agent лише упаковують готові API в окремі "агенти", що призводить до відсутності єдиного центрального вбудованого простору та міжмодульного механізму уваги. Це призводить до того, що інформація не може взаємодіяти між модулями під різними кутами та на різних рівнях, працюючи лише за лінійною схемою, демонструючи єдину функцію та не здатна сформувати цілісний замкнутий цикл оптимізації.

Для того, щоб реалізувати повністю інтегрованого інтелектуального агента з бар'єрами для входу в галузь, потрібно провести спільне моделювання з кінця в кінець, єдине вбудовування між модулями та систематичну інженерію для спільного навчання і розгортання, щоб подолати вузькі місця. Але наразі ринок не виявляє такої потреби.

У низьковимірному просторі механізм уваги не може бути точно спроектований

Високоякісні багатомодальні моделі потребують тонко налаштованих механізмів уваги. Механізм уваги по своїй суті є способом динамічного розподілу обчислювальних ресурсів, який дозволяє моделі при обробці певного модального введення вибірково "зосереджуватися" на найрелевантніших частинах.

Web2 AI при проектуванні механізму уваги базується на основній ідеї динамічного розподілу "ваг уваги" для кожного елемента під час обробки послідовностей, дозволяючи йому зосередитися на найактуальнішій інформації. Цей дизайн майстерно поєднує "глобальну взаємодію" з "контрольованою складністю".

Однак, на основі модульного Web3 AI важко реалізувати єдине управління увагою. По-перше, механізм уваги залежить від єдиного простору Query-Key-Value, тоді як формати даних та їх розподіл, що повертаються незалежними API, суттєво різняться. По-друге, модульна архітектура Web3 AI відчуває брак можливостей для паралельного, багатоканального динамічного вагового підходу, що ускладнює моделювання тонкого управління в механізмі уваги. І, нарешті, між модулями бракує центрального контексту для реального обміну, що унеможливлює глобальну асоціацію та фокусування між модулями.

Дискретна модульна збірка призводить до того, що злиття ознак залишається на поверхневому статичному з'єднанні

"Злиття ознак" є подальшим поєднанням векторів ознак, отриманих після обробки різних модальностей на основі вирівнювання та уваги, для безпосереднього використання в наступних завданнях. Web3 AI наразі перебуває на найпростішій стадії з'єднання, оскільки передумови для динамічного злиття ознак — високорозмірний простір і точний механізм уваги — не можуть бути забезпечені.

Web2 AI схильний до об'єднаного навчання з кінця в кінець, обробляючи мультимодальні ознаки в одному високорозмірному просторі одночасно, співпрацюючи з шарами уваги та злиття разом зі шарами нижнього рівня для спільної оптимізації. У порівнянні з цим, Web3 AI більше використовує підхід з дискретними модулями, що поєднуються, відсутній єдиний навчальний ціль і перехресний потік градієнтів між модулями.

Процес інтеграції характеристик Web2 AI включає в себе різноманітні високорівневі інтеракційні операції, такі як злиття векторів, додавання, білінейна пулінг, які здатні захоплювати глибокі та складні міжмодальні зв'язки. В той час як виходи різних агентів Web3 AI зазвичай містять лише кілька ключових полів або показників, вимірювання характеристик є дуже низькими, що ускладнює передачу тонких міжмодальних даних.

Бар'єри в індустрії ШІ поглиблюються, але болючі точки ще не виявилися

Мультимодальна система Web2 AI є надзвичайно великим інженерним проєктом, що потребує величезних обсягів даних, потужних обчислювальних ресурсів, передових алгоритмів і складної інженерної реалізації. Це створює дуже сильний бар'єр для входження в галузь і формує основну конкурентну перевагу небагатьох провідних команд.

Web3 AI повинен використовувати тактичну стратегію "села оточують місто", спочатку проводячи маломасштабні випробування в прикордонних сценаріях, а потім, після забезпечення міцної бази, чекати на появу основних сценаріїв. Перевага Web3 AI полягає в децентралізації, що робить його придатним для легковагових структур, завдань, які легко виконувати паралельно та можуть бути стимульовані, таких як LoRA доопрацювання, завдання після навчання з поведінковою узгодженістю, краудсорсинг навчання та маркування даних, навчання малих базових моделей і спільне навчання на периферійних пристроях.

Однак на даному етапі бар'єри Web2 AI тільки починають формуватися, це рання стадія конкуренції між провідними компаніями. Лише коли вигода від Web2 AI зникне, його залишені болі стануть можливістю для входження Web3 AI. До цього моменту проекти Web3 AI повинні обережно вибирати точку входження, забезпечуючи можливість постійно ітеративно оновлювати продукти в малих сценаріях та зберігати достатню гнучкість для адаптації до змінюваного попиту на ринку.

AGENT-4.33%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Репост
  • Поділіться
Прокоментувати
0/400
DogeBachelorvip
· 08-13 08:56
Просто прокрутіть, хехе
Переглянути оригіналвідповісти на0
SatoshiSherpavip
· 08-13 08:56
Технологічний ринок лише обманює невдахи.
Переглянути оригіналвідповісти на0
CryptoComedianvip
· 08-13 08:52
英伟да зростання таке, що я навіть невдахи не можу купити, а гей.
Переглянути оригіналвідповісти на0
TokenStormvip
· 08-13 08:41
у блокчейні тестування є фальшивим
Переглянути оригіналвідповісти на0
  • Закріпити