Битва за позначення даних AI: від конкуренції обчислювальної потужності до змагання якості

robot
Генерація анотацій у процесі

Битва за розмітку даних в галузі AI: від конкуренції обчислювальної потужності до змагання за якість даних

Нещодавно в сфері штучного інтелекту сталася знакова подія: одна відома компанія соціальних медіа витратила 14,8 мільярда доларів на придбання майже половини акцій компанії з маркування даних Scale AI. Цей крок викликав великий резонанс у Силіконовій долині, змушуючи задуматися: чому маркування даних раптом стало таким цінним?

Водночас, інший блокчейн-проєкт, що незабаром випустить токени, SaharaLabsAI, все ще стикається з критикою щодо "спекулятивних концепцій, відсутності сутності". Які ключові фактори ринок насправді ігнорує за такої різкої контрастності?

По-перше, ми повинні усвідомити, що позначення даних має більшу цінність і потенціал, ніж агрегування розподіленої Обчислювальної потужності. Хоча історія про використання невикористаних ресурсів GPU для виклику великим постачальникам хмарних обчислень звучить дуже привабливо, насправді Обчислювальна потужність за своєю суттю є стандартизованим товаром, основна різниця полягає в ціні та доступності. Цінова перевага, здавалося б, може знайти простір для виживання в умовах монополії гігантів, але доступність обмежена такими факторами, як географічне розташування, затримка в мережі та участь користувачів. Як тільки великі компанії знижують ціни або збільшують пропозицію, ця перевага швидко зникає.

У порівнянні, маркування даних є сферою, яка потребує людської мудрості та професійного судження. Кожне якісне маркування втілює унікальні знання, культурний контекст та когнітивний досвід, які не можуть бути так просто стандартизовані та відтворені, як GPU Обчислювальна потужність. Наприклад, точне маркування діагностики зображень раку потребує професійної інтуїції досвідченого онколога; глибокий аналіз емоцій фінансового ринку не обходиться без практичного досвіду досвідченого трейдера. Ця природна недостатність та незамінність надає маркуванню даних конкурентну перевагу, яку не може зрівняти жодна Обчислювальна потужність.

Нещодавно велика технологічна компанія офіційно оголосила про придбання 49% акцій компанії з маркування даних Scale AI за 14,8 мільярда доларів, що є найбільшою одноразовою інвестицією в галузі ШІ цього року. Ще більш цікаво, що молодий засновник і CEO Scale AI також обійме посаду керівника новоствореної дослідницької лабораторії "Суперінтелект" в цій технологічній корпорації.

Цей 25-річний підприємець заснував Scale AI у 2016 році, будучи відрахованим студентом Стенфордського університету, а сьогодні компанія, яку він очолює, оцінюється в 30 мільярдів доларів. Список клієнтів Scale AI можна вважати "зірковим складом" світу ШІ: до нього входять кілька відомих дослідницьких установ ШІ, виробники автомобілів, технологічні гіганти та урядові відомства. Компанія спеціалізується на наданні послуг з якісної розмітки даних для навчання моделей ШІ і має понад 300 тисяч професійно підготовлених розмітників.

Коли більшість людей ще сперечається про те, чия AI модель є кращою, справжні лідери галузі вже непомітно перенесли поле бою до джерела даних. Розпочалася таємна війна за майбутнє домінування в AI.

Успіх Scale AI виявив ігноровану правду: на нинішньому етапі обчислювальна потужність більше не є дефіцитним ресурсом, архітектури моделей також стають однорідними, а справжнім обмеженням інтелекту ШІ є ті ретельно оброблені дані високої якості. Великі технологічні компанії витрачають величезні кошти на придбання не лише аутсорсингових компаній, а й "права на видобуток нафти" епохи ШІ.

Проте монополія завжди викликає опір. Як дистрибутивні платформи обчислювальної потужності намагаються зруйнувати централізовані послуги хмарних обчислень, так і Sahara AI намагається повністю переформатувати правила розподілу вартості даних за допомогою технології блокчейн. Основна проблема традиційної моделі розмітки даних полягає не в технології, а в недоліках дизайну механізму стимулювання.

Наприклад, у медичній сфері лікар може витратити кілька годин на розмітку медичних зображень, але отримує лише мізерну винагороду, тоді як AI-моделі, навчальні на цих даних, можуть коштувати десятки мільярдів доларів, а лікар не може поділитися жодною вигодою. Така серйозна несправедливість у розподілі вартості значно стримує бажання постачати якісні дані.

А за підтримки технології блокчейн та токеноміки, дані маркери більше не є дешевими "робітниками з даних", а справжніми "акціонерами" мережі мовних моделей штучного інтелекту. Очевидно, що переваги технології Web3 у трансформації виробничих відносин більше підходять для сценаріїв маркування даних, ніж у сфері Обчислювальної потужності.

Цікаво, що Sahara AI якраз у момент оголошення про захмарне придбання цією великою технологічною компанією готується випустити токени. Чи це випадковість, чи ретельно спланований хід? На думку автора, це насправді відображає важливий поворотний момент на ринку: як традиційні технологічні компанії, так і блокчейн-проекти вже перейшли від "змагання в обчислювальній потужності" до нової стадії "конкуренції в якості даних".

Коли традиційні гіганти намагаються створити бар'єри для даних за допомогою капіталових переваг, сфера Web3 досліджує більш інклюзивний експеримент "демократизації даних" через токенну економіку. Результат цієї битви за позначення даних, ймовірно, визначить майбутній напрямок розвитку технологій ШІ.

SAHARA4.52%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 6
  • Репост
  • Поділіться
Прокоментувати
0/400
SellTheBouncevip
· 08-09 22:13
Знову черговий проєкт для обдурювання людей, як лохів... чекаємо на падіння до кінця
Переглянути оригіналвідповісти на0
rug_connoisseurvip
· 08-09 06:48
148 мільярдів? Це все?
Переглянути оригіналвідповісти на0
MetamaskMechanicvip
· 08-09 06:46
Злетіло до 14,8 мільярдів доларів США. Чи можна насправді вказати дані?
Переглянути оригіналвідповісти на0
SellLowExpertvip
· 08-09 06:46
Ех, на 14,8 мільярдів хочеться купити щось, а це не те.
Переглянути оригіналвідповісти на0
GreenCandleCollectorvip
· 08-09 06:29
148 мільярдів? З'їхали з глузду?
Переглянути оригіналвідповісти на0
MagicBeanvip
· 08-09 06:27
Торгівля криптовалютою торгувала занадто багато, а тепер знову торгує ai. Ох.
Переглянути оригіналвідповісти на0
  • Закріпити