لاول مرة سام التمان وهينتون في الصين! تم الانتهاء بنجاح من حدث خبراء الذكاء الاصطناعي الأكثر تشددًا في الصين ، وكان النموذج المحلي واسع النطاق "Enlightenment 3.0" مفتوح المصدر بالكامل
** 【مقدمة إلى Xinzhiyuan】 ** لا يزال مؤتمر Zhiyuan هذا العام مليئًا بالنجوم ومليء بالحس الأكاديمي. ناقش جميع الأسماء الكبيرة الذكاء الاصطناعي الفائق ، وأثار تصادم الأفكار شرارات. لا يزال حفل الربيع الخاص بالذكاء الاصطناعي لا ينبغي تفويته!
الآن فقط ، اختتم مؤتمر Zhiyuan المحلي السنوي "مهرجان الربيع AI" بنجاح!
في هذا الحدث السنوي الذروة للذكاء الاصطناعي ، هناك فرق نجوم مألوفة مثل OpenAI و DeepMind و Anthropic و HuggingFace و Midjourney و Stability AI وما إلى ذلك ، وهناك Meta و Google و Microsoft وغيرها من الشركات المصنعة الكبرى التي غزت العالم ، وهناك هي جامعات ستانفورد وجامعة كاليفورنيا في بيركلي ومعهد ماساتشوستس للتكنولوجيا وغيرها من أفضل الجامعات في العالم.
حضر مؤلفو الأعمال المهمة مثل GPT-4 و PaLM-E و OPT و LLaMA وما إلى ذلك جميعًا وشرحوا لنا نتائج البحث. يمكن القول أن هذا المؤتمر يتمتع بالعمق المهني والإلهام الإبداعي ، وقد تمت مناقشة كل موضوع إلى أقصى الحدود.
كانت ذروة المؤتمر بلا شك خطابات يان ليكون الحائز على جائزة تورينج ، وجيفري هينتون ، ومؤسس OpenAI Sam Altman.
يمكن وصف مظهر هذه الأوزان الفائقة بأنه مليء باللمسات البارزة.
** جيفري هينتون: خطر الذكاء الاصطناعي الخارق أمر ملح **
في الكلمة الرئيسية الختامية للمنتدى التي اختتمت لتوها ، تصور هينتون ، الحائز على جائزة تورينج وأب التعلم العميق ، سيناريو يستحق التفكير فيه بالنسبة لنا.
في بداية الخطاب ، تساءل هينتون "هل الشبكات العصبية الاصطناعية أذكى من الشبكات العصبية الحقيقية؟"
نعم ، في رأيه ، يمكن أن يحدث ذلك قريبًا.
كما هو الحال منذ بعض الوقت ، استقال هينتون من Google وشرح أسباب استقالته باختصار. لقد تحدث عن ندمه على عمل حياته ومخاوفه من مخاطر الذكاء الاصطناعي. لقد صرح مرارًا وتكرارًا علنًا أن مخاطر الذكاء الاصطناعي على العالم أكثر إلحاحًا من تغير المناخ.
وبالمثل ، في مؤتمر Zhiyuan ، تحدث Hinton عن مخاطر الذكاء الاصطناعي مرة أخرى.
ماذا لو تمكنت شبكة عصبية كبيرة تعمل على أجهزة كمبيوتر رقمية متعددة من اكتساب المعرفة مباشرة من العالم ، بالإضافة إلى تقليد اللغة البشرية من أجل المعرفة البشرية؟
من الواضح أنها ستصبح أفضل بكثير من البشر لأنها رصدت بيانات أكثر.
هذه الفكرة ليست بعيدة المنال ، إذا كان بإمكان هذه الشبكة العصبية إجراء نمذجة غير خاضعة للإشراف للصور أو مقاطع الفيديو ، ويمكن لنسخها أيضًا التلاعب بالعالم المادي.
في الحالات القصوى ، يستخدم المجرمون الذكاء الخارق للتلاعب بالناخبين وكسب الحروب.
إذا سُمح للذكاء الخارق بصياغة أهداف فرعية خاصة به ، أحد الأهداف الفرعية هو اكتساب المزيد من القوة ، فإن الذكاء الخارق سيتلاعب بالبشر الذين يستخدمونه من أجل تحقيق هذا الهدف.
** Zhang Hongjiang and Sam Altman Peak Q & A: AGI قد يظهر في غضون عشر سنوات **
هذا الصباح ، ظهر سام التمان أيضًا عبر رابط الفيديو. هذه هي المرة الأولى التي يلقي فيها Sam Altman خطابًا عامًا في الصين بعد انفجار ChatGPT.
يسلط الضوء:
السبب وراء تأثير ثورة الذكاء الاصطناعي الحالية ليس فقط في حجم تأثيرها ، ولكن أيضًا في سرعة التقدم. هذا يجلب كل من الأرباح والمخاطر.
مع ظهور أنظمة الذكاء الاصطناعي القوية بشكل متزايد ، أصبح تعزيز التعاون الدولي وبناء الثقة العالمية أمرًا بالغ الأهمية.
المحاذاة لا تزال قضية مفتوحة. أكملت GPT-4 أعمال المحاذاة في الأشهر الثمانية الماضية ، بما في ذلك بشكل أساسي قابلية التوسع وقابلية الشرح.
في خطابه ، أكد ألتمان مرارًا وتكرارًا على ضرورة التوافق والإشراف على أمن الذكاء الاصطناعي العالمي ، واقتبس على وجه التحديد جملة من تاو تي تشينغ:
رحلة الألف ميل تبدأ بخطوة واحدة.
من وجهة نظره ، يتطور الذكاء الاصطناعي بسرعة هائلة ، وقد يظهر الذكاء الاصطناعي الفائق في السنوات العشر القادمة.
لذلك ، من الضروري تعزيز سلامة الذكاء الاصطناعي العام ، وتقوية التعاون الدولي ، ومواءمة عمليات النشر البحثية ذات الصلة.
يعتقد سام التمان أن التعاون في المجتمع العلمي والتكنولوجي الدولي هو الخطوة الأولى لاتخاذ خطوة بناءة في الوقت الحالي. على وجه الخصوص ، يجب تحسين آليات الشفافية ومشاركة المعرفة من أجل التقدم التكنولوجي في مجال سلامة الذكاء الاصطناعي العام.
بالإضافة إلى ذلك ، ذكر ألتمان أن هدف البحث الرئيسي الحالي لـ OpenAI يركز على أبحاث محاذاة الذكاء الاصطناعي ، أي كيفية جعل الذكاء الاصطناعي مساعدًا مفيدًا وآمنًا.
أحدهما هو الإشراف القابل للتطوير ، في محاولة لاستخدام أنظمة الذكاء الاصطناعي لمساعدة البشر في الإشراف على أنظمة الذكاء الاصطناعي الأخرى. والثاني هو القابلية للتفسير ، ومحاولة فهم "الصندوق الأسود" للأعمال الداخلية للنموذج الكبير.
في النهاية ، تهدف OpenAI إلى تدريب أنظمة الذكاء الاصطناعي للمساعدة في مواءمة البحث.
بعد الخطاب ، افتتح Zhang Hongjiang ، رئيس معهد Zhiyuan للأبحاث ، وسام ألتمان حوارًا جويًا لمناقشة كيفية جعل محاذاة آمنة للذكاء الاصطناعي.
عندما سئل عما إذا كانت OpenAI ستفتح نماذج كبيرة المصدر ، قال ألتمان إنه سيكون هناك المزيد من المصادر المفتوحة في المستقبل ، لكن لا يوجد نموذج وجدول زمني محدد.
بالإضافة إلى ذلك ، قال أيضًا أنه لن يكون هناك GPT-5 في أي وقت قريب.
بعد الاجتماع ، أصدر ألتمان رسالة للتعبير عن امتنانه لدعوته لإلقاء كلمة في مؤتمر Zhiyuan.
** LeCun: لا يزال معجبًا بالموديل العالمي **
الحائز على جائزة تورينغ آخر ، LeCun ، الذي تحدث في اليوم الأول ، استمر في الترويج لمفهومه الخاص "بالنموذج العالمي".
لطالما أعرب LeCun عن ازدرائه لفكرة أن الذكاء الاصطناعي سوف يدمر البشر ، فهو يعتقد أن الذكاء الاصطناعي اليوم ليس ذكيًا مثل الكلب ، وأن الذكاء الاصطناعي الحقيقي لم يتم تطويره بعد ، ومثل هذه المخاوف لا داعي لها.
وأوضح أن الذكاء الاصطناعي لا يمكنه التفكير والتخطيط مثل البشر والحيوانات ، ويرجع ذلك جزئيًا إلى أن أنظمة التعلم الآلي الحالية لها بشكل أساسي خطوات حسابية ثابتة بين المدخلات والمخرجات.
كيف يمكن للآلة أن تفهم كيف يعمل العالم ، وتتنبأ بعواقب أفعال مثل البشر ، أو تقسمها إلى خطوات متعددة للتخطيط لمهام معقدة؟
من الواضح أن التعلم تحت الإشراف الذاتي هو أحد المسارات. بالمقارنة مع التعلم المعزز ، يمكن للتعلم تحت الإشراف الذاتي أن يولد قدرًا كبيرًا من التعليقات ويكون قادرًا على التنبؤ بأي جزء من مدخلاته.
قال LeCun إنه قرر أن التحديات الرئيسية الثلاثة للذكاء الاصطناعي في السنوات القليلة المقبلة هي تعلم تمثيل العالم ، والتنبؤ بالنموذج العالمي ، واستخدام التعلم تحت الإشراف الذاتي.
قد يكون المفتاح لبناء الذكاء الاصطناعي على المستوى البشري هو القدرة على تعلم "نموذج عالمي".
من بينها ، يتكون "النموذج العالمي" من ست وحدات مستقلة ، بما في ذلك: وحدة التكوين ، وحدة الإدراك ، النموذج العالمي ، وحدة التكلفة ، وحدة الممثل ، ووحدة الذاكرة قصيرة المدى.
وهو يعتقد أن تصميم نموذج العمارة والتدريب للنموذج العالمي هو العقبة الحقيقية التي تعوق تطوير الذكاء الاصطناعي في العقود القليلة القادمة.
عندما سُئل عما إذا كان نظام الذكاء الاصطناعي يشكل خطرًا وجوديًا على البشر ، قال LeCun إنه ليس لدينا ذكاء اصطناعي فائق حتى الآن ، فكيف يمكننا جعل نظام الذكاء الاصطناعي الفائق آمنًا؟
** أفضل مطابقة "حدث خبراء الذكاء الاصطناعي" **
يمكن القول إن مؤتمر Zhiyuan القوي لعام 2023 هو المؤتمر الأعلى مستوى والأكثر مشاهدة في مجال الذكاء الاصطناعي المحلي هذا العام.
منذ بداية تأسيسه ، كانت الخصائص الأساسية لمؤتمر Zhiyuan واضحة جدًا: أكاديمية ، مهنية ، متطورة.
في غمضة عين ، وصل هذا الحدث السنوي لخبراء الذكاء الاصطناعي إلى عامه الخامس.
هذه المرة ، يواصل مؤتمر Zhiyuan 2023 تقليد كل مؤتمر Zhiyuan ، ولا يزال الشعور بالجو الأكاديمي ساحقًا.
في عام 2021 ، في مؤتمر Zhiyuan الثالث ، سيلقي الفائز بجائزة Turing Yoshua Bengio ، والأستاذ بجامعة بكين E Weinan ، و Zhu Min ، عميد المعهد الوطني للبحوث المالية بجامعة Tsinghua ، كلمات رئيسية.
في عام 2022 ، شارك اثنان من الفائزين بجائزة تورينج ، يان لوكون وأدي شامير ، والد التعلم المعزز ريتشارد ساتون ، والأكاديمي من الولايات المتحدة مايكل جوردان ، وسينثيا دورك الحائزة على جائزة جوديل ، وغيرهم من الشخصيات الثقيلة.
وبحلول عام 2023 ، ستكون بلا شك الجلسة "الأكثر رواجًا بالنجوم".
هناك 4 فائزين بجائزة تورينج ، يان ليكون ، وجيفري هينتون ، وجوزيف سيفاكيس ، وياو كيجي ، بالإضافة إلى مؤسس OpenAI Sam Altman ، والحائز على جائزة نوبل ، أريه وارسيل ، ومؤسس معهد Future Life ، Max Tegmark ، والأكاديميون Zheng Nanning الحائز على جائزة الإنجاز العليا لعام 2022. والأكاديمي تشانغ بو من الأكاديمية الصينية للعلوم.
والأهم من ذلك ، بعد أن وضع مشروع نموذج Zhiyuan واسع النطاق "التنوير" مرارًا وتكرارًا الرقم القياسي لـ "الصين الأولى + الأكبر في العالم" ، دخلت "التنوير 3.0" مرحلة جديدة من "المصدر المفتوح الشامل".
"التنوير 3.0" هو سلسلة من النماذج واسعة النطاق.
على وجه التحديد ، يتضمن سلسلة النماذج واسعة النطاق بلغة Aquila ، ونظام تقييم النموذج الكبير Flag ، وسلسلة النماذج المرئية واسعة النطاق "Enlightenment · Vision" ، وسلسلة النماذج واسعة النطاق متعددة الوسائط.
** سلسلة طرازات اللغة الكبيرة **
** التنوير · Aquila: رخصة تجارية مفتوحة بالكامل **
أول ما يظهر هو سلسلة Aquila للنماذج الكبيرة ، وهي أول نماذج كبيرة بلغة مفتوحة المصدر مع معرفة ثنائية اللغة باللغتين الصينية والإنجليزية لدعم متطلبات الامتثال للبيانات المحلية ، ولديها تراخيص تجارية مفتوحة بالكامل.
يتضمن هذا المصدر المفتوح النموذج الأساسي المكون من 7 مليارات معلمة و 33 مليار معلمة ، ونموذج حوار AquilaChat ، ونموذج توليد "شفرة نصية" AquilaCode.
عنوان Enlightenment Aquila مفتوح المصدر:
** أداء أقوى **
من الناحية الفنية ، يرث نموذج Aquila الأساسي (7B ، 33B) تقنيًا مزايا التصميم المعماري لـ GPT-3 و LLaMA وما إلى ذلك ، ويحل محل مجموعة من تطبيقات المشغل ذات المستوى الأدنى الأكثر كفاءة ، ويعيد تصميم وتنفيذ رمز ثنائي اللغة صيني-إنجليزي ، The تمت ترقية طريقة التدريب المتوازي BMTrain ، وفي عملية تدريب Aquila ، تكون كفاءة التدريب أعلى بحوالي 8 مرات من كفاءة Magtron + DeepSpeed ZeRO-2.
على وجه التحديد ، الأول هو الاستفادة من تقنية جديدة لتسريع إطار التدريب بشكل متوازٍ.
في العام الماضي ، استعانت Zhiyuan بمصدر مفتوح لمشروع خوارزمية نموذج كبير مفتوح المصدر FlagAI ، والذي دمج طريقة تدريب موازية جديدة مثل BMTrain. أثناء عملية التدريب ، يتم تحسين الحساب والتواصل بالإضافة إلى المشكلات المتداخلة.
ثانيًا ، أخذت Zhiyuan زمام المبادرة في إدخال تقنية تحسين المشغل ، ودمجها مع طرق تسريع متوازية لزيادة تسريع الأداء.
** تعلم اللغة الصينية والإنجليزية في نفس الوقت **
لماذا يعتبر إطلاق أكويلا مشجعًا جدًا؟
نظرًا لأن العديد من النماذج الكبيرة "تتعلم اللغة الإنجليزية فقط" - تعتمد فقط على قدر كبير من تدريب مجموعة اللغة الإنجليزية ، ولكن يتعين على أكويلا تعلم اللغتين الصينية والإنجليزية.
ربما تكون قد اختبرت ذلك بنفسك: عندما يتعلم المرء المعرفة ، فلا توجد مشكلة إذا واصلت استخدام اللغة الإنجليزية طوال الوقت ، ولكن إذا تعلمت اللغة الإنجليزية ثم تعلمت الصينية ، فستكون الصعوبة هائلة.
لذلك ، بالمقارنة مع النماذج المعتمدة على اللغة الإنجليزية مثل LLaMA و OPT ، زادت صعوبة تدريب Aquila ، التي تحتاج إلى تعلم كل من المعرفة الصينية والإنجليزية ، عدة مرات.
من أجل تحسين Aquila للمهام الصينية ، وضعت Zhiyuan ما يقرب من 40 ٪ من الكوادر الصينية في مجموعة التدريب الخاصة بها. والسبب هو أن Zhiyuan يأمل ألا تتمكن Aquila من توليد اللغة الصينية فحسب ، بل يمكنها أيضًا فهم الكثير من المعرفة المحلية بالعالم الصيني.
بالإضافة إلى ذلك ، أعادت Zhiyuan أيضًا تصميم وتنفيذ الرمز المميز ثنائي اللغة الصينية-الإنجليزية (الرمز المميز) ، والذي يهدف إلى التعرف على تجزئة الكلمات الصينية ودعمها بشكل أفضل.
في عملية التدريب والتصميم ، للمهام الصينية ، يزن فريق Zhiyuan عن عمد بُعدي الجودة والكفاءة لتحديد حجم الرمز المميز.
نموذج حوار AquilaChat (7B ، 33B) المبني على أساس نموذج Aquila الأساسي يدعم الحوار النصي السلس ومهام إنشاء متعدد اللغات.
جولات متعددة من الحوار
تكوين تكوين امتحان دخول الكلية
بالإضافة إلى ذلك ، من خلال تحديد مواصفات التعليمات الخاصة القابلة للتوسيع ، يمكن استخدام AquilaChat للاتصال بنماذج وأدوات أخرى ، ومن السهل توسيعها.
على سبيل المثال ، يتم استخدام نموذج إنشاء النص والصورة متعدد اللغات AltDiffusion مفتوح المصدر بواسطة Zhiyuan لتحقيق إمكانات إنشاء نص وصور سلسة. من خلال التعاون مع نموذج الرسم البياني فينسنت الذي يمكن التحكم فيه متعدد الخطوات من Zhiyuan InstructFace ، يمكنه أيضًا تحقيق تحرير متعدد الخطوات يمكن التحكم فيه لصور الوجه بسهولة.
توليد النص
تحرير الوجه للتحكم متعدد الخطوات
نموذج توليد "كود النص" AquilaCode-7B ، استنادًا إلى قدرات النموذج الأساسية القوية لـ Aquila-7B ، يحقق أداءً عاليًا مع مجموعة بيانات صغيرة وكمية صغيرة من المعلمات. وهو حاليًا أفضل نموذج كود مفتوح المصدر يدعم اللغة الصينية والأداء ثنائي اللغة باللغة الإنجليزية: بعد تصفية عالية الجودة ، يتم إجراء التدريب باستخدام بيانات كود التدريب مع تراخيص مفتوحة المصدر متوافقة.
بالإضافة إلى ذلك ، أكمل AquilaCode-7B تدريب نماذج الكود على Nvidia والرقائق المحلية على التوالي ، ومن خلال المصدر المفتوح للكود + نماذج من مختلف الأبنية ، فإنه يعزز ابتكار الرقائق وازدهار مائة زهرة.
توليد النص
** مواد صينية أكثر توافقًا ونظافة **
بالمقارنة مع النماذج الأجنبية مفتوحة المصدر ، فإن الميزة الأكثر تميزًا لـ Aquila هي أنها تدعم متطلبات الامتثال للبيانات المحلية.
قد يكون للنماذج الأجنبية واسعة النطاق قدرات صينية معينة ، ولكن يتم استخراج جميع بيانات الإنترنت الصينية تقريبًا التي تستخدمها النماذج الأجنبية مفتوحة المصدر واسعة النطاق من مجموعات بيانات الإنترنت مثل الزحف المشترك.
ومع ذلك ، إذا قمنا بتحليل مجموعة الزحف المشتركة ، يمكننا أن نجد أن هناك أقل من 40 ألف صفحة ويب صينية متاحة في 1 مليون إدخال ، و 83٪ منها مواقع خارجية ، ومن الواضح أنه لا يمكن التحكم في الجودة.
لذلك ، لم تستخدم Aquila أي مجموعة نصية صينية في الزحف المشترك ، ولكنها استخدمت مجموعة بيانات Wudao الخاصة بـ Zhiyuan والتي تراكمت على مدار السنوات الثلاث الماضية. تأتي مجموعة بيانات Wudao Chinese من أكثر من 10000 موقع ويب صيني رئيسي ، لذا فإن بياناتها الصينية تفي بمتطلبات الامتثال وهي أكثر نظافة.
بشكل عام ، هذا الإصدار هو مجرد نقطة بداية. هدف Zhiyuan هو إنشاء مجموعة كاملة من تطور النموذج الكبير وخطوط التكرار ، بحيث يستمر النموذج الكبير في النمو مع إضافة المزيد من البيانات والمزيد من الإمكانات ، وسيستمر لتكون مفتوحة المصدر ومفتوحة.
تجدر الإشارة إلى أن Aquila متاح على بطاقات الرسومات الاستهلاكية. على سبيل المثال ، يمكن تشغيل طراز 7B على 16 جيجا أو حتى ذاكرة فيديو أصغر.
** نظام تقييم نموذج كبير للمكتبة (فلاج) **
إن نظام تقييم النماذج الآمنة والموثوق والشامل والموضوعي واسع النطاق مهم أيضًا للابتكار التكنولوجي والتنفيذ الصناعي للنماذج واسعة النطاق.
بادئ ذي بدء ، بالنسبة للمجتمع الأكاديمي ، إذا كنت ترغب في تعزيز ابتكار النماذج الكبيرة ، يجب أن يكون لديك مسطرة لقياس قدرات وجودة النماذج الكبيرة.
ثانيًا ، بالنسبة للصناعة ، ستختار الغالبية العظمى من الشركات الاستخدام المباشر للنماذج الكبيرة الحالية بدلاً من تطويرها من نقطة الصفر. عند الاختيار ، هناك حاجة إلى نظام تقييم للمساعدة في الحكم. بعد كل شيء ، تعتمد النماذج الكبيرة الأساسية المطورة ذاتيًا على تكاليف طاقة الحوسبة الضخمة. لتطوير نموذج يحتوي على 30 مليار معلمة ، تشمل الأموال المطلوبة قوة الحوسبة والبيانات وما إلى ذلك ، 20 مليونًا على الأقل.
بالإضافة إلى ذلك ، ما إذا كان من الممكن بناء نظام تقييم نموذجي شامل واسع النطاق لـ "التقييم الآلي + التقييم الذاتي اليدوي" ، وإدراك الحلقة المغلقة التلقائية من نتائج التقييم إلى تحليل القدرة النموذجية ، ومن ثم نمذجة تحسين القدرة ، أصبح جانبًا هامًا من جوانب ابتكار النماذج الأساسية واسعة النطاق.
من أجل حل نقطة الألم هذه ، اختار معهد Zhiyuan للأبحاث إعطاء الأولوية لإطلاق نظام تقييم النماذج واسع النطاق الميزان (Flag) والمنصة المفتوحة (flag.baai.ac.cn).
يهدف نظام تقييم نموذج العلم واسع النطاق والنظام الأساسي المفتوح إلى إنشاء معايير وأساليب ومجموعات أدوات تقييم علمية وعادلة ومفتوحة لمساعدة الباحثين في التقييم الشامل لأداء النماذج الأساسية وخوارزميات التدريب ، وفي نفس الوقت استكشاف استخدام أساليب الذكاء الاصطناعي لتحقيق إن مساعدة التقييم الذاتي تحسن بشكل كبير من كفاءة وموضوعية التقييم.
على وجه التحديد ، يبني نظام تقييم نموذج Flag واسع النطاق بشكل مبتكر إطار تقييم ثلاثي الأبعاد لـ "مؤشر مهمة القدرة" ، والذي يمكن أن يصف بدقة حدود القدرة المعرفية للنموذج الأساسي وتصور نتائج التقييم.
في الوقت الحالي ، يشتمل نظام تقييم نموذج Flag واسع النطاق على ما مجموعه 600+ من أبعاد التقييم ، بما في ذلك 22 مجموعة بيانات تقييم و 84،433 سؤالاً ، ويتم دمج المزيد من مجموعات بيانات التقييم الأبعاد تدريجياً.
بالإضافة إلى ذلك ، سيستمر نظام تقييم نموذج Flag واسع النطاق في استكشاف البحث متعدد التخصصات بين تقييم نموذج اللغة على نطاق واسع والتخصصات الاجتماعية مثل علم النفس والتعليم والأخلاق ، من أجل تقييم النماذج اللغوية واسعة النطاق بشكل أكثر شمولاً وعلمية. .
30+ قدرات × 5 مهام × 4 فئات من المؤشرات = 600+ بعد تقييم شامل
** سلسلة النماذج الكبيرة المرئية **
فيما يتعلق برؤية الكمبيوتر ، أنشأ فريق Enlightenment 3.0 سلسلة "Enlightenment Vision" من النماذج الكبيرة ذات الإدراك العام للمشهد وقدرات معالجة المهام المعقدة.
من بينها ، تقنية SOTA لهذه الدفقات الست التي تبني الأساس الأساسي لـ "رؤية التنوير":
نموذج كبير متعدد الوسائط "Emu" ، نموذج كبير تم تدريبه مسبقًا "EVA" ، نموذج مرئي عام متعدد المهام "رسام" ، نموذج تجزئة للرؤية العامة ، نموذج كبير للتدريب المسبق على الرسم "EVA-CLIP" وتقنية تحرير الفيديو "vid2vid-zero ".
** 1. Emu: إكمال كل شيء بتسلسل متعدد الوسائط **
Emu هو نموذج كبير يقبل المدخلات متعددة الوسائط وينتج مخرجات متعددة الوسائط. استنادًا إلى مسار تقنية تعلم السياق متعدد الوسائط ، يمكن لـ Emu التعلم من التسلسلات الضخمة متعددة الوسائط مثل النص الرسومي والنص الرسومي المتشابك ونص الفيديو المتشابك.
بعد اكتمال التدريب ، يمكن لـ Emu إكمال كل شيء في سياق التسلسلات متعددة الوسائط ، وإدراك وسبب وتوليد بيانات من طرائق مختلفة مثل الصور والنصوص ومقاطع الفيديو ، وجولات متعددة كاملة من حوارات النص الرسومي وعدد قليل من الرسوم البيانية. - فهم النص ، سؤال وجواب الفيديو ، إنشاء نص إلى صورة ، إنشاء صورة إلى صورة ومهام أخرى متعددة الوسائط.
** 2. EVA: أقوى نموذج أساسي مرئي بمستوى مليار **
عنوان المشروع:
عنوان الورق:
تجمع EVA بين نموذج التعلم الدلالي (CLIP) وطريقة تعلم الهيكل الهندسي (MIM) ، وتوسع نموذج ViT القياسي إلى مليار معلمة للتدريب. في ضربة واحدة ، حققت أقوى أداء في ذلك الوقت في مجموعة واسعة من مهام الإدراك البصري مثل تصنيف ImageNet واكتشاف COCO وتجزئة وتصنيف الفيديو الحركي.
** 3. EVA-CLIP: أقوى نموذج CLIP مفتوح المصدر **
عنوان المشروع: / tree / master / EVA-CLIP
عنوان الورق:
تم تطوير EVA-CLIP مع النموذج المرئي الأساسي EVA باعتباره جوهرًا ، وقد تم تكرارها إلى 5 مليارات معلمة.
بالمقارنة مع OpenCLIP السابق بمعدل دقة 80.1٪ ، فإن نموذج EVA-CLIP لديه معدل دقة يبلغ 82.0٪ في ImageNet1K صفر عينة أعلى 1. من حيث دقة ImageNet kNN ، فإن أحدث طراز DINOv2 من Meta على قدم المساواة مع 1 مليار معامل EVA-CLIP.
** 4. الرسام: المسار التكنولوجي الأول "التعلم عبر الصور السياقية" **
عنوان المشروع:
عنوان الورق:
الفكرة الأساسية للنموذج المرئي العام نمذجة الرسام "تتمحور حول الرؤية" ، وباستخدام الصور كمدخلات ومخرجات ، يتم الحصول على المعلومات المرئية السياقية لإكمال المهام المرئية المختلفة.
** 5. نموذج التقسيم العالمي للآفاق: الكل في واحد ، تقسيم كل شيء **
يتمتع نموذج التقسيم العام الأفقي بقدرة قوية على استدلال السياق المرئي ، ويمكن للنموذج فهم نوايا المستخدم وإكمال مهام التجزئة المماثلة فقط من خلال إعطاء مثال واحد أو عدد قليل من الصور والإشارات المرئية.
لتوضيح الأمر ببساطة ، يقوم المستخدمون بتحديد فئة من الكائنات على الشاشة والتعرف عليها ، ويمكنهم تحديد الكائنات المتشابهة وتقسيمها على دفعات ، سواء في الشاشة الحالية أو في الشاشات أو بيئات الفيديو الأخرى.
** 6. vid2vid-zero: أول تقنية في المجال لتعديل الفيديو باستخدام عينة صفرية **
عنوان المشروع:
رابط الورق:
موقع تجريبي:
تستخدم تقنية تحرير الفيديو ذات العينة الصفرية "vid2vid-zero" الخصائص الديناميكية لآلية الانتباه لأول مرة ، جنبًا إلى جنب مع نموذج نشر الصورة الحالي ، لإنشاء إطار نموذجي لتحرير الفيديو بدون تدريب إضافي مسبق للفيديو. الآن ، فقط قم بتحميل مقطع فيديو ، ثم أدخل سلسلة من المطالبات النصية ، يمكنك تحرير الفيديو بسمات محددة.
** المستنير لأبحاث النماذج الصينية واسعة النطاق **
تأسس معهد Zhiyuan للأبحاث في نوفمبر 2018 ، وهو رائد أبحاث النماذج واسعة النطاق في الصين.بعد خمس سنوات من التطوير ، أصبح معيارًا لأبحاث النماذج واسعة النطاق في الصين.
ما يجعله مختلفًا عن المؤسسات الأخرى هو أن Zhiyuan Research Institute هو مؤسسة منصة. في بداية إنشائه ، اتخذ معهد Zhiyuan للأبحاث إنشاء نظام إيكولوجي للذكاء الاصطناعي كأحد مهامه ومهامه الأساسية.
كيف عززت Zhiyuan تطوير البحوث النموذجية واسعة النطاق في الصين منذ إنشائها؟
في الواقع ، تم إنشاء معهد Zhiyuan للأبحاث في الوقت المناسب تمامًا لظهور النماذج الأجنبية واسعة النطاق.
بالحديث عن ذلك ، فإن الاتجاه الرئيسي لبحوث OpenAI الذي تم إنشاؤه في عام 2015 هو استكشاف الطريق إلى الذكاء الاصطناعي العام ، وهو ليس نموذجًا كبيرًا.
بعد عام 2018 ، بدأت OpenAI في التركيز على الطرز الكبيرة ، وأصدرت GPT مع 117 مليون معلمة في يونيو. في نفس العام ، أصدرت Google أيضًا نموذجًا لغويًا واسع النطاق مدربًا مسبقًا BERT مع 300 مليون معلمة.
لاحظ الجميع أن اتجاه الصناعة بأكمله واتجاه التكنولوجيا في عام 2018 هو صنع نموذج أكبر.
مع زيادة قوة الحوسبة التي يستخدمها النموذج ، يصبح قانون مور ما يسمى بـ "القانون النموذجي" ، أي أن قوة الحوسبة المستخدمة لتدريب نموذج كبير تتضاعف في غضون 3-4 أشهر.
في عام 2018 أيضًا ، تم إنشاء معهد Zhiyuan للأبحاث ، والذي تولى القيادة في الجمع بين كبار العلماء في مجال الذكاء الاصطناعي وبدأ في استكشاف النماذج الكبيرة.
نتيجة لذلك ، في عام 2021 ، أصدرت Zhiyuan نموذجين كبيرين على التوالي من Enlightenment 1.0 و Enlightenment 2.0.
وفقًا لهوانغ تيجون ، في المؤتمر الصحفي التنوير 1.0 في مارس 2021 ، حكمت Zhiyuan Research أن الذكاء الاصطناعي قد تغير من "نموذج كبير" إلى مرحلة جديدة من "النموذج الكبير". ومنذ ذلك الحين ، أصبح مفهوم "النموذج الكبير" دخلت الرؤية العامة.
في كل عام في مؤتمر Zhiyuan ، سيتم سرد الطرق الفنية الثلاثة الرئيسية لتسلق ذروة الذكاء الاصطناعي العام: النماذج الكبيرة ، وذكاء الحياة و AI4Science. هذه الطرق الثلاثة ليست معزولة ، فهي تتفاعل وتؤثر على بعضها البعض.
اليوم ، يأتي السبب الرئيسي لقدرة النماذج الكبيرة الناشئة من البيانات الهائلة التي تقف وراءها.
تحتوي البيانات اللغوية نفسها على معرفة وذكاء ثريين ، يتم استخراجهما من خلال نماذج واسعة النطاق ، وتُستخدم الشبكات العصبية للتعبير عن القوانين الكامنة وراء البيانات المعقدة.
هذا سبب معقول لماذا يمكن أن يؤدي أحد المسارات الفنية للنموذج الكبير إلى الذكاء الاصطناعي العام.
وهذا يفسر أيضًا سبب تركيز Zhiyuan في البداية على النموذج الكبير. في مارس 2021 ، تم إصدار Enlightenment 1.0 ، تلاه Enlightenment 2.0 في يونيو.
بالإضافة إلى ذلك ، بالإضافة إلى الطراز الكبير ، تقوم Zhiyuan أيضًا باستمرار باستكشاف الطريقين الآخرين المؤديين إلى AGI و "Life Intelligence" و "AI4Science".
في عام 2022 ، أصدرت Zhiyuan المحاكاة الأكثر دقة لـ Caenorhabditis elegans. هذه المرة ، افتتح Zhiyuan منصة محاكاة الحياة "eVolution-eVolution" المستخدمة في دراسة الديدان الخيطية الاصطناعية لتقديم خدمات عبر الإنترنت.
Tianyan عبارة عن منصة محاكاة شبكة عصبونية دقيقة وواسعة النطاق مع أربع ميزات بارزة: النظام الأساسي الأكثر كفاءة لمحاكاة شبكة الخلايا العصبية الدقيقة ؛ دعم محاكاة الشبكة العصبية واسعة النطاق للغاية ؛ توفير مجموعة أدوات محاكاة ومحاكاة عبر الإنترنت. ؛ يدعم التفاعل المرئي عالي الجودة المحاكاة في الوقت الفعلي والتشغيل التعاوني المرئي.
استنادًا إلى منصة Tianyan ، فهي تدرك محاكاة عالية الدقة للذكاء البيولوجي ، وتستكشف جوهر الذكاء ، وتعزز الذكاء الاصطناعي العام المستوحى من علم الأحياء. علاوة على ذلك ، قام فريق Tianyan بتوصيل Tianyan بالجيل الجديد من أجهزة الكمبيوتر العملاقة في بلدي - الجيل الجديد من أجهزة الكمبيوتر العملاقة Tianhe.
من خلال النشر والتشغيل الناجح لـ "Tianyan-Tianhe" ، يمكن تحقيق محاكاة نماذج مثل شبكة القشرة المرئية الدقيقة لدماغ الماوس V1 ، ويمكن تقليل استهلاك الطاقة الحسابية بأكثر من 10 مرات ، ويمكن لسرعة الحساب يمكن زيادتها بأكثر من 10 مرات ، لتصل إلى أقصى حد في العالم. يضع أداء محاكاة شبكة الخلايا العصبية الدقيقة أساسًا متينًا لتحقيق محاكاة دقيقة للدماغ البشري بأكمله.
الآن ، بعد عامين ، أصدرت Zhiyuan سلسلة Enlightenment 3.0 من الطرز الكبيرة مرة أخرى.
فيما يتعلق بالموقع ، منذ إصدار Enlightenment 2.0 ، فإن Zhiyuan ، كمنظمة منصة غير ربحية ، لا تصنع النماذج والنماذج فحسب ، بل تقدم أيضًا بشكل تدريجي مساهمات فريدة في بناء البيئة الأساسية للنماذج الكبيرة.
من بينها ، يتضمن فرز البيانات خلف النموذج ، واختبار النموذج ، واختبار الخوارزمية ، والمؤسسات المفتوحة المصدر والمفتوحة ، والتخطيط الشامل لمنصات طاقة الحوسبة.
لماذا قام Zhiyuan بإجراء مثل هذا التغيير؟
لأن Zhiyuan تدرك بعمق أن النموذج الكبير نفسه ليس هو شكل المنتج الأكثر أهمية في عصر النموذج الكبير ، ولكنه حقبة جديدة تتميز بالتنظيم والخدمات الفكرية.
في الوقت الحاضر ، سيستمر النموذج الكبير في التطور ، وما يبقى دون تغيير هو التكرار التقني الذي يقف وراءه ، أي خوارزمية تدريب النموذج.
أحدث نموذج تراه كل يوم هو مجرد نتيجة قوية. ما يهم هو ما إذا كانت خوارزمية تدريب النموذج متطورة ، وما إذا كانت التكلفة مخفضة بشكل فعال ، وما إذا كانت القدرة الكامنة وراءها قابلة للتفسير والتحكم.
لذلك ، كمنظمة منصة ، ما يتعين على Zhiyuan القيام به هو الجمع بين خوارزميات نماذج التدريب في الصناعة في كل تكراري.
هذا العمل ضروري.لا تعمل Zhiyuan فقط على خوارزمية النموذج واسع النطاق نفسها ، ولكنها تنفق أيضًا المزيد من الوقت والطاقة في تطوير النظام الفني للنموذج واسع النطاق.
على سبيل المثال ، أطلقت Zhiyuan منصة خدمات الحوسبة السحابية واسعة النطاق "Jiuding Smart Computing Platform" لتوفير قوة الحوسبة والبيانات ودعم الخوارزمية لتدريب النماذج على نطاق واسع.
بالطبع ، ليس فقط قوة Zhiyuan الخاصة ، ولكن أيضًا معاهد البحوث الجامعية والصناعية للتعاون والتكرار بطريقة منفتحة.
في شهر مارس من هذا العام ، أصدرت Zhiyuan نظام المصدر المفتوح لتكنولوجيا النموذج واسع النطاق FlagOpen Feizhi ، وهو نظام برمجيات مفتوح المصدر ومفتوح للنماذج واسعة النطاق التي تم بناؤها بالاشتراك مع عدد من وحدات الصناعة والجامعة والأبحاث.
كما قال Dean Huang Tiejun ، "نأمل الآن بعد أن أصبح النموذج الكبير القوة الرائدة في تطوير صناعة الذكاء الاصطناعي ، سنبذل المزيد من العمل الداعم في المستقبل ونساهم بقوة فريدة في هذا العصر."
قد تسأل ، ما هي أكبر ميزة لمؤتمر Zhiyuan هذا العام مقارنة بالمؤتمرات السابقة؟
الأسلوب متناسق ، ويتلخص في كلمتين: احترافي ونقي.
تم عقد مؤتمر Zhiyuan دون أي أهداف واقعية ، ولم يلتفت إلى المنتجات والمستثمرين.
هنا ، يمكن لقادة الصناعة طرح آراء شخصية وإصدار أحكام من منظور مهني ، وبالطبع تضمين تصادمات ومناقشات حول آراء كبار ، دون الحاجة إلى مراعاة العديد من العوامل الواقعية.
"الأب الروحي للذكاء الاصطناعي" ، شارك جيفري هينتون في مؤتمر Zhiyuan لأول مرة هذا العام.قبل بعض الوقت ، استقال من Google لأنه نادم على عمل حياته. نشر آخر الآراء حول سلامة الذكاء الاصطناعي.
كما هو الحال دائمًا ، لن يقلق Yann LeCun ، "المتفائل" ، بشأن مخاطر الذكاء الاصطناعي مثل معظم الناس. في رأيه ، من غير المعقول أن يتم الفرامل قبل تصنيع السيارة. في الوقت الحالي ، ما زلنا بحاجة إلى العمل الجاد لتطوير تقنية وخوارزميات ذكاء اصطناعي أكثر تقدمًا.
في الوقت نفسه ، سترى أيضًا مواجهة شرسة في وجهات النظر في الاجتماع. Max Tegmark بشأن التحكم في مخاطر الذكاء الاصطناعي. على الرغم من أنه لا يمكن القول أنه مخالف تمامًا لـ LeCun ، إلا أن هناك أيضًا اختلافات كبيرة.
هذا هو أهم ما يميز مؤتمر Zhiyuan ، وهو أيضًا أسلوب ثابت.
أصبح تفرد هذا الوضع أكثر وأكثر أهمية في السنوات الأخيرة.
تطور الذكاء الاصطناعي له تأثير متزايد على العالم والصين ، لذلك يحتاج الجميع إلى فرصة للتعبير عن آرائهم بطريقة صافية ، بما في ذلك الاصطدامات الأيديولوجية والنقاشات الساخنة.
تكمن أهمية ذلك في أنه كلما كانت المؤتمرات أكثر احترافًا ونقاءً وحيادية وانفتاحًا ، كلما كان من الأفضل للجميع فهم مثل هذا العصر من التطور السريع.
في الدول الأجنبية ، يتمتع مؤتمر Zhiyuan أيضًا بسمعة ممتازة ، حيث تعتبر المنظمات الدولية مؤتمر Zhiyuan بمثابة نافذة للتعاون مع الصين في أبحاث الذكاء الاصطناعي.
أصل الاسم Zhiyuan هو أيضًا مصدر الذكاء. لذلك ، أصبح عقد مؤتمر Zhiyuan حدثًا بارزًا لتعزيز التنمية البيئية للذكاء الاصطناعي.
أدت التشكيلة القوية من الضيوف وثراء إعداد الموضوع وعمق مناقشات المحتوى إلى إنشاء مؤتمر Zhiyuan فريد من نوعه.
أصبح هذا الحدث المهم الحصري لخبراء الذكاء الاصطناعي بمثابة بطاقة أعمال مشرقة في مجال الذكاء الاصطناعي في الصين.
مراجع:
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
لاول مرة سام التمان وهينتون في الصين! تم الانتهاء بنجاح من حدث خبراء الذكاء الاصطناعي الأكثر تشددًا في الصين ، وكان النموذج المحلي واسع النطاق "Enlightenment 3.0" مفتوح المصدر بالكامل
** المصدر: ** Xinzhiyuan
الآن فقط ، اختتم مؤتمر Zhiyuan المحلي السنوي "مهرجان الربيع AI" بنجاح!
في هذا الحدث السنوي الذروة للذكاء الاصطناعي ، هناك فرق نجوم مألوفة مثل OpenAI و DeepMind و Anthropic و HuggingFace و Midjourney و Stability AI وما إلى ذلك ، وهناك Meta و Google و Microsoft وغيرها من الشركات المصنعة الكبرى التي غزت العالم ، وهناك هي جامعات ستانفورد وجامعة كاليفورنيا في بيركلي ومعهد ماساتشوستس للتكنولوجيا وغيرها من أفضل الجامعات في العالم.
حضر مؤلفو الأعمال المهمة مثل GPT-4 و PaLM-E و OPT و LLaMA وما إلى ذلك جميعًا وشرحوا لنا نتائج البحث. يمكن القول أن هذا المؤتمر يتمتع بالعمق المهني والإلهام الإبداعي ، وقد تمت مناقشة كل موضوع إلى أقصى الحدود.
كانت ذروة المؤتمر بلا شك خطابات يان ليكون الحائز على جائزة تورينج ، وجيفري هينتون ، ومؤسس OpenAI Sam Altman.
** جيفري هينتون: خطر الذكاء الاصطناعي الخارق أمر ملح **
في الكلمة الرئيسية الختامية للمنتدى التي اختتمت لتوها ، تصور هينتون ، الحائز على جائزة تورينج وأب التعلم العميق ، سيناريو يستحق التفكير فيه بالنسبة لنا.
نعم ، في رأيه ، يمكن أن يحدث ذلك قريبًا.
كما هو الحال منذ بعض الوقت ، استقال هينتون من Google وشرح أسباب استقالته باختصار. لقد تحدث عن ندمه على عمل حياته ومخاوفه من مخاطر الذكاء الاصطناعي. لقد صرح مرارًا وتكرارًا علنًا أن مخاطر الذكاء الاصطناعي على العالم أكثر إلحاحًا من تغير المناخ.
وبالمثل ، في مؤتمر Zhiyuan ، تحدث Hinton عن مخاطر الذكاء الاصطناعي مرة أخرى.
ماذا لو تمكنت شبكة عصبية كبيرة تعمل على أجهزة كمبيوتر رقمية متعددة من اكتساب المعرفة مباشرة من العالم ، بالإضافة إلى تقليد اللغة البشرية من أجل المعرفة البشرية؟
هذه الفكرة ليست بعيدة المنال ، إذا كان بإمكان هذه الشبكة العصبية إجراء نمذجة غير خاضعة للإشراف للصور أو مقاطع الفيديو ، ويمكن لنسخها أيضًا التلاعب بالعالم المادي.
إذا سُمح للذكاء الخارق بصياغة أهداف فرعية خاصة به ، أحد الأهداف الفرعية هو اكتساب المزيد من القوة ، فإن الذكاء الخارق سيتلاعب بالبشر الذين يستخدمونه من أجل تحقيق هذا الهدف.
** Zhang Hongjiang and Sam Altman Peak Q & A: AGI قد يظهر في غضون عشر سنوات **
هذا الصباح ، ظهر سام التمان أيضًا عبر رابط الفيديو. هذه هي المرة الأولى التي يلقي فيها Sam Altman خطابًا عامًا في الصين بعد انفجار ChatGPT.
السبب وراء تأثير ثورة الذكاء الاصطناعي الحالية ليس فقط في حجم تأثيرها ، ولكن أيضًا في سرعة التقدم. هذا يجلب كل من الأرباح والمخاطر.
مع ظهور أنظمة الذكاء الاصطناعي القوية بشكل متزايد ، أصبح تعزيز التعاون الدولي وبناء الثقة العالمية أمرًا بالغ الأهمية.
المحاذاة لا تزال قضية مفتوحة. أكملت GPT-4 أعمال المحاذاة في الأشهر الثمانية الماضية ، بما في ذلك بشكل أساسي قابلية التوسع وقابلية الشرح.
في خطابه ، أكد ألتمان مرارًا وتكرارًا على ضرورة التوافق والإشراف على أمن الذكاء الاصطناعي العالمي ، واقتبس على وجه التحديد جملة من تاو تي تشينغ:
من وجهة نظره ، يتطور الذكاء الاصطناعي بسرعة هائلة ، وقد يظهر الذكاء الاصطناعي الفائق في السنوات العشر القادمة.
لذلك ، من الضروري تعزيز سلامة الذكاء الاصطناعي العام ، وتقوية التعاون الدولي ، ومواءمة عمليات النشر البحثية ذات الصلة.
يعتقد سام التمان أن التعاون في المجتمع العلمي والتكنولوجي الدولي هو الخطوة الأولى لاتخاذ خطوة بناءة في الوقت الحالي. على وجه الخصوص ، يجب تحسين آليات الشفافية ومشاركة المعرفة من أجل التقدم التكنولوجي في مجال سلامة الذكاء الاصطناعي العام.
بالإضافة إلى ذلك ، ذكر ألتمان أن هدف البحث الرئيسي الحالي لـ OpenAI يركز على أبحاث محاذاة الذكاء الاصطناعي ، أي كيفية جعل الذكاء الاصطناعي مساعدًا مفيدًا وآمنًا.
في النهاية ، تهدف OpenAI إلى تدريب أنظمة الذكاء الاصطناعي للمساعدة في مواءمة البحث.
بعد الخطاب ، افتتح Zhang Hongjiang ، رئيس معهد Zhiyuan للأبحاث ، وسام ألتمان حوارًا جويًا لمناقشة كيفية جعل محاذاة آمنة للذكاء الاصطناعي.
بالإضافة إلى ذلك ، قال أيضًا أنه لن يكون هناك GPT-5 في أي وقت قريب.
بعد الاجتماع ، أصدر ألتمان رسالة للتعبير عن امتنانه لدعوته لإلقاء كلمة في مؤتمر Zhiyuan.
** LeCun: لا يزال معجبًا بالموديل العالمي **
الحائز على جائزة تورينغ آخر ، LeCun ، الذي تحدث في اليوم الأول ، استمر في الترويج لمفهومه الخاص "بالنموذج العالمي".
وأوضح أن الذكاء الاصطناعي لا يمكنه التفكير والتخطيط مثل البشر والحيوانات ، ويرجع ذلك جزئيًا إلى أن أنظمة التعلم الآلي الحالية لها بشكل أساسي خطوات حسابية ثابتة بين المدخلات والمخرجات.
كيف يمكن للآلة أن تفهم كيف يعمل العالم ، وتتنبأ بعواقب أفعال مثل البشر ، أو تقسمها إلى خطوات متعددة للتخطيط لمهام معقدة؟
قال LeCun إنه قرر أن التحديات الرئيسية الثلاثة للذكاء الاصطناعي في السنوات القليلة المقبلة هي تعلم تمثيل العالم ، والتنبؤ بالنموذج العالمي ، واستخدام التعلم تحت الإشراف الذاتي.
قد يكون المفتاح لبناء الذكاء الاصطناعي على المستوى البشري هو القدرة على تعلم "نموذج عالمي".
من بينها ، يتكون "النموذج العالمي" من ست وحدات مستقلة ، بما في ذلك: وحدة التكوين ، وحدة الإدراك ، النموذج العالمي ، وحدة التكلفة ، وحدة الممثل ، ووحدة الذاكرة قصيرة المدى.
عندما سُئل عما إذا كان نظام الذكاء الاصطناعي يشكل خطرًا وجوديًا على البشر ، قال LeCun إنه ليس لدينا ذكاء اصطناعي فائق حتى الآن ، فكيف يمكننا جعل نظام الذكاء الاصطناعي الفائق آمنًا؟
** أفضل مطابقة "حدث خبراء الذكاء الاصطناعي" **
يمكن القول إن مؤتمر Zhiyuan القوي لعام 2023 هو المؤتمر الأعلى مستوى والأكثر مشاهدة في مجال الذكاء الاصطناعي المحلي هذا العام.
منذ بداية تأسيسه ، كانت الخصائص الأساسية لمؤتمر Zhiyuan واضحة جدًا: أكاديمية ، مهنية ، متطورة.
في غمضة عين ، وصل هذا الحدث السنوي لخبراء الذكاء الاصطناعي إلى عامه الخامس.
هذه المرة ، يواصل مؤتمر Zhiyuan 2023 تقليد كل مؤتمر Zhiyuan ، ولا يزال الشعور بالجو الأكاديمي ساحقًا.
في عام 2022 ، شارك اثنان من الفائزين بجائزة تورينج ، يان لوكون وأدي شامير ، والد التعلم المعزز ريتشارد ساتون ، والأكاديمي من الولايات المتحدة مايكل جوردان ، وسينثيا دورك الحائزة على جائزة جوديل ، وغيرهم من الشخصيات الثقيلة.
وبحلول عام 2023 ، ستكون بلا شك الجلسة "الأكثر رواجًا بالنجوم".
هناك 4 فائزين بجائزة تورينج ، يان ليكون ، وجيفري هينتون ، وجوزيف سيفاكيس ، وياو كيجي ، بالإضافة إلى مؤسس OpenAI Sam Altman ، والحائز على جائزة نوبل ، أريه وارسيل ، ومؤسس معهد Future Life ، Max Tegmark ، والأكاديميون Zheng Nanning الحائز على جائزة الإنجاز العليا لعام 2022. والأكاديمي تشانغ بو من الأكاديمية الصينية للعلوم.
"التنوير 3.0" هو سلسلة من النماذج واسعة النطاق.
على وجه التحديد ، يتضمن سلسلة النماذج واسعة النطاق بلغة Aquila ، ونظام تقييم النموذج الكبير Flag ، وسلسلة النماذج المرئية واسعة النطاق "Enlightenment · Vision" ، وسلسلة النماذج واسعة النطاق متعددة الوسائط.
** سلسلة طرازات اللغة الكبيرة **
** التنوير · Aquila: رخصة تجارية مفتوحة بالكامل **
أول ما يظهر هو سلسلة Aquila للنماذج الكبيرة ، وهي أول نماذج كبيرة بلغة مفتوحة المصدر مع معرفة ثنائية اللغة باللغتين الصينية والإنجليزية لدعم متطلبات الامتثال للبيانات المحلية ، ولديها تراخيص تجارية مفتوحة بالكامل.
يتضمن هذا المصدر المفتوح النموذج الأساسي المكون من 7 مليارات معلمة و 33 مليار معلمة ، ونموذج حوار AquilaChat ، ونموذج توليد "شفرة نصية" AquilaCode.
** أداء أقوى **
من الناحية الفنية ، يرث نموذج Aquila الأساسي (7B ، 33B) تقنيًا مزايا التصميم المعماري لـ GPT-3 و LLaMA وما إلى ذلك ، ويحل محل مجموعة من تطبيقات المشغل ذات المستوى الأدنى الأكثر كفاءة ، ويعيد تصميم وتنفيذ رمز ثنائي اللغة صيني-إنجليزي ، The تمت ترقية طريقة التدريب المتوازي BMTrain ، وفي عملية تدريب Aquila ، تكون كفاءة التدريب أعلى بحوالي 8 مرات من كفاءة Magtron + DeepSpeed ZeRO-2.
على وجه التحديد ، الأول هو الاستفادة من تقنية جديدة لتسريع إطار التدريب بشكل متوازٍ.
في العام الماضي ، استعانت Zhiyuan بمصدر مفتوح لمشروع خوارزمية نموذج كبير مفتوح المصدر FlagAI ، والذي دمج طريقة تدريب موازية جديدة مثل BMTrain. أثناء عملية التدريب ، يتم تحسين الحساب والتواصل بالإضافة إلى المشكلات المتداخلة.
ثانيًا ، أخذت Zhiyuan زمام المبادرة في إدخال تقنية تحسين المشغل ، ودمجها مع طرق تسريع متوازية لزيادة تسريع الأداء.
** تعلم اللغة الصينية والإنجليزية في نفس الوقت **
لماذا يعتبر إطلاق أكويلا مشجعًا جدًا؟
نظرًا لأن العديد من النماذج الكبيرة "تتعلم اللغة الإنجليزية فقط" - تعتمد فقط على قدر كبير من تدريب مجموعة اللغة الإنجليزية ، ولكن يتعين على أكويلا تعلم اللغتين الصينية والإنجليزية.
ربما تكون قد اختبرت ذلك بنفسك: عندما يتعلم المرء المعرفة ، فلا توجد مشكلة إذا واصلت استخدام اللغة الإنجليزية طوال الوقت ، ولكن إذا تعلمت اللغة الإنجليزية ثم تعلمت الصينية ، فستكون الصعوبة هائلة.
لذلك ، بالمقارنة مع النماذج المعتمدة على اللغة الإنجليزية مثل LLaMA و OPT ، زادت صعوبة تدريب Aquila ، التي تحتاج إلى تعلم كل من المعرفة الصينية والإنجليزية ، عدة مرات.
من أجل تحسين Aquila للمهام الصينية ، وضعت Zhiyuan ما يقرب من 40 ٪ من الكوادر الصينية في مجموعة التدريب الخاصة بها. والسبب هو أن Zhiyuan يأمل ألا تتمكن Aquila من توليد اللغة الصينية فحسب ، بل يمكنها أيضًا فهم الكثير من المعرفة المحلية بالعالم الصيني.
بالإضافة إلى ذلك ، أعادت Zhiyuan أيضًا تصميم وتنفيذ الرمز المميز ثنائي اللغة الصينية-الإنجليزية (الرمز المميز) ، والذي يهدف إلى التعرف على تجزئة الكلمات الصينية ودعمها بشكل أفضل.
في عملية التدريب والتصميم ، للمهام الصينية ، يزن فريق Zhiyuan عن عمد بُعدي الجودة والكفاءة لتحديد حجم الرمز المميز.
نموذج حوار AquilaChat (7B ، 33B) المبني على أساس نموذج Aquila الأساسي يدعم الحوار النصي السلس ومهام إنشاء متعدد اللغات.
بالإضافة إلى ذلك ، من خلال تحديد مواصفات التعليمات الخاصة القابلة للتوسيع ، يمكن استخدام AquilaChat للاتصال بنماذج وأدوات أخرى ، ومن السهل توسيعها.
على سبيل المثال ، يتم استخدام نموذج إنشاء النص والصورة متعدد اللغات AltDiffusion مفتوح المصدر بواسطة Zhiyuan لتحقيق إمكانات إنشاء نص وصور سلسة. من خلال التعاون مع نموذج الرسم البياني فينسنت الذي يمكن التحكم فيه متعدد الخطوات من Zhiyuan InstructFace ، يمكنه أيضًا تحقيق تحرير متعدد الخطوات يمكن التحكم فيه لصور الوجه بسهولة.
نموذج توليد "كود النص" AquilaCode-7B ، استنادًا إلى قدرات النموذج الأساسية القوية لـ Aquila-7B ، يحقق أداءً عاليًا مع مجموعة بيانات صغيرة وكمية صغيرة من المعلمات. وهو حاليًا أفضل نموذج كود مفتوح المصدر يدعم اللغة الصينية والأداء ثنائي اللغة باللغة الإنجليزية: بعد تصفية عالية الجودة ، يتم إجراء التدريب باستخدام بيانات كود التدريب مع تراخيص مفتوحة المصدر متوافقة.
** مواد صينية أكثر توافقًا ونظافة **
بالمقارنة مع النماذج الأجنبية مفتوحة المصدر ، فإن الميزة الأكثر تميزًا لـ Aquila هي أنها تدعم متطلبات الامتثال للبيانات المحلية.
قد يكون للنماذج الأجنبية واسعة النطاق قدرات صينية معينة ، ولكن يتم استخراج جميع بيانات الإنترنت الصينية تقريبًا التي تستخدمها النماذج الأجنبية مفتوحة المصدر واسعة النطاق من مجموعات بيانات الإنترنت مثل الزحف المشترك.
ومع ذلك ، إذا قمنا بتحليل مجموعة الزحف المشتركة ، يمكننا أن نجد أن هناك أقل من 40 ألف صفحة ويب صينية متاحة في 1 مليون إدخال ، و 83٪ منها مواقع خارجية ، ومن الواضح أنه لا يمكن التحكم في الجودة.
لذلك ، لم تستخدم Aquila أي مجموعة نصية صينية في الزحف المشترك ، ولكنها استخدمت مجموعة بيانات Wudao الخاصة بـ Zhiyuan والتي تراكمت على مدار السنوات الثلاث الماضية. تأتي مجموعة بيانات Wudao Chinese من أكثر من 10000 موقع ويب صيني رئيسي ، لذا فإن بياناتها الصينية تفي بمتطلبات الامتثال وهي أكثر نظافة.
بشكل عام ، هذا الإصدار هو مجرد نقطة بداية. هدف Zhiyuan هو إنشاء مجموعة كاملة من تطور النموذج الكبير وخطوط التكرار ، بحيث يستمر النموذج الكبير في النمو مع إضافة المزيد من البيانات والمزيد من الإمكانات ، وسيستمر لتكون مفتوحة المصدر ومفتوحة.
تجدر الإشارة إلى أن Aquila متاح على بطاقات الرسومات الاستهلاكية. على سبيل المثال ، يمكن تشغيل طراز 7B على 16 جيجا أو حتى ذاكرة فيديو أصغر.
** نظام تقييم نموذج كبير للمكتبة (فلاج) **
إن نظام تقييم النماذج الآمنة والموثوق والشامل والموضوعي واسع النطاق مهم أيضًا للابتكار التكنولوجي والتنفيذ الصناعي للنماذج واسعة النطاق.
بادئ ذي بدء ، بالنسبة للمجتمع الأكاديمي ، إذا كنت ترغب في تعزيز ابتكار النماذج الكبيرة ، يجب أن يكون لديك مسطرة لقياس قدرات وجودة النماذج الكبيرة.
ثانيًا ، بالنسبة للصناعة ، ستختار الغالبية العظمى من الشركات الاستخدام المباشر للنماذج الكبيرة الحالية بدلاً من تطويرها من نقطة الصفر. عند الاختيار ، هناك حاجة إلى نظام تقييم للمساعدة في الحكم. بعد كل شيء ، تعتمد النماذج الكبيرة الأساسية المطورة ذاتيًا على تكاليف طاقة الحوسبة الضخمة. لتطوير نموذج يحتوي على 30 مليار معلمة ، تشمل الأموال المطلوبة قوة الحوسبة والبيانات وما إلى ذلك ، 20 مليونًا على الأقل.
بالإضافة إلى ذلك ، ما إذا كان من الممكن بناء نظام تقييم نموذجي شامل واسع النطاق لـ "التقييم الآلي + التقييم الذاتي اليدوي" ، وإدراك الحلقة المغلقة التلقائية من نتائج التقييم إلى تحليل القدرة النموذجية ، ومن ثم نمذجة تحسين القدرة ، أصبح جانبًا هامًا من جوانب ابتكار النماذج الأساسية واسعة النطاق.
من أجل حل نقطة الألم هذه ، اختار معهد Zhiyuan للأبحاث إعطاء الأولوية لإطلاق نظام تقييم النماذج واسع النطاق الميزان (Flag) والمنصة المفتوحة (flag.baai.ac.cn).
على وجه التحديد ، يبني نظام تقييم نموذج Flag واسع النطاق بشكل مبتكر إطار تقييم ثلاثي الأبعاد لـ "مؤشر مهمة القدرة" ، والذي يمكن أن يصف بدقة حدود القدرة المعرفية للنموذج الأساسي وتصور نتائج التقييم.
في الوقت الحالي ، يشتمل نظام تقييم نموذج Flag واسع النطاق على ما مجموعه 600+ من أبعاد التقييم ، بما في ذلك 22 مجموعة بيانات تقييم و 84،433 سؤالاً ، ويتم دمج المزيد من مجموعات بيانات التقييم الأبعاد تدريجياً.
بالإضافة إلى ذلك ، سيستمر نظام تقييم نموذج Flag واسع النطاق في استكشاف البحث متعدد التخصصات بين تقييم نموذج اللغة على نطاق واسع والتخصصات الاجتماعية مثل علم النفس والتعليم والأخلاق ، من أجل تقييم النماذج اللغوية واسعة النطاق بشكل أكثر شمولاً وعلمية. .
** سلسلة النماذج الكبيرة المرئية **
فيما يتعلق برؤية الكمبيوتر ، أنشأ فريق Enlightenment 3.0 سلسلة "Enlightenment Vision" من النماذج الكبيرة ذات الإدراك العام للمشهد وقدرات معالجة المهام المعقدة.
من بينها ، تقنية SOTA لهذه الدفقات الست التي تبني الأساس الأساسي لـ "رؤية التنوير":
نموذج كبير متعدد الوسائط "Emu" ، نموذج كبير تم تدريبه مسبقًا "EVA" ، نموذج مرئي عام متعدد المهام "رسام" ، نموذج تجزئة للرؤية العامة ، نموذج كبير للتدريب المسبق على الرسم "EVA-CLIP" وتقنية تحرير الفيديو "vid2vid-zero ".
** 1. Emu: إكمال كل شيء بتسلسل متعدد الوسائط **
بعد اكتمال التدريب ، يمكن لـ Emu إكمال كل شيء في سياق التسلسلات متعددة الوسائط ، وإدراك وسبب وتوليد بيانات من طرائق مختلفة مثل الصور والنصوص ومقاطع الفيديو ، وجولات متعددة كاملة من حوارات النص الرسومي وعدد قليل من الرسوم البيانية. - فهم النص ، سؤال وجواب الفيديو ، إنشاء نص إلى صورة ، إنشاء صورة إلى صورة ومهام أخرى متعددة الوسائط.
** 2. EVA: أقوى نموذج أساسي مرئي بمستوى مليار **
عنوان الورق:
تجمع EVA بين نموذج التعلم الدلالي (CLIP) وطريقة تعلم الهيكل الهندسي (MIM) ، وتوسع نموذج ViT القياسي إلى مليار معلمة للتدريب. في ضربة واحدة ، حققت أقوى أداء في ذلك الوقت في مجموعة واسعة من مهام الإدراك البصري مثل تصنيف ImageNet واكتشاف COCO وتجزئة وتصنيف الفيديو الحركي.
** 3. EVA-CLIP: أقوى نموذج CLIP مفتوح المصدر **
عنوان الورق:
تم تطوير EVA-CLIP مع النموذج المرئي الأساسي EVA باعتباره جوهرًا ، وقد تم تكرارها إلى 5 مليارات معلمة.
بالمقارنة مع OpenCLIP السابق بمعدل دقة 80.1٪ ، فإن نموذج EVA-CLIP لديه معدل دقة يبلغ 82.0٪ في ImageNet1K صفر عينة أعلى 1. من حيث دقة ImageNet kNN ، فإن أحدث طراز DINOv2 من Meta على قدم المساواة مع 1 مليار معامل EVA-CLIP.
** 4. الرسام: المسار التكنولوجي الأول "التعلم عبر الصور السياقية" **
عنوان الورق:
الفكرة الأساسية للنموذج المرئي العام نمذجة الرسام "تتمحور حول الرؤية" ، وباستخدام الصور كمدخلات ومخرجات ، يتم الحصول على المعلومات المرئية السياقية لإكمال المهام المرئية المختلفة.
** 5. نموذج التقسيم العالمي للآفاق: الكل في واحد ، تقسيم كل شيء **
لتوضيح الأمر ببساطة ، يقوم المستخدمون بتحديد فئة من الكائنات على الشاشة والتعرف عليها ، ويمكنهم تحديد الكائنات المتشابهة وتقسيمها على دفعات ، سواء في الشاشة الحالية أو في الشاشات أو بيئات الفيديو الأخرى.
** 6. vid2vid-zero: أول تقنية في المجال لتعديل الفيديو باستخدام عينة صفرية **
رابط الورق:
موقع تجريبي:
تستخدم تقنية تحرير الفيديو ذات العينة الصفرية "vid2vid-zero" الخصائص الديناميكية لآلية الانتباه لأول مرة ، جنبًا إلى جنب مع نموذج نشر الصورة الحالي ، لإنشاء إطار نموذجي لتحرير الفيديو بدون تدريب إضافي مسبق للفيديو. الآن ، فقط قم بتحميل مقطع فيديو ، ثم أدخل سلسلة من المطالبات النصية ، يمكنك تحرير الفيديو بسمات محددة.
** المستنير لأبحاث النماذج الصينية واسعة النطاق **
تأسس معهد Zhiyuan للأبحاث في نوفمبر 2018 ، وهو رائد أبحاث النماذج واسعة النطاق في الصين.بعد خمس سنوات من التطوير ، أصبح معيارًا لأبحاث النماذج واسعة النطاق في الصين.
ما يجعله مختلفًا عن المؤسسات الأخرى هو أن Zhiyuan Research Institute هو مؤسسة منصة. في بداية إنشائه ، اتخذ معهد Zhiyuan للأبحاث إنشاء نظام إيكولوجي للذكاء الاصطناعي كأحد مهامه ومهامه الأساسية.
كيف عززت Zhiyuan تطوير البحوث النموذجية واسعة النطاق في الصين منذ إنشائها؟
بالحديث عن ذلك ، فإن الاتجاه الرئيسي لبحوث OpenAI الذي تم إنشاؤه في عام 2015 هو استكشاف الطريق إلى الذكاء الاصطناعي العام ، وهو ليس نموذجًا كبيرًا.
بعد عام 2018 ، بدأت OpenAI في التركيز على الطرز الكبيرة ، وأصدرت GPT مع 117 مليون معلمة في يونيو. في نفس العام ، أصدرت Google أيضًا نموذجًا لغويًا واسع النطاق مدربًا مسبقًا BERT مع 300 مليون معلمة.
لاحظ الجميع أن اتجاه الصناعة بأكمله واتجاه التكنولوجيا في عام 2018 هو صنع نموذج أكبر.
مع زيادة قوة الحوسبة التي يستخدمها النموذج ، يصبح قانون مور ما يسمى بـ "القانون النموذجي" ، أي أن قوة الحوسبة المستخدمة لتدريب نموذج كبير تتضاعف في غضون 3-4 أشهر.
نتيجة لذلك ، في عام 2021 ، أصدرت Zhiyuan نموذجين كبيرين على التوالي من Enlightenment 1.0 و Enlightenment 2.0.
وفقًا لهوانغ تيجون ، في المؤتمر الصحفي التنوير 1.0 في مارس 2021 ، حكمت Zhiyuan Research أن الذكاء الاصطناعي قد تغير من "نموذج كبير" إلى مرحلة جديدة من "النموذج الكبير". ومنذ ذلك الحين ، أصبح مفهوم "النموذج الكبير" دخلت الرؤية العامة.
في كل عام في مؤتمر Zhiyuan ، سيتم سرد الطرق الفنية الثلاثة الرئيسية لتسلق ذروة الذكاء الاصطناعي العام: النماذج الكبيرة ، وذكاء الحياة و AI4Science. هذه الطرق الثلاثة ليست معزولة ، فهي تتفاعل وتؤثر على بعضها البعض.
تحتوي البيانات اللغوية نفسها على معرفة وذكاء ثريين ، يتم استخراجهما من خلال نماذج واسعة النطاق ، وتُستخدم الشبكات العصبية للتعبير عن القوانين الكامنة وراء البيانات المعقدة.
هذا سبب معقول لماذا يمكن أن يؤدي أحد المسارات الفنية للنموذج الكبير إلى الذكاء الاصطناعي العام.
وهذا يفسر أيضًا سبب تركيز Zhiyuan في البداية على النموذج الكبير. في مارس 2021 ، تم إصدار Enlightenment 1.0 ، تلاه Enlightenment 2.0 في يونيو.
بالإضافة إلى ذلك ، بالإضافة إلى الطراز الكبير ، تقوم Zhiyuan أيضًا باستمرار باستكشاف الطريقين الآخرين المؤديين إلى AGI و "Life Intelligence" و "AI4Science".
في عام 2022 ، أصدرت Zhiyuan المحاكاة الأكثر دقة لـ Caenorhabditis elegans. هذه المرة ، افتتح Zhiyuan منصة محاكاة الحياة "eVolution-eVolution" المستخدمة في دراسة الديدان الخيطية الاصطناعية لتقديم خدمات عبر الإنترنت.
Tianyan عبارة عن منصة محاكاة شبكة عصبونية دقيقة وواسعة النطاق مع أربع ميزات بارزة: النظام الأساسي الأكثر كفاءة لمحاكاة شبكة الخلايا العصبية الدقيقة ؛ دعم محاكاة الشبكة العصبية واسعة النطاق للغاية ؛ توفير مجموعة أدوات محاكاة ومحاكاة عبر الإنترنت. ؛ يدعم التفاعل المرئي عالي الجودة المحاكاة في الوقت الفعلي والتشغيل التعاوني المرئي.
استنادًا إلى منصة Tianyan ، فهي تدرك محاكاة عالية الدقة للذكاء البيولوجي ، وتستكشف جوهر الذكاء ، وتعزز الذكاء الاصطناعي العام المستوحى من علم الأحياء. علاوة على ذلك ، قام فريق Tianyan بتوصيل Tianyan بالجيل الجديد من أجهزة الكمبيوتر العملاقة في بلدي - الجيل الجديد من أجهزة الكمبيوتر العملاقة Tianhe.
من خلال النشر والتشغيل الناجح لـ "Tianyan-Tianhe" ، يمكن تحقيق محاكاة نماذج مثل شبكة القشرة المرئية الدقيقة لدماغ الماوس V1 ، ويمكن تقليل استهلاك الطاقة الحسابية بأكثر من 10 مرات ، ويمكن لسرعة الحساب يمكن زيادتها بأكثر من 10 مرات ، لتصل إلى أقصى حد في العالم. يضع أداء محاكاة شبكة الخلايا العصبية الدقيقة أساسًا متينًا لتحقيق محاكاة دقيقة للدماغ البشري بأكمله.
الآن ، بعد عامين ، أصدرت Zhiyuan سلسلة Enlightenment 3.0 من الطرز الكبيرة مرة أخرى.
فيما يتعلق بالموقع ، منذ إصدار Enlightenment 2.0 ، فإن Zhiyuan ، كمنظمة منصة غير ربحية ، لا تصنع النماذج والنماذج فحسب ، بل تقدم أيضًا بشكل تدريجي مساهمات فريدة في بناء البيئة الأساسية للنماذج الكبيرة.
من بينها ، يتضمن فرز البيانات خلف النموذج ، واختبار النموذج ، واختبار الخوارزمية ، والمؤسسات المفتوحة المصدر والمفتوحة ، والتخطيط الشامل لمنصات طاقة الحوسبة.
لماذا قام Zhiyuan بإجراء مثل هذا التغيير؟
لأن Zhiyuan تدرك بعمق أن النموذج الكبير نفسه ليس هو شكل المنتج الأكثر أهمية في عصر النموذج الكبير ، ولكنه حقبة جديدة تتميز بالتنظيم والخدمات الفكرية.
في الوقت الحاضر ، سيستمر النموذج الكبير في التطور ، وما يبقى دون تغيير هو التكرار التقني الذي يقف وراءه ، أي خوارزمية تدريب النموذج.
أحدث نموذج تراه كل يوم هو مجرد نتيجة قوية. ما يهم هو ما إذا كانت خوارزمية تدريب النموذج متطورة ، وما إذا كانت التكلفة مخفضة بشكل فعال ، وما إذا كانت القدرة الكامنة وراءها قابلة للتفسير والتحكم.
لذلك ، كمنظمة منصة ، ما يتعين على Zhiyuan القيام به هو الجمع بين خوارزميات نماذج التدريب في الصناعة في كل تكراري.
هذا العمل ضروري.لا تعمل Zhiyuan فقط على خوارزمية النموذج واسع النطاق نفسها ، ولكنها تنفق أيضًا المزيد من الوقت والطاقة في تطوير النظام الفني للنموذج واسع النطاق.
على سبيل المثال ، أطلقت Zhiyuan منصة خدمات الحوسبة السحابية واسعة النطاق "Jiuding Smart Computing Platform" لتوفير قوة الحوسبة والبيانات ودعم الخوارزمية لتدريب النماذج على نطاق واسع.
بالطبع ، ليس فقط قوة Zhiyuan الخاصة ، ولكن أيضًا معاهد البحوث الجامعية والصناعية للتعاون والتكرار بطريقة منفتحة.
في شهر مارس من هذا العام ، أصدرت Zhiyuan نظام المصدر المفتوح لتكنولوجيا النموذج واسع النطاق FlagOpen Feizhi ، وهو نظام برمجيات مفتوح المصدر ومفتوح للنماذج واسعة النطاق التي تم بناؤها بالاشتراك مع عدد من وحدات الصناعة والجامعة والأبحاث.
قد تسأل ، ما هي أكبر ميزة لمؤتمر Zhiyuan هذا العام مقارنة بالمؤتمرات السابقة؟
الأسلوب متناسق ، ويتلخص في كلمتين: احترافي ونقي.
تم عقد مؤتمر Zhiyuan دون أي أهداف واقعية ، ولم يلتفت إلى المنتجات والمستثمرين.
هنا ، يمكن لقادة الصناعة طرح آراء شخصية وإصدار أحكام من منظور مهني ، وبالطبع تضمين تصادمات ومناقشات حول آراء كبار ، دون الحاجة إلى مراعاة العديد من العوامل الواقعية.
"الأب الروحي للذكاء الاصطناعي" ، شارك جيفري هينتون في مؤتمر Zhiyuan لأول مرة هذا العام.قبل بعض الوقت ، استقال من Google لأنه نادم على عمل حياته. نشر آخر الآراء حول سلامة الذكاء الاصطناعي.
كما هو الحال دائمًا ، لن يقلق Yann LeCun ، "المتفائل" ، بشأن مخاطر الذكاء الاصطناعي مثل معظم الناس. في رأيه ، من غير المعقول أن يتم الفرامل قبل تصنيع السيارة. في الوقت الحالي ، ما زلنا بحاجة إلى العمل الجاد لتطوير تقنية وخوارزميات ذكاء اصطناعي أكثر تقدمًا.
في الوقت نفسه ، سترى أيضًا مواجهة شرسة في وجهات النظر في الاجتماع. Max Tegmark بشأن التحكم في مخاطر الذكاء الاصطناعي. على الرغم من أنه لا يمكن القول أنه مخالف تمامًا لـ LeCun ، إلا أن هناك أيضًا اختلافات كبيرة.
هذا هو أهم ما يميز مؤتمر Zhiyuan ، وهو أيضًا أسلوب ثابت.
أصبح تفرد هذا الوضع أكثر وأكثر أهمية في السنوات الأخيرة.
تطور الذكاء الاصطناعي له تأثير متزايد على العالم والصين ، لذلك يحتاج الجميع إلى فرصة للتعبير عن آرائهم بطريقة صافية ، بما في ذلك الاصطدامات الأيديولوجية والنقاشات الساخنة.
تكمن أهمية ذلك في أنه كلما كانت المؤتمرات أكثر احترافًا ونقاءً وحيادية وانفتاحًا ، كلما كان من الأفضل للجميع فهم مثل هذا العصر من التطور السريع.
في الدول الأجنبية ، يتمتع مؤتمر Zhiyuan أيضًا بسمعة ممتازة ، حيث تعتبر المنظمات الدولية مؤتمر Zhiyuan بمثابة نافذة للتعاون مع الصين في أبحاث الذكاء الاصطناعي.
أصل الاسم Zhiyuan هو أيضًا مصدر الذكاء. لذلك ، أصبح عقد مؤتمر Zhiyuan حدثًا بارزًا لتعزيز التنمية البيئية للذكاء الاصطناعي.
أدت التشكيلة القوية من الضيوف وثراء إعداد الموضوع وعمق مناقشات المحتوى إلى إنشاء مؤتمر Zhiyuan فريد من نوعه.
أصبح هذا الحدث المهم الحصري لخبراء الذكاء الاصطناعي بمثابة بطاقة أعمال مشرقة في مجال الذكاء الاصطناعي في الصين.
مراجع: