شركة Cerebras تضع بصمتها بشكل فريد في عالم الذكاء الاصطناعي
كشفت شركة سيريبراس Cerebras عن إطلاقها شريحة WSE-3، أكبر شريحة للذكاء الاصطناعي في العالم، مما سيساهم في مضاعفة الأداء للتدريب المتقدم على نماذج الذكاء الاصطناعي دون زيادة التكاليف.
وطرحت شركة Cerebras Systems محرك Wafer Scale Engine 3 (WSE-3)، والذي يمثل علامة فارقة في تطوير الرقائق المصممة للذكاء الاصطناعي التوليدي (AI).
وجاء الإعلان، الذي صدر في 13 مارس/ آذار اليوم، ليضع WSE-3 كأكبر أشباه الموصلات في العالم، ويهدف إلى تعزيز قدرات نماذج اللغات الكبيرة بعشرات تريليونات من المعلمات. ويأتي هذا التطور في أعقاب السباق المكثف في صناعة التكنولوجيا لإنشاء نماذج ذكاء اصطناعي أكثر قوة وكفاءة.
Cerebras ومنتج جديد لمضاعفة الأداء
وتعمل شريحة WSE-3 على تحسين أداء سابقتها WSE-2 بقدر ضعفين دون زيادة في استهلاك الطاقة أو التكلفة. ويتم الاحتفال بهذا الإنجاز باعتباره أحد الخطوات التي تم تحقيقها وفقا لقانون مور، الذي ينص على أنه من المتوقع أن تصبح دوائر الرقائق أكثر تعقيدا كل 18 شهرا تقريبا.
وبالتالي، فإن شريحة WSE-3، التي تصنعها شركة TSMC، تظهر انخفاضا في حجم الترانزستور من 7 نانومتر إلى 5 نانومتر، مما يزيد من عدد الترانزستور إلى 4 تريليون على شريحة بحجم رقاقة شبه موصل كاملة مقاس 12 بوصة تقريبا. وتؤدي هذه الزيادة إلى مضاعفة القوة الحسابية من 62.5 بيتافلوب إلى 125 بيتافلوب، وبالتالي تحسين كفاءة الشريحة في تدريب نماذج الذكاء الاصطناعي.
المزايا على المنافسين
ويتفوق منتج Cerebras ‘WSE-3 بشكل كبير على معيار الصناعة المنتج من قبل شركة نفيديا H100 GPU من حيث الحجم والذاكرة والقدرات الحسابية. حيث يتميز WSE-3 بعدد أكبر من النوى بـ 52 مرة، وذاكرة أكبر بـ 800 مرة على الرقاقة، وتحسينات كبيرة في عرض النطاق الترددي للذاكرة وعرض النطاق الترددي للنسيج، ويقدم أكبر تحسينات في الأداء تستهدف حسابات الذكاء الاصطناعي على الإطلاق.
وتسمح هذه التحسينات بتدريب شبكات عصبية كبيرة، بما في ذلك نموذج افتراضي مكون من 24 تريليون معلمة على نظام كمبيوتر CS-3 واحد، مما يدل على الإمكانات الهائلة لـ WSE-3 في تسريع تطوير نموذج الذكاء الاصطناعي.
الابتكارات في التدريب والاستدلال على الذكاء الاصطناعي
ويرتبط إصدار WSE-3 بالتحسينات في مرحلتي التدريب والاستدلال لتطوير نموذج الذكاء الاصطناعي. وتؤكد شركة Cerebras على قدرة الشريحة على تبسيط عملية البرمجة نظرا لأنها تتطلب عددا أقل بكثير من أسطر التعليمات البرمجية مقارنة بوحدات معالجة الرسومات لنمذجة GPT-3. إن البساطة التي يمكن من خلالها تجميع وتدريب 2048 جهازا تجعل هذا التصميم قادرا على تدريب نماذج لغوية كبيرة أسرع 30 مرة من الآلات الرائدة الحالية.
كما كشفت Cerebras أيضا عن شراكة مع Qualcomm لتحسين جزء الاستدلال، والذي يتعلق بالتنبؤ بناء على نموذج الذكاء الاصطناعي الذي تم تدريبه. ومن خلال أساليب مثل الندرة وفك التشفير التخميني، تسعى الشراكة إلى تقليل التكاليف الحسابية واستخدام الطاقة لنماذج الذكاء الاصطناعي التوليدية إلى الحد الأدنى.
ونتيجة لذلك، يمثل هذا التعاون خطوة استراتيجية نحو تحسين كفاءة تطبيقات الذكاء الاصطناعي، بدءا من التدريب وحتى النشر في العالم الحقيقي.