DeepSeek: تدريب نموذج الذكاء الاصطناعي R1 لم يتجاوز 300 ألف دولار

قالت شركة ديب سيك (DeepSeek) الصينية إن تدريب نموذجها R1 للذكاء الصناعي لم يتكلف إلا 294 ألف دولار وهو ما يقل كثيراً عن الأرقام الخاصة بمنافساتها الأميركية جاء إعلان الشركة في ورقة بحثية من المرجح أن تشعل الجدل من جديد حيال مكانة بكين في سباق تطوير الذكاء الاصطناعي ظهر هذا التحديث النادر من الشركة التي تتخذ من هانجتشو مقراً لها في مقال بدورية نيتشر" (Nature) الأكاديمية بعد أن خضع لمراجعة النظراء، وهو أول تقدير تصدره الشركة لتكاليف تدريب النموذج R1.

دفع إصدار DeepSeek لما قالت إنها أنظمة ذكاء اصطناعي منخفضة التكلفة في يناير المستثمرين العالميين إلى التخلص من أسهم شركات التكنولوجيا لقلقهم من أن النماذج الجديدة قد تهدد هيمنة الشركات الرائدة في مجال الذكاء الاصطناعي ومنها إنفيديا ومنذ ذلك الحين، توارت الشركة ومؤسسها ليانج وين فنج عن الأنظار إلى حد بعيد، باستثناء طرح بعض تحديثات المنتجات الجديدة.

وجاء في مقال نيتشرالتي أدرجت ليانج كأحد المشاركين في إعداده إن تدريب النموذج R1 الذي يركز على التفكير المنطقي والاستدلال تكلف 294 ألف دولار واستخدم 512 شريحة (إتش800) من التي تطورها إنفيديا ولم تتضمن نسخة سابقة من المقال منشورة في يناير هذه المعلومات.

كما يُعتقد أن R1 هو أول نموذج لغوي كبير يخضع لعملية مراجعة علمية محكمة ويتمثل الابتكار الرئيسي لـ DeepSeek في استخدام نهج تجريبي آلي يُعرف باسم التعلم المعزز النقي لتطوير R1 حيث يُكافأ النموذج عند الوصول إلى إجابات صحيحة بدلاً من تدريبه على أمثلة استدلالية مختارة من قِبَل البشروتقول الشركة إن هذا النهج مكّن النموذج من تطوير استراتيجيات استدلالية ذاتية مثل التحقق من خطواته دون اتباع أساليب بشرية محددة ولتعزيز الكفاءة اعتمد النموذج على تقييم محاولاته ذاتياً باستخدام تقديرات داخلية بدلاً من استخدام خوارزمية منفصلة، وهي تقنية تُعرف باسم "تحسين سياسة المجموعة النسبية.