وجود شكوك حول استخدام DeepSeek لمخرجات “Gemini” في تدريب نموذج R1-0528

تاريخ النشر: منذ 97 يوم

🖊️ admin

📷 شكوك حول استخدام DeepSeek

في خطوة أثارت الكثير من الجدل، أطلقت شركة **DeepSeek** الصينية نموذجها الجديد **R1-0528**، والذي حقق أداءً متفوقاً في اختبارات البرمجة والرياضيات، لكن التساؤلات بدأت تثار حول مصادر البيانات التي تم استخدامها في تدريب هذا النموذج، حيث يُعتقد أنها قد تكون مستمدة من نماذج **Gemini** التابعة لشركة **Google**،

الاتهامات تتزايد

عزز المطور سام بيتش، المقيم في ملبورن، تلك الشكوك من خلال منشور له على منصة **X**، حيث أشار إلى وجود أدلة تشير إلى أن نموذج DeepSeek يعتمد على مخرجات **Gemini**، بيتش لاحظ أن التعبيرات اللغوية المستخدمة في النموذج الجديد تحمل تشابهات كبيرة مع تلك الموجودة في إصدار **Gemini 2.5 Pro**، مما أثار المزيد من القلق بين المطورين،

تاريخ من التهم السابقة

ليس هذا هو الاتهام الأول الذي يواجه DeepSeek، في ديسمبر الماضي، لاحظ مطورون أن نموذج **V3** الخاص بالشركة كان يقوم أحياناً بالتعريف عن نفسه كـ **ChatGPT**، مما أدى إلى تكهنات بشأن استخدام سجلات محادثات من **OpenAI** في تدريبه، وقد تحدثت **OpenAI** سابقاً لوسائل الإعلام عن استخدام DeepSeek لتقنية تُعرف باسم **التقطير**، لاستنتاج المعرفة من نماذج أخرى متطورة،

مشاكل التحقق وسرقات البيانات

الأمور تصبح أكثر تعقيداً، حيث أفادت تقارير من **بلومبرغ** بأن **Microsoft**، الشريك الاستثماري لـ **OpenAI**، قد رصدت عمليات استخراج بيانات غير مشروعة مرتبطة بـDeepSeek، وعلى الرغم من أن تقنية التقطير شائعة في صناعة الذكاء الاصطناعي، إلا أن شروط استخدام خدمات **OpenAI** تمنع استخدامها لتطوير نماذج منافسة،

التحديات في الصناعة

الخبراء يشيرون إلى أن أصل البيانات بات من الصعب التحقق منه بسبب انتشار محتوى **الذكاء الاصطناعي** في جميع أنحاء الإنترنت، مما يؤدي إلى “تلوث” البيانات، ناثان لامبرت، الباحث في **AI2**، قال إنه لو كان مكان **DeepSeek**، لكان قد استخدم أفضل النماذج المتاحة لإنتاج البيانات الاصطناعية، خاصة وأن الموارد المتاحة لديهم ليست كافية،

خطوات أمنية جديدة

في محاولة لوقف استخدام تقنيات **التقطير** بطرق غير نزيهة، بدأت الشركات الكبرى في الذكاء الاصطناعي باتخاذ تدابير أمنية أكثر صرامة، بدأت **OpenAI** بفرض نظام تحقق من الهوية للذين يرغبون في استخدام نماذجها، بينما تسعى **Google** لحماية بياناتها من خلال تلخيص **آثار التفكير** لتقليل فرص استغلالها، في الوقت نفسه، تبقى **Google** صامتة حيال الاتهامات الحالية، في حين تنتظر وسائل الإعلام أي رد رسمي.