شاومي تدخل عالم الروبوتات الكبيرة وتكشف عن أول نموذج متقدم بقدرات لغوية وحركية

روبوت
روبوت

أعلنت شركة «شاومي» الصينية دخولها رسميًا سباق الروبوتات المتقدمة، عبر الكشف عن نموذجها الأول للروبوتات الكبيرة «Xiaomi-Robotics-0»، الذي يجمع بين الرؤية الحاسوبية والفهم اللغوي والتنفيذ الحركي، ويضم نحو 4.7 مليار معلمة.

 

شاومي تدخل عالم الروبوتات


وأكدت الشركة أن النموذج الجديد حقق نتائج قياسية في الاختبارات الافتراضية والواقعية، ضمن توجهها لتطوير ما تصفه بـ«الذكاء الفيزيائي»، أي دمج الذكاء الاصطناعي بالإدراك الحركي في العالم الحقيقي.

كيف يعمل Robotics-0؟
يعتمد النموذج على معمارية متقدمة تُعرف باسم Mixture-of-Transformers، وينقسم إلى مكونين رئيسيين:

النموذج البصري اللغوي (VLM): يمثل «دماغ» الروبوت، حيث يفهم التعليمات البشرية حتى غير الدقيقة مثل طلب طي منشفة، ويعالج مهام كشف الأشياء والأسئلة البصرية والتفكير المنطقي.

خبير الحركة: يعتمد على تقنية Diffusion Transformer متعددة الطبقات لإنتاج تسلسل حركات سلسة ودقيقة، مع الحفاظ على الأداء أثناء التعلم الحركي دون التأثير على القدرات الإدراكية.


تقنيات تدريب وتحسين الأداء
يتدرب Robotics-0 على بيانات متعددة الوسائط تشمل الصور والحركة في وقت واحد، بهدف الحفاظ على قدرات الفهم أثناء تعلم المهام الحركية.


ويتيح نظام «Action Proposal» للنموذج التنبؤ بالحركات المحتملة أثناء معالجة الصور، قبل أن يتولى نظام الحركة توليد التسلسل الحركي بدقة.

كما تم تقليل زمن الاستجابة باستخدام تقنيات تشغيل غير متزامن، مع آليات تحافظ على سلاسة الحركة واستقرارها، إلى جانب نظام تركيز بصري يوجّه الانتباه إلى المشهد الحالي بدل الاعتماد على البيانات السابقة فقط.

وسجل النموذج أداءً متقدمًا في عدة محاكيات عالمية، متفوقًا على نحو 30 نموذجًا منافسًا.
وعند اختباره على روبوت حقيقي مزود بذراعين، أظهر تنسيقًا عاليًا بين الرؤية والحركة في مهام معقدة مثل طي المنشفة وتفكيك المكعبات والتعامل مع مواد مختلفة.

وأشارت «شاومي» إلى أن النموذج حافظ على قدراته اللغوية والبصرية حتى بعد تعلم المهارات الحركية، ما يجعله مناسبًا للمهام التي تتطلب إدراكًا وتنفيذًا في الوقت نفسه.

ويمثل«Xiaomi-Robotics-0» أول خطوة جدية للشركة في مجال الروبوتات الكبيرة، ويعكس توجهها لتعزيز حضورها في أبحاث الذكاء الاصطناعي المتقدم والروبوتات الواقعية.

تم نسخ الرابط