مایکروسافت مدلهای هوش مصنوعی xAI ایلان ماسک را به پلتفرم خود اضافه کرد
شرکت مایکروسافت اعلام کرده است که مدلهای هوش مصنوعی Grok 3 و Grok 3 Mini،…
۳۰ اردیبهشت ۱۴۰۴
۳۰ اردیبهشت ۱۴۰۴
زمان مطالعه : ۷ دقیقه
در نمایشگاه Computex 2025 که به تازگی در تایوان برگزار شد، شرکت انویدیا گامی بلند در مسیر توسعه رباتهای انساننما برداشت و مجموعهای از فناوریهای پیشرفته را برای شکل دادن به موج بعدی انقلاب صنعتی معرفی کرد. این نوآوریها یک اکوسیستم کاملا از جمله مدل پایه بهروزشده GR00T N1.5 برای استدلال و مهارتهای رباتهای انساننما، ابزار تولید دادههای حرکتی مصنوعی با نام GR00T-Dreams، و سیستمهای مبتنی بر معماری جدید Blackwell برای سرعتبخشیدن به توسعه این رباتها را شامل می شود.
به گزارش پیوست به نقل از ونچربیت، تیم سبز با این نوآوریها در تلاش است تا جایگاهی که در توسعه زیرساخت هوش مصنوعی و مدلهای زبانی بدست آورده است را در حوزه هوش مصنوعی فیزیکی نیز به تثبیت برساند.
جنسن هوانگ، مدیرعامل انویدیا، در سخنرانی خود در این نمایشگاه گفت: «هوش مصنوعی فیزیکی و رباتیک انقلاب صنعتی بعدی را رقم خواهند زد. از مغزهای هوشمند برای رباتها تا جهانهای شبیهسازیشده برای تمرین یا ابرکامپیوترهایی برای آموزش مدلهای پایه، انویدیا سنگ بنای هر مرحله از مسیر توسعه رباتها را ارائه میکند.»
از آنجا که آموزش رباتها نیازمند حجم عظیمی از دادههای حرکتی است که گردآوری آنها در دنیای واقعی پرهزینه و زمانبر است، انویدیا راهحلی نوآورانه تحت عنوان GR00T-Dreams را برای تولید دادههای مصنوعی ارائه کرده است. این راهحل میتواند بینهایت داده مصنوعی تولید کند و مسیر توسعه سریعتر، ارزانتر و ایمنتر رباتهای انساننما را هموار سازد.
یکی از مهمترین نوآوریهای شرکت انویدیا، ابزار GR00T-Dreams است که یک طرح راهبردی (blueprint) برای تولید دادههای حرکتی مصنوعی محسوب میشود و توسعهدهندگان هوش مصنوعی فیزیکی میتوانند از آن برای آموزش رفتارهای جدید به رباتها استفاده کنند.
توسعه دهندگان ابتدا میتوانند مدلهای بنیادین Cosmos Predict را با توجه به روباتهای خودشان پسا آموزش دهند. سپس GROOT-Dreams با استفاده از تنها یک عکس به عنوان ورودی، ویدئوهایی از رباتها در حال انجام وظایف مختلف در محیطهای گوناگون تولید میکند. سپس این بلوپرینت «توکنهای حرکتی» را از این ویدئوها استخراج میکند.
این توکنها مجموعهای فشرده از اطلاعات هستند که به رباتها اجازه یادگیری حرکات جدید را میدهند.
جم فن، مدیر هوش مصنوعی انویدیا و از پژوهشگران برجسته این شرکت، میگوید: «ما راهی پیدا کردیم تا مدلهای پیشرفته تولید ویدیو همچون Cosmos را برای کمک به رباتهای انساننما استفاده کنیم. پس این روش در سطح بالا اینگونه کار میکند که ما ابتدای Cosmos را براساس ویدیوهای ربات از آزمایشگاه تقویت میکنیم تا درنتیجه این مدل ویدیوی حالا برای رباتهای آزمایشگاه ما شخصیسازی شود و سپس ما روی کاغذ میتوانیم از این مدل تقویت شده با ارائه پرامپتهای مختلف برای تولید تعداد بیشمار ویدیو استفاده کنیم. و حالا دادههای مصنوعی برای تکمیل دیتاستهای مربوط به رباتها داریم. همانطور که بسیاری از شما میدانید، جمعآوری داده از رباتهای واقعی بسیار زمانبر و پرهزینه است، زیرا شما محدود به ۲۴ ساعت در ازای هر ربات هستید، درست است؟ این یک سیستم فیزیکی است اما با Groot Dreams، این رویه کاری جدید، این دسته الگوریتمهای جدید، حالا میتوانیم این محدودیت بنیادی فیزیکی را پشت سر گذاشت و داده را در مقیاس بیسابقه افزایش دهیم.»
انویدیا میگوید مدل پایه بهروز شده GR00T N1.5 که حاصل آموزش با دادههای مصنوعی GR00T-Dreams است، تنها در ۳۶ ساعت توسعه یافته است؛ در حالیکه بدون این ابزار، فرایند آموزش ممکن بود تا سه ماه زمان ببرد.
این مدل قابلیتهای خیلی بهتری در درک دستورات زبانی، شناخت اشیا و انطباق با محیطهای جدید دارد و موفقیت بیشتری در انجام وظایفی همچون مرتبسازی و جابجایی اجسام از خود نشان داده است.
یکی از ویژگیهای کلیدی GR00T N1.5، استفاده از معماری ارتقایافته بصری-زبانی و قابلیتهای بیشتر در فهم دستورات انسانی است. فن میگوید از آنجایی که ربات با مدلهای ویدیویی آموزش دیده است، میتواند«فیزیک و معنای این جملات را درک کند.»
این مدل قرار است روی پلتفرم Jetson Thor که در اواخر سال جاری عرضه خواهد شد، اجرا شود.
بسیاری از شرکتهای فعال در حوزه رباتیک انساننما و صنعتی، همچون Agility Robotics، Boston Dynamics، Foxlink، Galbot، NEURA Robotics، Fourier Intelligence، و XPENG Robotics، میگویند از پلتفرم Isaac و مدلهای GR00T برای توسعه و شبیهسازی رباتهای خود استفاده میکنند.
برای مثال، شرکت AeiRobot از GR00T برای توسعه ربات ALICE4 استفاده کرده است تا قابلیت درک زبان طبیعی و انجام وظایف پیچیده در محیطهای صنعتی را بهبود بخشد. شرکت Foxlink نیز با بهرهگیری از این فناوری، عملکرد بازوهای رباتیک خود را در خطوط تولید بهینهسازی کرده است.
انویدیا مجموعهای از ابزارها و فریمورکهای مکمل را نیز برای تقویت فرایند آموزش و توسعه رباتها معرفی کرده است:
Isaac GR00T-Mimic: طرحی برای تولید حجم عظیمی از دادههای حرکتی بر اساس چند نمونه از رفتار انسانها، با استفاده از پلتفرمهای Nvidia Omniverse و Cosmos.
Cosmos Reason: مدل بنیادین فراگیر با توانایی استدلال زنجیرهای که به تولید دادههای دقیقتر کمک میکند. این مدل در حال حاضر روی Hugging Face قابل دسترسی است.
Cosmos Predict 2: نسخه جدیدی از مدل تولید جهان که در GR00T-Dreams استفاده شده و عملکرد را تقویت کرده است.
Isaac Sim 5.0: فریمورک شبیهسازی و تولید داده مصنوعی که اکنون بهصورت متنباز در GitHub در دسترس است.
Isaac Lab 2.2: پلتفرم یادگیری متنباز برای رباتها با محیطهای ارزیابی جدید برای مدلهای GR00T N.
مجموعه دادههای متنباز برای هوش مصنوعی فیزیکی: این مجموعه داده شامل ۲۴ هزار مسیر حرکتی با کیفیت رباتهای انساننما برای آموزش مدلهای GR00T است.
جم فن میگوید انویدیا استراتژی قدرتمندی برای بخش هوش مصنوعی دارد و پیرامون محوری است که جنسن هوانگ آن را «مسئله سهکامپیوتری» توصیف میکند. به گفته او تیم سبز کامپیوتر OVX را برای شبیهسازی فیزیک و گرافیک، جهت تولید داده دارد. سپس این دادهها را کامپیوتر DGX برای آموزش مدلهای بنیاد با دادههای تولیدشده استفاده میکند و پس از آن هم کامپیوتر HX نیز وظیفه اجرا و استقرار مدلها در پلتفرمهای فیزیکی همچون رباتهای انساننما را برعهده میگیرد.
به گفته فن، مدل GR00T بهعنوان نمادی از این تمام این چرخه شناخته میشود که از دادهسازی گرفته تا یادگیری و اجرای ربات را در بر میگیرد.
انویدیا همچنین از سیستمهای جدید مبتنی بر معماری Blackwell برای توسعه سریعتر رباتها رونمایی کرده است.
سیستمهای سرور RTX PRO 6000 مبتنی بر معماری بلکول را شرکتهای Cisco، دل، Hewlett Packard Enterprise، لنوو و Supermicro معرفی کردهاند و شرکت دل و لنوو نیز از ورکاستیشنهای RTX PRO 6000 مبتنی بر بلکول رونمایی کردهاند. این سیستمها امکان اجرای یکپارچه آموزش، شبیهسازی و دادهسازی را در اختیار توسعهدهندگان قرار میدهند.
برای محاسبات عظیم نیز سیستم GB200 NVL72 در قالب خدمات ابری Nvidia DGX Cloud و از طریق شرکای ابری انویدیا در دسترس قرار گرفته است و به گفته شرکت نسبت به نسل قبل تا ۱۸ برابر عملکرد بهتر در پردازش داده دارد.
انتشار نسخه متنباز مدل GR00T N1.5 برای تاریخ ۹ ژوئن (۱۹ خرداد) برنامهریزی شده است و انویدیا اعلام کرده که تا حد ممکن ابزارهای GR00T-Dreams را نیز بهصورت متنباز در دسترس قرار خواهد داد.
با استفاده از این فناوریها، امکان یادگیری سریع برای رباتهای آینده فراهم میشود و این فناوری میتواند سریعتر با محیطهای جدید سازگار شود. همچنین رباتها به لطف این فناوری میتوانندبدون آموزش خاص، وظایف پیچیده را انجام دهند. این گام انویدیا نهتنها گامی در راستای تحقق رباتهای انساننماست، بلکه مسیر هوش مصنوعی فیزیکی را برای حضور در صنایع، خانهها و زندگی روزمره هموار میکند.
در مجموع، فناوریهای جدیدی که انویدیا در نمایشگاه Computex 2025 معرفی کرد نشان میدهند که ما اکنون در آستانه عصر جدیدی از پیشرفت فناورانه در بخش رباتیک هستیم؛ عصری که در آن رباتها نهتنها از نظر فیزیکی مشابه انسان خواهند بود، بلکه از نظر درک، تصمیمگیری و تطبیق نیز بسیار به انسان نزدیکتر خواهند شد.