مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » پیشروی انویدیا در مسیر هوش مصنوعی فیزیکی؛ بروزرسانی GROOT و داده‌ها مصنوعی

پیشروی انویدیا در مسیر هوش مصنوعی فیزیکی؛ بروزرسانی GROOT و داده‌ها مصنوعی

مهدی جعفری مترجم

۳۰ اردیبهشت ۱۴۰۴

زمان مطالعه : ۷ دقیقه

در نمایشگاه Computex 2025 که به تازگی در تایوان برگزار شد، شرکت انویدیا گامی بلند در مسیر توسعه ربات‌های انسان‌نما برداشت و مجموعه‌ای از فناوری‌های پیشرفته را برای شکل‌ دادن به موج بعدی انقلاب صنعتی معرفی کرد. این نوآوری‌ها یک اکوسیستم کاملا از جمله مدل پایه به‌روز‌شده GR00T N1.5 برای استدلال و مهارت‌های ربات‌های انسان‌نما، ابزار تولید داده‌های حرکتی مصنوعی با نام GR00T-Dreams، و سیستم‌های مبتنی بر معماری جدید Blackwell برای سرعت‌بخشیدن به توسعه این ربات‌ها را شامل می شود.

به گزارش پیوست به نقل از ونچربیت، تیم سبز با این نوآوری‌ها در تلاش است تا جایگاهی که در توسعه زیرساخت هوش مصنوعی و مدل‌های زبانی بدست آورده است را در حوزه هوش مصنوعی فیزیکی نیز به تثبیت برساند.

هوش مصنوعی فیزیکی؛ انقلابی جدید در راه است

جنسن هوانگ، مدیرعامل انویدیا، در سخنرانی خود در این نمایشگاه گفت: «هوش مصنوعی فیزیکی و رباتیک انقلاب صنعتی بعدی را رقم خواهند زد. از مغزهای هوشمند برای ربات‌ها تا جهان‌های شبیه‌سازی‌شده برای تمرین یا ابرکامپیوترهایی برای آموزش مدل‌های پایه، انویدیا سنگ بنای هر مرحله از مسیر توسعه ربات‌ها را ارائه می‌کند.»

از آن‌جا که آموزش ربات‌ها نیازمند حجم عظیمی از داده‌های حرکتی است که گردآوری آن‌ها در دنیای واقعی پرهزینه و زمان‌بر است، انویدیا راه‌حلی نوآورانه تحت عنوان GR00T-Dreams را برای تولید داده‌های مصنوعی ارائه کرده است. این راه‌حل می‌تواند بی‌نهایت داده مصنوعی تولید کند و مسیر توسعه سریع‌تر، ارزان‌تر و ایمن‌تر ربات‌های انسان‌نما را هموار سازد.

GR00T-Dreams: انویدیا برای رفع خلا داده‌ها تلاش می‌کند

یکی از مهمترین نوآوری‌های شرکت انویدیا، ابزار GR00T-Dreams است که یک طرح راهبردی (blueprint) برای تولید داده‌های حرکتی مصنوعی محسوب می‌شود و توسعه‌دهندگان هوش مصنوعی فیزیکی می‌توانند از آن برای آموزش رفتار‌های جدید به ربات‌ها استفاده کنند.

توسعه دهندگان ابتدا می‌توانند مدل‌های بنیادین Cosmos Predict را با توجه به روبات‌های خودشان پسا آموزش دهند. سپس GROOT-Dreams با استفاده از تنها یک عکس به عنوان ورودی، ویدئوهایی از ربات‌ها در حال انجام وظایف مختلف در محیط‌های گوناگون تولید می‌کند. سپس این بلوپرینت «توکن‌های حرکتی» را از این ویدئوها استخراج می‌کند.

این توکن‌ها مجموعه‌ای فشرده از اطلاعات هستند که به ربات‌ها اجازه یادگیری حرکات جدید را می‌دهند.

جم فن، مدیر هوش مصنوعی انویدیا و از پژوهشگران برجسته این شرکت، می‌گوید: «ما راهی پیدا کردیم تا مدل‌های پیشرفته تولید ویدیو همچون Cosmos را برای کمک به ربات‌های انسان‌نما استفاده کنیم. پس این روش در سطح بالا اینگونه کار می‌کند که ما ابتدای Cosmos را براساس ویدیو‌های ربات از آزمایشگاه تقویت می‌کنیم تا درنتیجه این مدل ویدیوی حالا برای ربات‌های آزمایشگاه ما شخصی‌سازی شود و سپس ما روی کاغذ می‌توانیم از این مدل تقویت شده با ارائه پرامپت‌های مختلف برای تولید تعداد بیشمار ویدیو استفاده کنیم. و حالا داده‌های مصنوعی برای تکمیل دیتاست‌های مربوط به ربات‌ها داریم. همانطور که بسیاری از شما می‌دانید، جمع‌آوری داده از ربات‌های واقعی بسیار زمان‌بر و پرهزینه است، زیرا شما محدود به ۲۴ ساعت در ازای هر ربات هستید، درست است؟ این یک سیستم فیزیکی است اما با Groot Dreams، این رویه کاری جدید، این دسته الگوریتم‌های جدید، حالا می‌توانیم این محدودیت بنیادی فیزیکی را پشت سر گذاشت و داده را در مقیاس بی‌سابقه افزایش دهیم.»

Isaac GR00T N1.5: نسل جدید هوش و سازگاری در ربات‌ها

انویدیا می‌گوید مدل پایه به‌روز شده GR00T N1.5 که حاصل آموزش با داده‌های مصنوعی GR00T-Dreams است، تنها در ۳۶ ساعت توسعه یافته است؛ در حالی‌که بدون این ابزار، فرایند آموزش ممکن بود تا سه ماه زمان ببرد.

این مدل قابلیت‌های خیلی بهتری در درک دستورات زبانی، شناخت اشیا و انطباق با محیط‌های جدید دارد و موفقیت بیشتری در انجام وظایفی همچون مرتب‌سازی و جابجایی اجسام از خود نشان داده است.

یکی از ویژگی‌های کلیدی GR00T N1.5، استفاده از معماری ارتقایافته بصری-زبانی و قابلیت‌های بیشتر در فهم دستورات انسانی است. فن می‌گوید از آنجایی که ربات با مدل‌های ویدیویی آموزش دیده است، می‌تواند‌«فیزیک و معنای این جملات را درک کند.»

این مدل قرار است روی پلتفرم Jetson Thor که در اواخر سال جاری عرضه خواهد شد، اجرا شود.

شرکت‌های پیشرو از فناوری انویدیا استفاده می‌کنند

بسیاری از شرکت‌های فعال در حوزه رباتیک انسان‌نما و صنعتی، همچون Agility Robotics، Boston Dynamics، Foxlink، Galbot، NEURA Robotics، Fourier Intelligence، و XPENG Robotics، می‌‌گویند از پلتفرم Isaac و مدل‌های GR00T برای توسعه و شبیه‌سازی ربات‌های خود استفاده می‌کنند.

برای مثال، شرکت AeiRobot از GR00T برای توسعه ربات ALICE4 استفاده کرده است تا قابلیت درک زبان طبیعی و انجام وظایف پیچیده در محیط‌های صنعتی را بهبود بخشد. شرکت Foxlink نیز با بهره‌گیری از این فناوری، عملکرد بازوهای رباتیک خود را در خطوط تولید بهینه‌سازی کرده است.

راهکارهای مکمل برای شبیه‌سازی، آموزش و داده‌سازی

انویدیا مجموعه‌ای از ابزارها و فریم‌ورک‌های مکمل را نیز برای تقویت فرایند آموزش و توسعه ربات‌ها معرفی کرده است:

Isaac GR00T-Mimic: طرحی برای تولید حجم عظیمی از داده‌های حرکتی بر اساس چند نمونه از رفتار انسان‌ها، با استفاده از پلتفرم‌های Nvidia Omniverse و Cosmos.

Cosmos Reason: مدل بنیادین فراگیر با توانایی استدلال زنجیره‌ای که به تولید داده‌های دقیق‌تر کمک می‌کند. این مدل در حال حاضر روی Hugging Face قابل دسترسی است.

Cosmos Predict 2: نسخه جدیدی از مدل تولید جهان که در GR00T-Dreams استفاده شده و عملکرد را تقویت کرده است.

Isaac Sim 5.0: فریم‌ورک شبیه‌سازی و تولید داده مصنوعی که اکنون به‌صورت متن‌باز در GitHub در دسترس است.

Isaac Lab 2.2: پلتفرم یادگیری متن‌باز برای ربات‌ها با محیط‌های ارزیابی جدید برای مدل‌های GR00T N.

مجموعه داده‌های متن‌باز برای هوش مصنوعی فیزیکی:‌ این مجموعه داده شامل ۲۴ هزار مسیر حرکتی با کیفیت ربات‌های انسان‌نما برای آموزش مدل‌های GR00T است.

سه‌گانه‌ی انویدیا برای توسعه ربات‌ها: شبیه‌سازی، آموزش، اجرا

جم فن می‌گوید انویدیا استراتژی قدرتمندی برای بخش هوش مصنوعی دارد و پیرامون محوری است که جنسن هوانگ آن را «مسئله سه‌کامپیوتری» توصیف می‌کند.‌ به گفته او تیم سبز کامپیوتر OVX را برای شبیه‌سازی فیزیک و گرافیک، جهت تولید داده دارد. سپس این داده‌ها را کامپیوتر DGX برای آموزش مدل‌های بنیاد با داده‌های تولیدشده استفاده می‌کند و پس از آن هم کامپیوتر HX نیز وظیفه اجرا و استقرار مدل‌ها در پلتفرم‌های فیزیکی همچون ربات‌های انسان‌نما را برعهده می‌گیرد.

به گفته فن، مدل GR00T به‌عنوان نمادی از این تمام این چرخه شناخته می‌شود که از داده‌سازی گرفته تا یادگیری و اجرای ربات را در بر می‌گیرد.

سخت‌افزارهای جدید مبتنی بر Blackwell برای توسعه سریع‌تر

انویدیا همچنین از سیستم‌های جدید مبتنی بر معماری Blackwell برای توسعه سریع‌تر ربات‌ها رونمایی کرده است.

سیستم‌های سرور RTX PRO 6000 مبتنی بر معماری بلک‌ول را شرکت‌های Cisco، دل، Hewlett Packard Enterprise، لنوو و Supermicro معرفی‌ کرده‌اند و شرکت دل و لنوو نیز از ورک‌استیشن‌های RTX PRO 6000 مبتنی بر بلک‌ول رونمایی کرده‌اند. این سیستم‌ها امکان اجرای یکپارچه‌ آموزش، شبیه‌سازی و داده‌سازی را در اختیار توسعه‌دهندگان قرار می‌دهند.

برای محاسبات عظیم نیز سیستم GB200 NVL72 در قالب خدمات ابری Nvidia DGX Cloud و از طریق شرکای ابری انویدیا در دسترس قرار گرفته است و به گفته شرکت نسبت به نسل قبل تا ۱۸ برابر عملکرد بهتر در پردازش داده دارد.

نگاهی به آینده

انتشار نسخه متن‌باز مدل GR00T N1.5 برای تاریخ ۹ ژوئن (۱۹ خرداد) برنامه‌ریزی شده است و انویدیا اعلام کرده که تا حد ممکن ابزارهای GR00T-Dreams را نیز به‌صورت متن‌باز در دسترس قرار خواهد داد.

با استفاده از این فناوری‌ها، امکان یادگیری سریع برای ربات‌های آینده فراهم می‌شود و این فناوری می‌تواند سریع‌تر با محیط‌های جدید سازگار شود. همچنین ربات‌ها به لطف این فناوری می‌توانندبدون آموزش خاص، وظایف پیچیده را انجام دهند. این گام انویدیا نه‌تنها گامی در راستای تحقق ربات‌های انسان‌نماست، بلکه مسیر هوش مصنوعی فیزیکی را برای حضور در صنایع، خانه‌ها و زندگی روزمره هموار می‌کند.

در مجموع، فناوری‌های جدیدی که انویدیا در نمایشگاه Computex 2025 معرفی کرد نشان می‌دهند که ما اکنون در آستانه عصر جدیدی از پیشرفت‌ فناورانه در بخش رباتیک هستیم؛ عصری که در آن ربات‌ها نه‌تنها از نظر فیزیکی مشابه انسان خواهند بود، بلکه از نظر درک، تصمیم‌گیری و تطبیق نیز بسیار به انسان نزدیک‌تر خواهند شد.

این مطالب را هم بخوانید:

افزایش حضور انویدیا در چین با احداث یک مرکز تحقیق و توسعه در شانگهای

مدیرعامل انویدیا می‌گوید چیپ‌های هوش مصنوعی این شرکت سریع‌تر از قانون مور پیشرفت می‌کنند

https://pvst.ir/l6t

0 نظر

ارسال دیدگاه لغو پاسخ