جنگ هوش مصنوعی وارد مرحله جدید شد: نبرد بر سر حافظه

زهره حنارودی مترجم

۱۵ اردیبهشت ۱۴۰۵

زمان مطالعه : ۳ دقیقه

نگاه‌ها در رقابت جهانی هوش مصنوعی، به سمت سخت‌افزار است؛ از رقابت بر سر GPUهای پیشرفته گرفته تا سرمایه‌گذاری‌های چندمیلیارددلاری برای ساخت دیتاسنترهای عظیم. اما در این میان، یک فرض کمتر به چالش کشیده شده است و آن اینکه افزایش قدرت پردازشی، تنها مسیر پاسخ به رشد تقاضای هوش مصنوعی است.

استارت‌آپ رادیکس‌آرک (RadixArk) دقیقاً همین فرض را هدف گرفته است. این شرکت که به‌تازگی در یک دور سرمایه‌گذاری اولیه ۱۰۰ میلیون دلار جذب کرده و به ارزش‌گذاری ۴۰۰ میلیون دلاری رسیده، به‌جای ساخت چیپ‌های جدید، سراغ بهینه‌سازی استفاده از همان منابع موجود رفته است. رویکردی که در شرایط کمبود جهانی GPU، به یک ضرورت تبدیل شده است.

بحران پنهان: حافظه، نه محاسبه

بحث اصلی در زیرساخت هوش مصنوعی، اغلب حول قدرت محاسباتی می‌چرخد، اما واقعیت فنی پیچیده‌تر است. مدل‌های زبانی بزرگ برای پاسخ‌گویی سریع، به تکنیکی به نام KV cache متکی هستند؛ روشی برای ذخیره محاسبات قبلی تا از تکرار آنها جلوگیری شود. این تکنیک اگرچه سرعت را افزایش می‌دهد، اما هزینه مصرف شدید حافظه را دارد.

در عمل، این یعنی حتی اگر پردازنده‌ها قدرتمند باشند، محدودیت حافظه می‌تواند کل سیستم را کند یا پرهزینه کند. به بیان دیگر، گلوگاه واقعی از «compute» به «memory» منتقل شده است.

راه‌حل RadixArk: حذف محاسبات تکراری

محصول اصلی این شرکت، موتور متن‌بازی به نام SGLang است؛ لایه‌ای میانی بین مدل و سخت‌افزار که تلاش می‌کند اجرای مدل‌ها را کارآمدتر کند. ایده اصلی ساده اما اثرگذار است: چرا باید بخش‌هایی از یک درخواست که قبلاً پردازش شده‌اند، دوباره محاسبه شوند؟

بنیان‌گذاران RadixArk، بانگ‌هوا ژو و یینگ شِنگ

رادیکس‌آرک با استفاده از ساختاری به نام Radix tree، داده‌های مربوط به KV cache را سازمان‌دهی می‌کند و درخواست‌های جدید را با داده‌های قبلی تطبیق می‌دهد. اگر شباهتی وجود داشته باشد، سیستم آن بخش را نادیده می‌گیرد و مستقیماً به ادامه پردازش می‌رود. نتیجه، کاهش محسوس مصرف منابع و هزینه است.

این رویکرد را می‌توان نوعی «کشینگ پیشرفته» دانست، اما در مقیاسی که مستقیماً بر اقتصاد اجرای مدل‌های هوش مصنوعی تأثیر می‌گذارد.

تغییر زمین بازی: از مقیاس‌پذیری سخت‌افزار به بهره‌وری نرم‌افزار

سرمایه‌گذاران این استارتاپ از جمله Accel و بازوی سرمایه‌گذاری انویدیا، روی یک گزاره کلیدی شرط‌بندی کرده‌اند و آن این است که در شرایطی که عرضه سخت‌افزار محدود است، برنده کسی است که بتواند از هر واحد منابع، بیشترین خروجی را بگیرد.

این تغییر زاویه، یادآور دوره‌هایی در تاریخ فناوری است که بهینه‌سازی نرم‌افزاری، جایگزین توسعه سخت‌افزار شده است. اگر این روند در AI هم تثبیت شود، می‌تواند توازن قدرت را از تولیدکنندگان چیپ به توسعه‌دهندگان زیرساخت نرم‌افزاری تغییر دهد.

از استنتاج تا آموزش: جاه‌طلبی فراتر از یک لایه

رادیکس‌آرک فعلاً روی بهینه‌سازی مرحله استنتاج تمرکز دارد بخشی که مستقیماً با هزینه‌های عملیاتی سرویس‌های AI در ارتباط است. اما برنامه‌های اعلام‌شده شرکت نشان می‌دهد که این تنها نقطه شروع است. هدف نهایی، ورود به لایه آموزش مدل‌ها و تبدیل شدن به یک پلتفرم کامل برای تولید و اجرای مدل‌های هوش مصنوعی است.

این یعنی رقابت بالقوه با بازیگرانی که امروز در دو سر طیف فعالیت می‌کنند، از ارائه‌دهندگان زیرساخت گرفته تا توسعه‌دهندگان مدل.

اگر فرض RadixArk درست باشد، یعنی مسئله اصلی AI دیگر کمبود GPU نیست، بلکه اتلاف منابع است. در چنین سناریویی، شرکت‌هایی که صرفاً بر توسعه سخت‌افزار تکیه کرده‌اند، با یک تهدید جدی مواجه می‌شوند، کاهش مزیت رقابتی در برابر راهکارهای نرم‌افزاری که همان کار را با هزینه کمتر انجام می‌دهند.

منبع: wsj

https://pvst.ir/nyu

0 نظر

ارسال دیدگاه لغو پاسخ