گزارش سهماهه تنسنت؛ رشد درآمد ادامه دارد، اما آهستهتر
تنسنت در گزارش مالی سهماهه نخست ۲۰۲۶ اگرچه از رشد درآمد و بازدهی سرمایهگذاریهای هوش…
۲۳ اردیبهشت ۱۴۰۵
۱۵ اردیبهشت ۱۴۰۵
زمان مطالعه : ۳ دقیقه

نگاهها در رقابت جهانی هوش مصنوعی، به سمت سختافزار است؛ از رقابت بر سر GPUهای پیشرفته گرفته تا سرمایهگذاریهای چندمیلیارددلاری برای ساخت دیتاسنترهای عظیم. اما در این میان، یک فرض کمتر به چالش کشیده شده است و آن اینکه افزایش قدرت پردازشی، تنها مسیر پاسخ به رشد تقاضای هوش مصنوعی است.
استارتآپ رادیکسآرک (RadixArk) دقیقاً همین فرض را هدف گرفته است. این شرکت که بهتازگی در یک دور سرمایهگذاری اولیه ۱۰۰ میلیون دلار جذب کرده و به ارزشگذاری ۴۰۰ میلیون دلاری رسیده، بهجای ساخت چیپهای جدید، سراغ بهینهسازی استفاده از همان منابع موجود رفته است. رویکردی که در شرایط کمبود جهانی GPU، به یک ضرورت تبدیل شده است.
بحث اصلی در زیرساخت هوش مصنوعی، اغلب حول قدرت محاسباتی میچرخد، اما واقعیت فنی پیچیدهتر است. مدلهای زبانی بزرگ برای پاسخگویی سریع، به تکنیکی به نام KV cache متکی هستند؛ روشی برای ذخیره محاسبات قبلی تا از تکرار آنها جلوگیری شود. این تکنیک اگرچه سرعت را افزایش میدهد، اما هزینه مصرف شدید حافظه را دارد.
در عمل، این یعنی حتی اگر پردازندهها قدرتمند باشند، محدودیت حافظه میتواند کل سیستم را کند یا پرهزینه کند. به بیان دیگر، گلوگاه واقعی از «compute» به «memory» منتقل شده است.
محصول اصلی این شرکت، موتور متنبازی به نام SGLang است؛ لایهای میانی بین مدل و سختافزار که تلاش میکند اجرای مدلها را کارآمدتر کند. ایده اصلی ساده اما اثرگذار است: چرا باید بخشهایی از یک درخواست که قبلاً پردازش شدهاند، دوباره محاسبه شوند؟

رادیکسآرک با استفاده از ساختاری به نام Radix tree، دادههای مربوط به KV cache را سازماندهی میکند و درخواستهای جدید را با دادههای قبلی تطبیق میدهد. اگر شباهتی وجود داشته باشد، سیستم آن بخش را نادیده میگیرد و مستقیماً به ادامه پردازش میرود. نتیجه، کاهش محسوس مصرف منابع و هزینه است.
این رویکرد را میتوان نوعی «کشینگ پیشرفته» دانست، اما در مقیاسی که مستقیماً بر اقتصاد اجرای مدلهای هوش مصنوعی تأثیر میگذارد.
سرمایهگذاران این استارتاپ از جمله Accel و بازوی سرمایهگذاری انویدیا، روی یک گزاره کلیدی شرطبندی کردهاند و آن این است که در شرایطی که عرضه سختافزار محدود است، برنده کسی است که بتواند از هر واحد منابع، بیشترین خروجی را بگیرد.
این تغییر زاویه، یادآور دورههایی در تاریخ فناوری است که بهینهسازی نرمافزاری، جایگزین توسعه سختافزار شده است. اگر این روند در AI هم تثبیت شود، میتواند توازن قدرت را از تولیدکنندگان چیپ به توسعهدهندگان زیرساخت نرمافزاری تغییر دهد.
رادیکسآرک فعلاً روی بهینهسازی مرحله استنتاج تمرکز دارد بخشی که مستقیماً با هزینههای عملیاتی سرویسهای AI در ارتباط است. اما برنامههای اعلامشده شرکت نشان میدهد که این تنها نقطه شروع است. هدف نهایی، ورود به لایه آموزش مدلها و تبدیل شدن به یک پلتفرم کامل برای تولید و اجرای مدلهای هوش مصنوعی است.
این یعنی رقابت بالقوه با بازیگرانی که امروز در دو سر طیف فعالیت میکنند، از ارائهدهندگان زیرساخت گرفته تا توسعهدهندگان مدل.
اگر فرض RadixArk درست باشد، یعنی مسئله اصلی AI دیگر کمبود GPU نیست، بلکه اتلاف منابع است. در چنین سناریویی، شرکتهایی که صرفاً بر توسعه سختافزار تکیه کردهاند، با یک تهدید جدی مواجه میشوند، کاهش مزیت رقابتی در برابر راهکارهای نرمافزاری که همان کار را با هزینه کمتر انجام میدهند.
منبع: wsj