قرارداد ۱۰ میلیارد دلاری متا برای استفاده از زیرساخت ابری گوگل
شرکت متا، مالک شبکه اجتماعی فیسبوک و اینستاگرام، با امضای قراردادی چند ساله به ارزش…
۳۱ مرداد ۱۴۰۴
۳۱ مرداد ۱۴۰۴
زمان مطالعه : ۳ دقیقه
استارتاپ هوش مصنوعی دیپسیک چین با انتشار بهروزرسانی جدیدی از مدل زبانی خود، اعلام کرد که بهزودی تراشههای نسل جدید تولید چین را برای پشتیبانی از مدلهای هوش مصنوعی به کار میگیرد. این شرکت میگوید فرمت پردازشی جدید مورد استفاده در مدل جدید V3.1 را به طور خاص برای پردازندههای بومی توسعه داده است.
به گزارش پیوست به نقل از CNBC، شرکت دیپسیک طی یادداشتی در حساب رسمی ویچت خود اعلام کرد فرمت پردازشی UE8M0 FP8 که در مدل جدید V3.1 به کار رفته، به طور ویژه برای نسل آینده تراشههای داخلی طراحی شده است. فرمت FP8 با کاهش حجم دادهها، میتواند کارایی محاسباتی در آموزش و استنتاج مدلهای یادگیری عمیق را بهطور چشمگیری افزایش دهد.
تحلیلگران میگویند اشاره دیپسیک به تراشههای بومی، نشانهای از برنامه این شرکت برای همکاری نزدیکتر با اکوسیستم نوپای تولید تراشههای هوش مصنوعی در کشور چین است که رهبری آنها را شرکت هواوی (از جمله شرکتهای تحت تحریم ایالات متحده) در دست دارد. این مساله در بحبوحه محدودیتهای شدید صادراتی واشنگتن و تلاشهای پکن برای خودکفایی نیمههادی اهمیت دوچندان دارد.
این خبر در حالی منتشر میشود که حدود دو هفته پیش دولت چین از توسعهدهندگان هوش مصنوعی خواست به جای تراشههای انویدیا از جایگزینهای داخلی استفاده کنند. هرچند کارشناسان معتقدند تراشهسازان چینی هنوز از نظر فناوری و مقیاس عقبتر از انویدیا هستند، شرکتهایی مانند هواوی پیشرفتهای در تولید پردازنده داشتهاند.
دیپسیک اوایل امسال با معرفی مدل R1 توانست توجه جهانیان را به خود جلب کند، چرا که این شرکت توانست با وجود تحریمها و عدم دسترسی مستقیم به پردازندههای قدرتمند انویدیا (البته که چندین منبع به ذخیرهسازی پردازندههای انویدیا توسط شرکت مادر دیپسیک پیش از اعمال محدودیتها خبر دادهاند)، عملکردی همسطح با رقبای غربی از جمله اوپنایآی را ارائه دهد. نسخه پیشین مدل این شرکت که V3 نام دارد، در دسامبر گذشته با حدود ۲ هزار تراشه میانرده انویدیا آموزش داده شده بود.
نسل جدید مدل بنیادی این شرکت با نام V3.1 تغییرات عمدهای را شامل میشود و برای مثال سرعت پاسخدهی را تا حد قابل توجهی افزایش داده است. این مدل همچنین با بهرهگیری از یک معماری ترکیبی استدلالی، امکان پشتیبانی همزمان از حالتهای استدلالی و غیر استدلالی را فراهم میکند. مدلهای استدلالگر میتوانند وظایف پیچیدهتری را با فرآیند تفکر گامبهگام به اجرا بگذارند که براساس آن مدل در پس زمینه چندین مرحله ارائه پاسخ را پشت سر میگذارد تا فرایندی شبیه به تفکر انسانی را شبیهسازی کند.
دیپسیک همچنین اعلام کرده است که از ۶ سپتامبر قیمت استفاده از API مدل V3.1 برای توسعهدهندگانی که قصد دارند این فناوری را در محصولات و پلتفرمهای خود به کار گیرند، تغییر میدهد.
این تحولات در حالی رخ میدهد که فضای رقابتی تراشههای هوش مصنوعی میان چین و آمریکا با التهاب بیشتری همراه شده و به نظر میرسد عرضه تراشههای بومی نسل بعدی میتواند نقطه عطفی در تلاشهای چین برای کاهش وابستگی به فناوریهای غربی باشد.