معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۴ دی ۱۴۰۲
زمان مطالعه : ۳ دقیقه
محققانی از اپل و دانشگاه کلمبیا بدون سر و صدای چندانی یک مدل بزرگ زبانی چند وجهی به نام Ferret را به صورت متن باز عرضه کردهاند. در زمان عرضه این مدل در اکتبر ۲۰۲۳، توجه چندانی جلب آن نشد اما حالا شرایط فرق کرده است: وقتی مدلهای متن بازی مثل Mistral را شاهد هستیم و مدلی مثل جمینی به پیکسل پرو و نهایتا اندروید میآید، صحبتهای زیادی را هم درمورد استفاده از LLMها برای دستگاههای کوچک شاهد هستیم.
به گزارش پیوست به نقل از ونچربیت، این صحبتها به تازگی و زمانی شدت گرفت که اپل از یک پیشرفت بزرگ برای استفاده از LLMها در آیفون خبر داد: این شرکت دو مقاله جدید تحقیقاتی را منتشر کرد که در آن به تکنیکهای جدید آواتارهای سه بعدی و رابط کارآمد برای مدل زبانی اشاره شده است. چنین پیشرفتهایی احتمالا امکان تجربیات دیداری فراگیر و استفاده از سیستمهای پیچیده هوش مصنوعی در دستگاههایی مثل آیفون و آیپد را فراهم میکنند.
بسیاری از افراد جامعه هوش مصنوعی که متوجه عرضه Ferret شده بودند ورود اپل به مدلهای بزرگ زبانی را جشن گرفتند زیرا اکوسیستم این شرکت معمولا از ورود رقبا جلوگیری میکند.
برت دی ویت، رئیس یک شرکت خیریه اروپایی با تمرکز بر هوش مصنوعی متن باز در حوزه پزشکی، طی پستی در اکس گفت: «عجیب است که من متوجه این نشدم. اپل در ماه اکتبر به جامعه متنباز هوش مصنوعی پیوسته است. معرفی Ferret نشانگر تعهد اپل به تحقیقات مهم هوش مصنوعی است و جایگاه این شرکت را در حوزه هوش مصنوعی چندوجهی تثبیت میکند… بعلاوه: من در انتظار روزی هستم که مدلهای بزرگ زبانی داخلی (LLLMها) به عنوان یک خدمت یکپارچه در طراحی مجدد iOS، استفاده شوند.»
تریستن بهرنز، هنرمند و مشاور آلمانی حوزه هوش مصنوعی نیز در این باره اظهارنظر کرده است. او در لینکدین نوشت: «خب کریسمس فردا است اما من متوجه نبودم که اپل (بله اپل!) به تازگی یک مدل زبانی بزرگ چند وجهی منتشر کرده است؟ که کد و ابعاد را نیز شامل میشود؟»
بن دیکسون، بلاگر حوزه تکنولوژی و از همکاران ونچربیت هم در لینکدین پیرامون همین موضوع نوشت: «کدام پیشرفت هوش مصنوعی را کمتر از همه برای سال ۲۰۲۳ انتظار داشتید؟ برای من این پیشرفت عرضه یک LLM متنباز از سوی اپل بود (که البته یک جواز غیرتجاری دارد.)» او افزود که اپل «همواره حامی سیستمهای بسته، توسعه محدود، مرموز، قراردادهای عدم افشای اطلاعات (NDA)، عدم ارائه اطلاعات و ثبت حق اختراع تمام بخشهای محصول بوده است.»
او در ادامه گفت:«اما برای اپل (همچون متا) منطقی است که با مدلهای متنباز وارد بازار LLM شود. برای رقابت با مدلهایی مثل ChatGPT شما یا به یک مقیاس عظیم نیاز دارید و یا باید با بازیگری بزرگ همکاری کنید. با اینکه اپل منابع زیادی دارد، اما زیرساخت آن برای LLMهای بزرگ طراحی نشده است. گزینه دوم این است که وابسته ارائه دهندههای ابری مثل مایکروسافت و گوگل باشید (که هردو در جایگاه دشمن هستند) یا اینکه مدلهای زبانی متن بازی مثل متا عرضه کنید.»
جالب اینکه خبر عرضه مدل متن باز اپل و پیشرفت در حوزه مدلهای زبانی داخلی در حالی منتشر شده است که آنتروپیک و اوپنایآی در حال مذاکره برای جذب سرمایه جدید و توسعه LLMهای محدود خود هستند. گزارشی از رویترز نشان میدهد که آنتروپیک برای جذب ۷۵۰ میلیون دلار سرمایه آماده میشود و اوپنایآی هم طبق گزارش بلومبرگ در حال مذاکره برای جذب سرمایه جدید است که این شرکت را حدود «۱۰۰ میلیارد دلار» ارزشگذاری میکند.