معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۲۶ اسفند ۱۴۰۲
زمان مطالعه : ۳ دقیقه
محققان اپل روشهای تازهای را برای آموزش مدلهای بزرگ متنی و تصویری توسعه دادهاند که در عمل آنها را قدرتمندتر و انعطافپذیرتر میکند. ونچربیت میگوید این پیشرفت از اهمیت چشمگیری برای محصولات هوش مصنوعی و آینده اپل برخوردار است.
به گزارش پیوست، تحقیقاتی که در مقالهای با نام «MM1: روشها، تجزیهتحلیل و چشماندازهایی از پیش آموزش LLM چندوجهی» در وبسایت arxiv.org منتشر شده نشان میدهد که چطور ترکیب انواع مختلف از دادههای آموزشی و ساختارهای مدل میتواند فوقالعاده در چندین حوزه مهم هوش مصنوعی منتهی شود.
محققان میگویند: «ما مشخص کردیم که استفاده از یک ترکیب دقیق دادههای متشکل از تصویر-توضیحات، تصویر-متن مرتبط و متن خالی برای رسیدن به نتایج سریع و عالی در چنین حوزه ضرورت دارد.» مدلهای MM1 با آموزش از طریق دیتاستهای متنوع دیداری و زبانی، میتوانند در کارهایی مثل توضیح تصویر، پاسخ به سوالات دیداری و زبان طبیعی پیشرفت کنند.
محققان میگویند که کدبند تصویر و وضوح تصاویر ارائه شده از تاثیر بهسزایی روی عملکرد مدل برخوردار است. آنها میگویند: «ما نشان دادیم که کدبند تصویر در کنار وضوح تصویر و تعداد توکن تصویر تاثیر قابل توجهی دارد و در عین حال طراحی متصل کننده دید-زبان به نسبت اهمیت ناچیزی دارد.» این نشان میدهد که توسعه و اصلاح اجزای دیداری این مدلهای چندوجهی برای آینده از اهمیت بالایی برخوردار است.
جالب اینکه بزرگترین مدل ۳۰ میلیارد پارامتی این تحقیقات عملکرد فوقالعادهای در مهارتهای یادگیری مفهوم به جا گذاشت و حتی در استدلال چند مرحلهای چندین تصویل به خوبی عمل کرد. همین مساله به پتانسیل مدلهای بزرگ چن وجهی برای حل مشکلات باز و پیچیدهای اشاره میکند که نیازمند درک و تولید مبتنی بر زبان هستند.
تحقیقات MM1 در حالی منتشر شده که اپل برای همپایی با رقبایی مثل گوگل و مایکروسافت سرمایهگذاری در حوزه هوش مصنوعی را افزایش داده است. طبق گزارشی از بلومبرگ، این شرکت قصد دارد در سالهای آینده سالانه یک میلیارد دلار روی این فناوری سرمایهگذاری کند.
منابع میگویند اپل در حال کار روی کی چارچوب مدل بزرگ زبانی به نام «Ajax» و چتباتی است که در داخل به نام «Apple GPT» شناخته میشود. هدف نهایی اپل ترکیب این فناوریها با سیری، پیامها، اپل موزیک و دیگر اپلیکیشنها و خدمات این شرکت است. برای مثال با هوش مصنوعی میتوان پلیلیستهای شخصیسازی شده تولید کرد، به توسعه دهندگان در نوشتن کد کمک کرد یا در مکالمه و انجام کارها از آن کمک گرفت.
تیمکوک، مدیرعامل اپل، در تماس اخیر خود با سرمایهگذاران گفت که ما هوش مصنوعی و یادگیری ماشینی را فناوریهای بنیادی قلمداد می:نیم و آنها بخش مهمی از تمام محصولات ما هستند. با این حال کوک طبق سنت دیرینه اپل جزئیات بیشتری از هوش مصنوعی شرکت ارائه نکرد و بسیاری از تحلیلگران در انتظار عرضه این محصولات در سال جاری میلادی هستند.