مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » گوگل در کنگره جهانی موبایل از قابلیت‌های دیداری جمنای رونمایی کرد

گوگل در کنگره جهانی موبایل از قابلیت‌های دیداری جمنای رونمایی کرد

مهدی جعفری مترجم

۱۳ اسفند ۱۴۰۳

زمان مطالعه : ۳ دقیقه

گوگل در کنگره جهانی موبایل (MWC) ۲۰۲۵ در بارسلونا، عرضه قابلیت‌های دیداری جدید هوش مصنوعی جمنای را تایید کرد. این قابلیت‌ها در همین ماه میلادی (مارس) در اختیار کاربران قرار می‌گیرند.

به گزارش پیوست، کاربران هوش مصنوعی گوگل پس از عرضه می‌توانند از ویژگی‌های تحلیل ویدئوی زنده و اشتراک‌گذاری صفحه نمایش استفاده کنند. قابلیت اشتراک‌گذاری صفحه نمایش یا «Screenshare» به کاربران اجازه می‌دهد تا محتوای صفحه نمایش گوشی خود را با هوش مصنوعی به اشتراک گذاشته و درمورد آن از جمنای سوال کنند.

در مثالی که گوگل ارائه کرده است، کاربر صفحه نمایش خود را در حال خرید یک شلوار جین بگی در اختیار جمنای می‌گذارد و از هوش مصنوعی می‌پرسد چه لباس‌های دیگری با این شلوار ست می‌شوند.

قابلیت دیگری نیز که گوگل پیشتر در مراسم Google I/O سال گذشته معرفی کرده بود و در بارسلونا تایید شد، کاربر می‌تواند دوربین گوشی خود را در واقع به چشم هوش مصنوعی جمنای تبدیل کند و هوش مصنوعی براساس ویدیوی دریافتی از دوربین می‌تواند به سوالات کاربر پاسخ دهد.

با این حال استفاده از این قابلیت برای کاربران رایگان امکان‌پذیر نیست. گوگل می‌گوید این قابلیت در اختیار مشترکان طرح Google One AI Premium با Gemini Advanced قرار می‌گیرد.

همچنین طبق اعلام سازنده اندروید، این قابلیت‌ها در ابتدا به‌صورت انحصاری برای دستگاه‌های اندرویدی عرضه می‌شوند و از چندین زبان پشتیبانی می‌کنند. گوگل در نمایشگاه MWC، جمنای لایو (Gemini Live)، ویژگی‌ که قابلیت‌های فوق را در کنار امکانات دیگر هوش مصنوعی در خود جای داده است، روی دستگاه‌های مختلف از تولیدکنندگان گوشی‌های اندرویدی به نمایش گذاشت.

با اضافه شدن قابلیت‌های جدید تعامل دیداری به هوش مصنوعی گوگل، این شرکت گامی مهم به سمت دستیارهای چندوجهی (Multimodal) بر می‌دارد. سیستم‌های چند‌وجهی می‌توانند چندین نوع ورودی را برای تعامل طبیعی‌تری با دنیای واقعی پردازش کنند.

سوندار پیچای، مدیرعامل گوگل، پیش از اعلام کرده بود که شرکت تحت رهبری‌اش در سال ۲۰۲۵ هوش مصنوعی را به یکی از اولویت‌های اصلی خود تبدیل می‌کند و این شرکت در تلاش است تا بخش جستجو یا هسته کسب‌وکار خود را بیش از پیش در هوش مصنوعی ادغام کند.

چشم‌انداز بزرگ‌تر گوگل برای سال ۲۰۲۵ با نام «Project Astra» نیز که پیچای پیشتر به آن اشاره کرده بود به توسعه یک دستیار چندوجهی کامل اشاره می‌کند که قادر است داده‌های متنی، ویدئویی و صوتی را در لحظه پردازش کرده و تا ۱۰ دقیقه پیشینه مکالمه را به یاد داشته باشد. این پروژه همچنین بخش مهمی از تحول موتور جستجو، لنز و نقشه گوگل است.

هنوز مشخص نیست که Astra به‌عنوان یک محصول جداگانه عرضه می‌شود یا قابلیت‌های آن به جمنای اضافه خواهد شد. اما انتشار Gemini Live به گوگل کمک می‌کند تا در رقابت با ChatGPT شرکت اوپن‌ای‌آی، که از دسامبر گذشته حالت پیشرفته صوتی با ویدئوی زنده و اشتراک‌گذاری صفحه نمایش را ارائه کرده، عقب نماند.

این مطالب را هم بخوانید: