انقلاب هوش مصنوعی۲۰۲۰، صنایع را متحول میکند
تحول هوش مصنوعی از محیطهای تخصصی آکادمیک تا نفوذ گسترده آن در زندگی روزمره و…
۱۲ اسفند ۱۴۰۳
۱۳ اسفند ۱۴۰۳
زمان مطالعه : ۳ دقیقه
گوگل در کنگره جهانی موبایل (MWC) ۲۰۲۵ در بارسلونا، عرضه قابلیتهای دیداری جدید هوش مصنوعی جمنای را تایید کرد. این قابلیتها در همین ماه میلادی (مارس) در اختیار کاربران قرار میگیرند.
به گزارش پیوست، کاربران هوش مصنوعی گوگل پس از عرضه میتوانند از ویژگیهای تحلیل ویدئوی زنده و اشتراکگذاری صفحه نمایش استفاده کنند. قابلیت اشتراکگذاری صفحه نمایش یا «Screenshare» به کاربران اجازه میدهد تا محتوای صفحه نمایش گوشی خود را با هوش مصنوعی به اشتراک گذاشته و درمورد آن از جمنای سوال کنند.
در مثالی که گوگل ارائه کرده است، کاربر صفحه نمایش خود را در حال خرید یک شلوار جین بگی در اختیار جمنای میگذارد و از هوش مصنوعی میپرسد چه لباسهای دیگری با این شلوار ست میشوند.
قابلیت دیگری نیز که گوگل پیشتر در مراسم Google I/O سال گذشته معرفی کرده بود و در بارسلونا تایید شد، کاربر میتواند دوربین گوشی خود را در واقع به چشم هوش مصنوعی جمنای تبدیل کند و هوش مصنوعی براساس ویدیوی دریافتی از دوربین میتواند به سوالات کاربر پاسخ دهد.
با این حال استفاده از این قابلیت برای کاربران رایگان امکانپذیر نیست. گوگل میگوید این قابلیت در اختیار مشترکان طرح Google One AI Premium با Gemini Advanced قرار میگیرد.
همچنین طبق اعلام سازنده اندروید، این قابلیتها در ابتدا بهصورت انحصاری برای دستگاههای اندرویدی عرضه میشوند و از چندین زبان پشتیبانی میکنند. گوگل در نمایشگاه MWC، جمنای لایو (Gemini Live)، ویژگی که قابلیتهای فوق را در کنار امکانات دیگر هوش مصنوعی در خود جای داده است، روی دستگاههای مختلف از تولیدکنندگان گوشیهای اندرویدی به نمایش گذاشت.
با اضافه شدن قابلیتهای جدید تعامل دیداری به هوش مصنوعی گوگل، این شرکت گامی مهم به سمت دستیارهای چندوجهی (Multimodal) بر میدارد. سیستمهای چندوجهی میتوانند چندین نوع ورودی را برای تعامل طبیعیتری با دنیای واقعی پردازش کنند.
سوندار پیچای، مدیرعامل گوگل، پیش از اعلام کرده بود که شرکت تحت رهبریاش در سال ۲۰۲۵ هوش مصنوعی را به یکی از اولویتهای اصلی خود تبدیل میکند و این شرکت در تلاش است تا بخش جستجو یا هسته کسبوکار خود را بیش از پیش در هوش مصنوعی ادغام کند.
چشمانداز بزرگتر گوگل برای سال ۲۰۲۵ با نام «Project Astra» نیز که پیچای پیشتر به آن اشاره کرده بود به توسعه یک دستیار چندوجهی کامل اشاره میکند که قادر است دادههای متنی، ویدئویی و صوتی را در لحظه پردازش کرده و تا ۱۰ دقیقه پیشینه مکالمه را به یاد داشته باشد. این پروژه همچنین بخش مهمی از تحول موتور جستجو، لنز و نقشه گوگل است.
هنوز مشخص نیست که Astra بهعنوان یک محصول جداگانه عرضه میشود یا قابلیتهای آن به جمنای اضافه خواهد شد. اما انتشار Gemini Live به گوگل کمک میکند تا در رقابت با ChatGPT شرکت اوپنایآی، که از دسامبر گذشته حالت پیشرفته صوتی با ویدئوی زنده و اشتراکگذاری صفحه نمایش را ارائه کرده، عقب نماند.