skip to Main Content
محتوای اختصاصی کاربران ویژهورود به سایت

فراموشی رمز عبور

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ عضو شوید

ثبت نام سایت

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ وارد شوید

فراموشی رمز عبور

وارد شوید یا عضو شوید

جشنواره نوروزی آنر

فناوری

نسرین ابوئی نویسنده میهمان

مهمترین یافته‌های گزارش شاخص هوش مصنوعی ۲۰۲۵ از دانشگاه استنفورد

نسرین ابوئی
نویسنده میهمان

۴ خرداد ۱۴۰۴

زمان مطالعه : ۱۱ دقیقه

گزارش شاخص هوش مصنوعی 2025

تأثیر هوش مصنوعی بر جامعه هرگز تا این اندازه روشن نبوده است. می‌توان گفت که هوش مصنوعی متحول‌کننده‌ترین فناوری قرن بیست و یکم است. اما مزایای آن به‌طور مساوی توزیع نمی‌شود، مگر اینکه توسعه آن را به‌صورت مدبرانه هدایت کنیم. بررسی شاخص هوش مصنوعی در این مسیر به ما کمک می‌کند.

شاخص هوش مصنوعی یکی از جامع‌ترین دیدگاه‌های مبتنی بر داده را از هوش مصنوعی ارائه می‌دهد. این شاخص به میزانی اعتبار دارد که توسط رسانه‌های جهانی، دولت‌ها و شرکت‌های پیشرو به‌عنوان یک منبع مورد اعتماد شناخته می‌شود. شاخص AI شامل بینش‌های دقیق و عینی در مورد پیشرفت فنی هوش مصنوعی، نفوذ اقتصادی و تأثیر اجتماعی آن است که می‌تواند برای سیاست‌گذاران، رهبران کسب‌وکار و عموم مردم مفید باشد.

مهم‌ترین یافته‌ها

مهم‌ترین یافته‌های گزارش شاخص هوش مصنوعی ۲۰۲۵ را در ادامه با هم مرور می‌کنیم:

1. عملکرد هوش مصنوعی در معیارهای مورد تقاضا، همچنان در حال بهبود است

طبق گزارش شاخص هوش مصنوعی،  محققان در سال ۲۰۲۳ معیار‌های جدیدی مانند «درک و استدلال چندوجهی» (MMMU) یا multimodal understanding and reasoning، «سؤالات علمی در سطح دکتری» (GPQA) یا PhD-level science questions و «ارزیابی مدل‌های زبانی بزرگ در مورد مسائل نرم‌افزاری» یا SWE-bench را برای آزمایش محدودیت‌های سیستم‌های هوش مصنوعی پیشرفته ارائه کردند. فقط یک سال بعد از آن، عملکرد هوش مصنوعی در مقایسه با انسان به شدت بهبود پیدا کرد: امتیازات در MMMU، GPQA و SWE-bench به ترتیب ۱۸.۸، ۴۸.۹ و ۶۷.۳ درصد افزایش یافت. فراتر از معیار‌ها، سیستم‌های هوش مصنوعی گام‌های بزرگی در تولید ویدیوی با کیفیت بالا برداشتند و در برخی حوزه‌ها، عامل‌های مدل زبانی حتی در انجام وظایف برنامه‌نویسی با بودجه‌های زمانی محدود، بهتر از انسان‌ها عمل کردند.

شاخص هوش مصنوعی در معیارهای مورد تقاضا
عملکرد تکنیکال شاخص هوش مصنوعی در مقایسه با عملکرد انسان

۲. هوش مصنوعی به طور فزاینده‌ای در زندگی روزمره ما وارد شده است

از مراقبت‌های بهداشتی گرفته تا حمل و نقل، هوش مصنوعی به سرعت از آزمایشگاه به سمت زندگی روزمره ما در حال حرکت است. در سال ۲۰۲۳، FDA  استفاده از ۲۲۳ دستگاه پزشکی مجهز به هوش مصنوعی را تأیید کرد. این تعداد را با شش دستگاه در سال ۲۰۱۵ مقایسه کنید. خودروهای خودران موجود در جاده‌ها دیگر آزمایشی نیستند. بلکه به‌عنوان مثال، Waymo، یکی از بزرگترین اپراتورهای ایالات متحده، هر هفته بیش از ۱۵۰ هزار خودرو سواری خودران را به بازار ارائه می‌دهد. در عین حال، ناوگان روبوتاکسی ارزان قیمت Apollo Go شرکت بایدو (Baidu) در حال حاضر به شهرهای متعددی در سراسر چین خدمات‌رسانی می‌کند.

شاخص هوش مصنوعی در مورد ورود به زندگی روزمره ما
گزارش شاخص هوش مصنوعی در مورد افزایش تعداد دستگاه‌های پزشکی مجهز به AI از سال 1995 تا 2023 که توسط FDA تایید شده است.

۳. افزایش سرمایه‌گذاری و کاربرد بی‌سابقه

کسب‌و‌کارها می‌توانند به‌طور کامل با هوش مصنوعی کار کنند و این باعث افزایش سرمایه‌گذاری و کاربرد بی‌سابقه می‌شود. دلیل این رشد، تأثیرات بهره‌وری بالایی است که در تحقیقات ثابت شده است.

طبق گزارش شاخص هوش مصنوعی،  در سال ۲۰۲۴، سرمایه‌گذاری خصوصی ایالات متحده در هوش مصنوعی به ۱۰۹. ۱ میلیارد دلار افزایش یافت که تقریباً ۱۲ برابر عدد ۹. ۳ میلیارد دلار چین و ۲۴ برابر عدد ۴. ۵ میلیارد دلار بریتانیا بود. هوش مصنوعی مولد با جذب ۳۳.۹ میلیارد دلار سرمایه‌گذاری خصوصی در سطح جهان، افزایشی ۱۸.۷ درصدی نسبت به سال ۲۰۲۳ را تجربه کرد که یک رشد قابل ملاحظه محسوب می‌شود. استفاده کسب‌وکار‌ها از هوش مصنوعی هم در حال افزایش است: ۷۸ درصد از سازمان‌ها گزارش دادند که از هوش مصنوعی در سال ۲۰۲۴ استفاده می‌کردند. این عدد برای سال قبل ۵۵ درصد بود. در همین حال، تحقیقات بسیاری تأیید می‌کنند که هوش مصنوعی بهره‌وری را افزایش می‌دهد و در بیشتر موارد به کاهش شکاف‌های مهارتی در میان نیروی کار کمک می‌کند.

شاخص هوش مصنوعی در سال 2024 در مورد سرمایه‌گذاری خصوصی
درصد پاسخ‌دهندگانی که در گزارش شاخص هوش مصنوعی اعلام کرده‌اند سازمانشان حداقل در یک عملکرد از AI استفاده می‌کند. (از 2017 تا 2024)

۴. ایالات متحده همچنان در تولید مدل‌های برتر هوش مصنوعی (top AI models) پیشتاز است. اما چین در حال کاهش شکاف عملکرد (performance gap) است

گزارش شاخص هوش مصنوعی نشان می‌دهد که در سال ۲۰۲۴، مؤسسات مستقر در ایالات متحده ۴۰ مدل هوش مصنوعی قابل توجه تولید کردند که به‌طور قابل توجهی از ۱۵ مدل چینی و سه مدل اروپایی پیشی گرفت. در حالی که ایالات متحده پیشتازی خود را از نظر کمیت حفظ کرده است، مدل‌های چینی به سرعت در حال پر کردن شکاف کیفیت هستند. تفاوت عملکرد در معیار‌های اصلی مانند «درک زبانی چندوظیفه‌ای» (MMLU) یا multitask language understanding و معیار «ارزیابی قابلیت‌های تولید کد LLM» یا HumanEval در سال ۲۰۲۳ یک عدد دو رقمی بود. ولی در سال ۲۰۲۴ عملکرد‌ها تقریباً برابر شد. در عین حال، چین همچنان در انتشارات و حقوق ثبت اختراع هوش مصنوعی (AI publications and patents) پیشتاز است. در همین زمان، توسعه مدل‌های AI در حال جهانی شدن است و مدل‌های قابل توجهی از مناطقی مانند خاورمیانه، آمریکای لاتین و آسیای جنوب شرقی در حال راه‌اندازی هستند.

بررسی توسعه مدل‌های AI به عنوان شاخص هوش مصنوعی
عملکرد مدل‌های برتر ایالات متحده در مقایسه با چین در فضای چت‌بات LMSYS در گزارش شاخص هوش مصنوعی

۵. فضای هوش مصنوعی مسئول (Responsible AI) به‌صورت نابرابر تکامل پیدا می‌کند

حوادث مرتبط با هوش مصنوعی به شدت در حال افزایش هستند و هنوز ارزیابی‌های استاندارد هوش مصنوعی مسئول (RAI) یا «روش مدیریت ریسک‌های مرتبط با راه‌حل‌های مبتنی بر هوش مصنوعی»، در میان توسعه‌دهندگان مدل‌های صنعتی بزرگ نادر است. با این حال، معیارهای جدیدی مانند ارزیابی جامع ایمنی مدل‌های زبانی (HELM Safety) یا holistic evaluation of language models safety،  AIR-Bench (یک رویکرد جدید برای معیارهای هوش مصنوعی است که از هوش مصنوعی مولد برای ایجاد معیارهای واقعی‌تر و انعطاف‌پذیرتر استفاده می‌کند) و FACTS ابزارهای امیدوارکننده‌ای را برای ارزیابی واقعیت و ایمنی ارائه می‌دهند.

در میان شرکت‌ها، هنوز بین شناخت ریسک‌های RAI و انجام اقدامات معنادار شکاف وجود دارد. در مقابل، دولت‌ها فوریت را افزایش داده‌اند: در سال ۲۰۲۴، همکاری جهانی در زمینه حکمرانی هوش مصنوعی تشدید شد. سازمان‌هایی از جمله سازمان همکاری و توسعه اقتصادی (OECD)، اتحادیه اروپا، سازمان ملل و اتحادیه آفریقا چارچوب‌هایی را منتشر کردند که بر شفافیت، قابل اعتماد بودن و دیگر اصول اصلی هوش مصنوعی تاکید دارند.

گزارش شاخص هوش مصنوعی در مورد هوش مصنوعی ایمن و پاسخگو
گزارش شاخص هوش مصنوعی در مورد دو عامل هوش مصنوعی ایمن و هوش مصنوعی پاسخگو برای مدل‌های معروف

۶. خوش‌بینی جهانی در مورد هوش مصنوعی در حال افزایش است اما شکاف‌های عمیق منطقه‌ای همچنان وجود دارد

طبق گزارش شاخص هوش مصنوعی،  در کشور‌هایی مانند چین (۸۳%)، اندونزی (۸۰%) و تایلند (۷۷%)، اکثریت مردم محصولات و خدمات هوش مصنوعی را بیشتر مفید می‌دانند تا مضر. در مقابل، خوش‌بینی نسبت به AI در کشور‌هایی مانند کانادا (۴۰%)، ایالات متحده (۳۹%) و هلند (۳۶%) بسیار پایین‌تر است. با این حال، احساسات در حال تغییر است: از سال ۲۰۲۲، خوش‌بینی در چندین کشور قبلاً بدبین از جمله آلمان (+۱۰%)، فرانسه (+۱۰%)، کانادا (+۸%)، بریتانیا (+۸%) و ایالات متحده (+۴%) رشد قابل توجهی داشته است.

گزارش شاخص هوش مصنوعی در مورد هزینه فایده محصولاتی که از AI استفاده می‌کنند.
سهم درصدی پاسخگویان هر کشور در مورد بیشتر بودن مزایا نسبت به معایب در محصولاتی که از AI استفاده می‌کنند. (2022 تا 2024) طبق گزارش شاخص هوش مصنوعی

۷. هوش مصنوعی کارآمدتر، مقرون به‌صرفه‌تر و در دسترس‌تر می‌شود

مطابق با گزارش شاخص هوش مصنوعی،  هزینه استنتاج سیستمی که در سطح GPT-۳.۵ کار می‌کند بین نوامبر ۲۰۲۲ تا اکتبر ۲۰۲۴ بیش از ۲۸۰ برابر کاهش یافته است. این کاهش هزینه به‌دلیل هدایت سیستم توسط مدل‌های کوچک با قابلیت در حال رشد است. در سطح سخت‌افزار، هزینه‌ها سالانه ۳۰ درصد کاهش یافته است. در حالی که بهره‌وری انرژی هر سال ۴۰ درصد بهبود یافته است. مدل‌های زبانی با وزن باز (Open-weight models) هم در حال کاهش فاصله خود با مدل‌های بسته هستند و به‌تنهایی توانسته‌اند تفاوت عملکرد را در برخی معیار‌ها از ۸ درصد به ۱.۷درصد در یک سال کاهش دهند.

مدل‌های زبانی وزن باز به‌گونه‌ای طراحی می‌شوند که وزن‌های آموزش‌یافته آن‌ها در دسترس عموم قرار می‌گیرد و توسعه‌دهندگان می‌توانند این مدل‌ها را تحلیل کرده و آن‌ها را بر اساس نیاز‌های خاص خود، تنظیم کنند. به‌طور کلی این روند‌ها در کنار هم می‌توانند موانع توسعه هوش مصنوعی پیشرفته را به‌سرعت کاهش دهند.

کوچکترین مدل های هوش مصنوعی با امتیاز بالای 60 درصد در LLMU
کوچکترین مدل‌های هوش مصنوعی با امتیاز بالای 60 درصد در LLMU طبق گزارش شاخص هوش مصنوعی

۸. دولت‌ها با مقررات و سرمایه‌گذاری، هوش مصنوعی را بهبود می‌دهند

در سال ۲۰۲۴، آژانس‌های فدرال ایالات متحده، ۵۹ مقررات مرتبط با هوش مصنوعی را تصویب کردند که تعداد آن بیش از دو برابر مقررات تصویب‌شده در سال ۲۰۲۳ بود. به علاوه تعداد آژانس‌های درگیر در این امر هم دو برابر شده بودند. در سطح جهانی، تذکر قانونی به هوش مصنوعی در ۷۵ کشور از سال ۲۰۲۳ به میزان ۲۱.۳ درصد افزایش یافته است که یک افزایش ۹ برابری از سال ۲۰۱۶ را هم نشان می‌دهد. در کنار توجه رو به رشد، دولت‌ها به همین نسبت در سرمایه‌گذاری هم رشد داشته‌اند: کانادا ۲.۴ میلیارد دلار سرمایه‌گذاری در هوش مصنوعی را متعهد شد، چین یک سرمایه‌گذاری ۴۷. ۵ میلیارد دلاری برای راه‌اندازی نیمه‌هادی‌ها انجام داد، فرانسه ۱۰۹ میلیارد یورو و هند ۱.۲۵ میلیارد دلار متعهد شد. پروژه Transcendence عربستان هم نماینده‌ی یک طرح ابتکاری ۱۰۰ میلیارد دلاری است.

تعداد قوانین مرتبط با AI در ایالات متحده
تعداد قوانین مرتبط با AI در ایالات متحده از 2016 تا 2024 طبق گزارش شاخص هوش مصنوعی

۹. هوش مصنوعی و آموزش علوم کامپیوتر در حال گسترش هستند. اما در شاخص‌های دسترسی و آمادگی همچنان شکاف‌ وجود دارد

گزارش شاخص هوش مصنوعی نشان می‌دهد که در حال حاضر، دو سوم کشور‌ها آموزش K-12 CS که چارچوبی استاندارد برای آموزش علوم کامپیوتر یا Computer Science است را ارائه می‌دهند یا در حال برنامه‌ریزی برای اجرای آن هستند. این تعداد دو برابر بیشتر از سال ۲۰۱۹ است و آفریقا و آمریکای لاتین بیشترین پیشرفت را داشته‌اند. در ایالات متحده، تعداد فارغ التحصیلان دارای مدرک لیسانس در رشته کامپیوتر در ۱۰ سال گذشته ۲۲ درصد افزایش یافته است. با این حال در بسیاری از کشور‌های آفریقایی دسترسی به دلیل شکاف‌های زیرساختی اولیه مانند برق محدود است. در ایالات متحده، ۸۱% از معلمان K-12 CS می‌گویند که هوش مصنوعی باید بخشی از آموزش اساسی CS باشد، اما کمتر از نیمی از آن‌ها برای آموزش آن احساس آمادگی می‌کنند.

دسرسی به آموزش CS به تفکیک کشورها
دسترسی به آموزش CS به تفکیک کشورها در سال 2024 طبق گزارش شاخص هوش مصنوعی

۱۰. صنعت در حال پیشروی در رقابت هوش مصنوعی است، اما مرزهای رقابت در حال باریک شدن هستند

طبق گزارش شاخص هوش مصنوعی،  تقریباً ۹۰ درصد از مدل‌های قابل توجه هوش مصنوعی در سال ۲۰۲۴ از سمت صنعت تولید شده‌اند. در حالی که این رقم در سال ۲۰۲۳، ۶۰ درصد بوده است. البته هنوز دانشگاه منبع اصلی تحقیقاتی است که مورد استناد قرار می‌گیرند. مقیاس مدل به سرعت در حال رشد است. به این صورت که محاسبات آموزشی هر پنج ماه و مجموعه داده‌ها هر هشت ماه دو برابر می‌شود. در این میان مصرف انرژی سالانه دو برابر می‌شود. با این حال شکاف‌های عملکردی در حال کاهش است: تفاوت امتیاز بین مدل‌های برتر و مدل‌های رتبه دهم از ۱۱.۹% به ۵.۴% در یک سال کاهش یافته است و دو مدل برتر اکنون فقط ۰.۷% با هم تفاوت دارند. مرز‌ها به‌صورت فزاینده‌ای در حال رقابتی شدن هستند.

عملکرد مدل‌های برتر در چت‌بات LMSYS
عملکرد مدل‌های برتر در فضای چت‌بات LMSYS برای ارائه‌دهندگان منتخب طبق گزارش شاخص هوش مصنوعی

۱۱. هوش مصنوعی به دلیل تأثیرش بر علم، افتخارات بالایی کسب می‌کند

اهمیت روزافزون هوش مصنوعی در جوایز علمی بزرگ منعکس شده است: دو جایزه نوبل، یکی برای کارهایی که منجر به یادگیری عمیق یا deep learning (فیزیک) شد، و دومی برای کاربرد آن در تاشدگی پروتئین یا protein folding (شیمی) اهدا شد. همچنین جایزه تورینگ (Turing Award) از کمک‌های پیشگامانه هوش مصنوعی در یادگیری تقویتی (reinforcement learning) تقدیر کرد.

AlphaFold 3 در مقایسه با baselines برای پیوند لیگاند-پروتئین
AlphaFold 3 در مقایسه با baselines برای پیوند لیگاند-پروتئین در گزارش شاخص هوش مصنوعی

۱۲. استدلال پیچیده همچنان یک چالش است

مدل‌های هوش مصنوعی در کارهایی مانند حل مسائل المپیاد بین‌المللی ریاضی برتری دارند، اما همچنان با معیارهای استدلال پیچیده مانند PlanBench فعالیت می‌کنند. آنها اغلب قادر به حل تکالیف منطقی به‌صورت قابل اعتماد نیستند. این حتی زمانی که راه حل‌های صحیح قابل اثبات وجود داشته باشد هم صادق است و اثربخشی آنها را در حوزه‌های حساس که در آن دقت بسیار مهم است، محدود می‌کند.

PlanBench: نمونه‌های درست
PlanBench (معیاری برای ارزیابی مدل‌های زبانی بزرگ): نمونه‌های صحیح طبق گزارش شاخص هوش مصنوعی

 

منبع: stanford.edu

 

https://pvst.ir/l85

0 نظر

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

برای بوکمارک این نوشته
Back To Top
جستجو