ستاد هوش مصنوعی، به پیشنهاد معاونت علمی تشکیل میشود
سند تشکیل «ستاد فناوری و کاربرد هوش مصنوعی» به تصویب هیات وزیران رسید. معاونت علمی،…
۴ خرداد ۱۴۰۴
۴ خرداد ۱۴۰۴
زمان مطالعه : ۱۱ دقیقه
تأثیر هوش مصنوعی بر جامعه هرگز تا این اندازه روشن نبوده است. میتوان گفت که هوش مصنوعی متحولکنندهترین فناوری قرن بیست و یکم است. اما مزایای آن بهطور مساوی توزیع نمیشود، مگر اینکه توسعه آن را بهصورت مدبرانه هدایت کنیم. بررسی شاخص هوش مصنوعی در این مسیر به ما کمک میکند.
شاخص هوش مصنوعی یکی از جامعترین دیدگاههای مبتنی بر داده را از هوش مصنوعی ارائه میدهد. این شاخص به میزانی اعتبار دارد که توسط رسانههای جهانی، دولتها و شرکتهای پیشرو بهعنوان یک منبع مورد اعتماد شناخته میشود. شاخص AI شامل بینشهای دقیق و عینی در مورد پیشرفت فنی هوش مصنوعی، نفوذ اقتصادی و تأثیر اجتماعی آن است که میتواند برای سیاستگذاران، رهبران کسبوکار و عموم مردم مفید باشد.
مهمترین یافتههای گزارش شاخص هوش مصنوعی ۲۰۲۵ را در ادامه با هم مرور میکنیم:
طبق گزارش شاخص هوش مصنوعی، محققان در سال ۲۰۲۳ معیارهای جدیدی مانند «درک و استدلال چندوجهی» (MMMU) یا multimodal understanding and reasoning، «سؤالات علمی در سطح دکتری» (GPQA) یا PhD-level science questions و «ارزیابی مدلهای زبانی بزرگ در مورد مسائل نرمافزاری» یا SWE-bench را برای آزمایش محدودیتهای سیستمهای هوش مصنوعی پیشرفته ارائه کردند. فقط یک سال بعد از آن، عملکرد هوش مصنوعی در مقایسه با انسان به شدت بهبود پیدا کرد: امتیازات در MMMU، GPQA و SWE-bench به ترتیب ۱۸.۸، ۴۸.۹ و ۶۷.۳ درصد افزایش یافت. فراتر از معیارها، سیستمهای هوش مصنوعی گامهای بزرگی در تولید ویدیوی با کیفیت بالا برداشتند و در برخی حوزهها، عاملهای مدل زبانی حتی در انجام وظایف برنامهنویسی با بودجههای زمانی محدود، بهتر از انسانها عمل کردند.
از مراقبتهای بهداشتی گرفته تا حمل و نقل، هوش مصنوعی به سرعت از آزمایشگاه به سمت زندگی روزمره ما در حال حرکت است. در سال ۲۰۲۳، FDA استفاده از ۲۲۳ دستگاه پزشکی مجهز به هوش مصنوعی را تأیید کرد. این تعداد را با شش دستگاه در سال ۲۰۱۵ مقایسه کنید. خودروهای خودران موجود در جادهها دیگر آزمایشی نیستند. بلکه بهعنوان مثال، Waymo، یکی از بزرگترین اپراتورهای ایالات متحده، هر هفته بیش از ۱۵۰ هزار خودرو سواری خودران را به بازار ارائه میدهد. در عین حال، ناوگان روبوتاکسی ارزان قیمت Apollo Go شرکت بایدو (Baidu) در حال حاضر به شهرهای متعددی در سراسر چین خدماترسانی میکند.
کسبوکارها میتوانند بهطور کامل با هوش مصنوعی کار کنند و این باعث افزایش سرمایهگذاری و کاربرد بیسابقه میشود. دلیل این رشد، تأثیرات بهرهوری بالایی است که در تحقیقات ثابت شده است.
طبق گزارش شاخص هوش مصنوعی، در سال ۲۰۲۴، سرمایهگذاری خصوصی ایالات متحده در هوش مصنوعی به ۱۰۹. ۱ میلیارد دلار افزایش یافت که تقریباً ۱۲ برابر عدد ۹. ۳ میلیارد دلار چین و ۲۴ برابر عدد ۴. ۵ میلیارد دلار بریتانیا بود. هوش مصنوعی مولد با جذب ۳۳.۹ میلیارد دلار سرمایهگذاری خصوصی در سطح جهان، افزایشی ۱۸.۷ درصدی نسبت به سال ۲۰۲۳ را تجربه کرد که یک رشد قابل ملاحظه محسوب میشود. استفاده کسبوکارها از هوش مصنوعی هم در حال افزایش است: ۷۸ درصد از سازمانها گزارش دادند که از هوش مصنوعی در سال ۲۰۲۴ استفاده میکردند. این عدد برای سال قبل ۵۵ درصد بود. در همین حال، تحقیقات بسیاری تأیید میکنند که هوش مصنوعی بهرهوری را افزایش میدهد و در بیشتر موارد به کاهش شکافهای مهارتی در میان نیروی کار کمک میکند.
گزارش شاخص هوش مصنوعی نشان میدهد که در سال ۲۰۲۴، مؤسسات مستقر در ایالات متحده ۴۰ مدل هوش مصنوعی قابل توجه تولید کردند که بهطور قابل توجهی از ۱۵ مدل چینی و سه مدل اروپایی پیشی گرفت. در حالی که ایالات متحده پیشتازی خود را از نظر کمیت حفظ کرده است، مدلهای چینی به سرعت در حال پر کردن شکاف کیفیت هستند. تفاوت عملکرد در معیارهای اصلی مانند «درک زبانی چندوظیفهای» (MMLU) یا multitask language understanding و معیار «ارزیابی قابلیتهای تولید کد LLM» یا HumanEval در سال ۲۰۲۳ یک عدد دو رقمی بود. ولی در سال ۲۰۲۴ عملکردها تقریباً برابر شد. در عین حال، چین همچنان در انتشارات و حقوق ثبت اختراع هوش مصنوعی (AI publications and patents) پیشتاز است. در همین زمان، توسعه مدلهای AI در حال جهانی شدن است و مدلهای قابل توجهی از مناطقی مانند خاورمیانه، آمریکای لاتین و آسیای جنوب شرقی در حال راهاندازی هستند.
حوادث مرتبط با هوش مصنوعی به شدت در حال افزایش هستند و هنوز ارزیابیهای استاندارد هوش مصنوعی مسئول (RAI) یا «روش مدیریت ریسکهای مرتبط با راهحلهای مبتنی بر هوش مصنوعی»، در میان توسعهدهندگان مدلهای صنعتی بزرگ نادر است. با این حال، معیارهای جدیدی مانند ارزیابی جامع ایمنی مدلهای زبانی (HELM Safety) یا holistic evaluation of language models safety، AIR-Bench (یک رویکرد جدید برای معیارهای هوش مصنوعی است که از هوش مصنوعی مولد برای ایجاد معیارهای واقعیتر و انعطافپذیرتر استفاده میکند) و FACTS ابزارهای امیدوارکنندهای را برای ارزیابی واقعیت و ایمنی ارائه میدهند.
در میان شرکتها، هنوز بین شناخت ریسکهای RAI و انجام اقدامات معنادار شکاف وجود دارد. در مقابل، دولتها فوریت را افزایش دادهاند: در سال ۲۰۲۴، همکاری جهانی در زمینه حکمرانی هوش مصنوعی تشدید شد. سازمانهایی از جمله سازمان همکاری و توسعه اقتصادی (OECD)، اتحادیه اروپا، سازمان ملل و اتحادیه آفریقا چارچوبهایی را منتشر کردند که بر شفافیت، قابل اعتماد بودن و دیگر اصول اصلی هوش مصنوعی تاکید دارند.
طبق گزارش شاخص هوش مصنوعی، در کشورهایی مانند چین (۸۳%)، اندونزی (۸۰%) و تایلند (۷۷%)، اکثریت مردم محصولات و خدمات هوش مصنوعی را بیشتر مفید میدانند تا مضر. در مقابل، خوشبینی نسبت به AI در کشورهایی مانند کانادا (۴۰%)، ایالات متحده (۳۹%) و هلند (۳۶%) بسیار پایینتر است. با این حال، احساسات در حال تغییر است: از سال ۲۰۲۲، خوشبینی در چندین کشور قبلاً بدبین از جمله آلمان (+۱۰%)، فرانسه (+۱۰%)، کانادا (+۸%)، بریتانیا (+۸%) و ایالات متحده (+۴%) رشد قابل توجهی داشته است.
مطابق با گزارش شاخص هوش مصنوعی، هزینه استنتاج سیستمی که در سطح GPT-۳.۵ کار میکند بین نوامبر ۲۰۲۲ تا اکتبر ۲۰۲۴ بیش از ۲۸۰ برابر کاهش یافته است. این کاهش هزینه بهدلیل هدایت سیستم توسط مدلهای کوچک با قابلیت در حال رشد است. در سطح سختافزار، هزینهها سالانه ۳۰ درصد کاهش یافته است. در حالی که بهرهوری انرژی هر سال ۴۰ درصد بهبود یافته است. مدلهای زبانی با وزن باز (Open-weight models) هم در حال کاهش فاصله خود با مدلهای بسته هستند و بهتنهایی توانستهاند تفاوت عملکرد را در برخی معیارها از ۸ درصد به ۱.۷درصد در یک سال کاهش دهند.
مدلهای زبانی وزن باز بهگونهای طراحی میشوند که وزنهای آموزشیافته آنها در دسترس عموم قرار میگیرد و توسعهدهندگان میتوانند این مدلها را تحلیل کرده و آنها را بر اساس نیازهای خاص خود، تنظیم کنند. بهطور کلی این روندها در کنار هم میتوانند موانع توسعه هوش مصنوعی پیشرفته را بهسرعت کاهش دهند.
در سال ۲۰۲۴، آژانسهای فدرال ایالات متحده، ۵۹ مقررات مرتبط با هوش مصنوعی را تصویب کردند که تعداد آن بیش از دو برابر مقررات تصویبشده در سال ۲۰۲۳ بود. به علاوه تعداد آژانسهای درگیر در این امر هم دو برابر شده بودند. در سطح جهانی، تذکر قانونی به هوش مصنوعی در ۷۵ کشور از سال ۲۰۲۳ به میزان ۲۱.۳ درصد افزایش یافته است که یک افزایش ۹ برابری از سال ۲۰۱۶ را هم نشان میدهد. در کنار توجه رو به رشد، دولتها به همین نسبت در سرمایهگذاری هم رشد داشتهاند: کانادا ۲.۴ میلیارد دلار سرمایهگذاری در هوش مصنوعی را متعهد شد، چین یک سرمایهگذاری ۴۷. ۵ میلیارد دلاری برای راهاندازی نیمههادیها انجام داد، فرانسه ۱۰۹ میلیارد یورو و هند ۱.۲۵ میلیارد دلار متعهد شد. پروژه Transcendence عربستان هم نمایندهی یک طرح ابتکاری ۱۰۰ میلیارد دلاری است.
گزارش شاخص هوش مصنوعی نشان میدهد که در حال حاضر، دو سوم کشورها آموزش K-12 CS که چارچوبی استاندارد برای آموزش علوم کامپیوتر یا Computer Science است را ارائه میدهند یا در حال برنامهریزی برای اجرای آن هستند. این تعداد دو برابر بیشتر از سال ۲۰۱۹ است و آفریقا و آمریکای لاتین بیشترین پیشرفت را داشتهاند. در ایالات متحده، تعداد فارغ التحصیلان دارای مدرک لیسانس در رشته کامپیوتر در ۱۰ سال گذشته ۲۲ درصد افزایش یافته است. با این حال در بسیاری از کشورهای آفریقایی دسترسی به دلیل شکافهای زیرساختی اولیه مانند برق محدود است. در ایالات متحده، ۸۱% از معلمان K-12 CS میگویند که هوش مصنوعی باید بخشی از آموزش اساسی CS باشد، اما کمتر از نیمی از آنها برای آموزش آن احساس آمادگی میکنند.
طبق گزارش شاخص هوش مصنوعی، تقریباً ۹۰ درصد از مدلهای قابل توجه هوش مصنوعی در سال ۲۰۲۴ از سمت صنعت تولید شدهاند. در حالی که این رقم در سال ۲۰۲۳، ۶۰ درصد بوده است. البته هنوز دانشگاه منبع اصلی تحقیقاتی است که مورد استناد قرار میگیرند. مقیاس مدل به سرعت در حال رشد است. به این صورت که محاسبات آموزشی هر پنج ماه و مجموعه دادهها هر هشت ماه دو برابر میشود. در این میان مصرف انرژی سالانه دو برابر میشود. با این حال شکافهای عملکردی در حال کاهش است: تفاوت امتیاز بین مدلهای برتر و مدلهای رتبه دهم از ۱۱.۹% به ۵.۴% در یک سال کاهش یافته است و دو مدل برتر اکنون فقط ۰.۷% با هم تفاوت دارند. مرزها بهصورت فزایندهای در حال رقابتی شدن هستند.
اهمیت روزافزون هوش مصنوعی در جوایز علمی بزرگ منعکس شده است: دو جایزه نوبل، یکی برای کارهایی که منجر به یادگیری عمیق یا deep learning (فیزیک) شد، و دومی برای کاربرد آن در تاشدگی پروتئین یا protein folding (شیمی) اهدا شد. همچنین جایزه تورینگ (Turing Award) از کمکهای پیشگامانه هوش مصنوعی در یادگیری تقویتی (reinforcement learning) تقدیر کرد.
مدلهای هوش مصنوعی در کارهایی مانند حل مسائل المپیاد بینالمللی ریاضی برتری دارند، اما همچنان با معیارهای استدلال پیچیده مانند PlanBench فعالیت میکنند. آنها اغلب قادر به حل تکالیف منطقی بهصورت قابل اعتماد نیستند. این حتی زمانی که راه حلهای صحیح قابل اثبات وجود داشته باشد هم صادق است و اثربخشی آنها را در حوزههای حساس که در آن دقت بسیار مهم است، محدود میکند.
منبع: stanford.edu