بابک نقاش تحریریه

پیوست » آموزش » گزارش سازمان همکاری و توسعه اقتصادی بررسی می‌کند: هوش مصنوعی یا توهم تبحر

گزارش سازمان همکاری و توسعه اقتصادی بررسی می‌کند: هوش مصنوعی یا توهم تبحر

بابک نقاش تحریریه

۲۹ اردیبهشت ۱۴۰۵

زمان مطالعه : ۱۳ دقیقه

گزارش تازه سازمان همکاری و توسعه اقتصادی (OECD) با عنوان «چشم‌انداز دیجیتال آموزش ۲۰۲۶» با تجزیه و تحلیل بیش از ۱۰۰ مطالعه تجربی، داده‌های پیمایشی از ۲۰ کشور و بررسی ده‌ها نمونه موردی، جامع‌ترین تصویر از وضعیت هوش مصنوعی مولد در آموزش را ارائه می‌دهد.

به‌گزارش پیوست، سازمان همکاری و توسعه اقتصادی (OECD) در گزارش خود با عنوان «چشم‌انداز دیجیتال آموزش ۲۰۲۶» هشدار می‌دهد استفاده بی‌ضابطه دانش‌آموزان از ابزارهای هوش مصنوعی مولد مانند ChatGPT، عملکرد تمرینی آنها را تا ۱۲۷درصد افزایش می‌دهد، اما در آزمون‌های بدون دسترسی به هوش مصنوعی، این دانش‌آموزان تا ۱۷درصد ضعیف‌تر از همسالانی عمل می‌کنند که هرگز از این ابزارها استفاده نکرده‌اند. این پدیده که «توهم تبحر» نام گرفته، زنگ خطری جدی برای نظام‌های آموزشی جهان است.

با این حال، همین گزارش نشان می‌دهد که هوش مصنوعی می‌تواند زمان برنامه‌ریزی درسی معلمان را ۳۱درصد کاهش دهد و نرخ قبولی دانش‌آموزان معلمان کم‌تجربه را ۹ واحد درصد افزایش دهد. سوال کلیدی برای سیاست‌گذاران آموزشی این است: چگونه می‌توان از هوش مصنوعی به عنوان «شریک حرفه‌ای» استفاده کرد، بدون آنکه به «ماشین فرسایش مهارت‌ها» تبدیل شود؟

«توهم تبحر»؛ نمره خوب بدون یادگیری

استفاده از هوش مصنوعی مولد (مثل ChatGPT) عملکرد ظاهری دانش‌آموزان را به طرز چشمگیری افزایش می‌دهد، اما شواهد محکمی وجود دارد که این افزایش عملکرد اغلب به یادگیری عمیق و پایدار منجر نمی‌شود. در یک مطالعه میدانی در مقیاس بزرگ در ترکیه روی دانش‌آموزان پایه نهم تا یازدهم، این نتایج بدست آمده است: دانش‌آموزانی که از نسخه استاندارد ChatGPT استفاده کردند، عملکرد تمرینی آنها ۴۸درصد بهتر از گروه کنترل بود. نسخه آموزشی (Tutor) که برای جلوگیری از پاسخ مستقیم طراحی شده بود، این افزایش را به ۱۲۷درصد رساند. با این حال، هنگامی که دسترسی به ابزار قطع شد و دانش‌آموزان در یک محیط کتاب‌بسته‌ (بدون دسترسی به AI) مورد آزمون قرار گرفتند، دانش‌آموزان گروه ChatGPT عملکردی ۱۷درصد بدتر از گروهی داشتند که هرگز از هوش مصنوعی استفاده نکرده بودند.

مقایسه عملکرد تمرینی در مقابل یادگیری واقعی (مطالعه ترکیه: افزایش ۴۸٪ و ۱۲۷٪ در تمرین، افت ۱۷٪ در یادگیری)

این پدیده در گزارش OECD «توهم تبحر» (False Mastery) نامیده شده است. دانش‌آموز وظیفه را درست انجام می‌دهد، اما فرآیندهای شناختی و فراشناختی لازم برای یادگیری را طی نکرده است. در مطالعه‌ای دیگر در ایالات متحده با مشارکت دانشجویان ۵ دانشگاه، از آنها خواسته شد انشایی ۲۰ دقیقه‌ای بنویسند. گروهی که از ChatGPT استفاده کردند، نمرات بالاتری گرفتند، اما تنها ۱۲٪ آنها یک ساعت بعد توانستند بخشی از انشای خود را دقیقا به خاطر بیاورند، در حالی که این نسبت در گروه‌هایی که به تنهایی یا با موتور جستجو کار کردند، ۸۹درصد بود. تصویربرداری مغزی این دانشجویان نشان داد که فعالیت نواحی مرتبط با تفکر اجرایی در گروه استفاده‌کننده از ChatGPT به طور قابل‌توجهی کاهش یافته است.

این پدیده را «بار شناختی معکوس» نیز می‌نامند: هوش مصنوعی به جای تسهیل، فرآیندهای مغزی ضروری برای یادگیری را تضعیف می‌کند.

این یافته‌ها یک هشدار راهبردی روشن است. تکیه بر سنجش‌های سنتی (نمره تمرین، کیفیت انشا، پاسخ به سوالات تشریحی) در عصر هوش مصنوعی گمراه‌کننده است. آموزش و پرورش در صورتی که نتواند «فرآیند یادگیری» را از «نتیجه ظاهری» تفکیک کند، با نسلی از دانش‌آموزان مواجه خواهد شد که در انجام تکالیف با کمک ماشین ماهرند، اما در تفکر مستقل، دانش بنیادین و توانایی حفظ و بازیابی اطلاعات ضعیف هستند. این پدیده را «بار شناختی معکوس» نیز می‌نامند: هوش مصنوعی به جای تسهیل، فرآیندهای مغزی ضروری برای یادگیری را تضعیف می‌کند.

دو بحران تنبلی فراشناختی و وابستگی به ماشین

گزارش OECD با استناد به مطالعات متعدد، مفهومی به نام «تنبلی فراشناختی» (Metacognitive Laziness) را معرفی می‌کند. در یک مطالعه بر روی دانشجویان چینی که وظیفه بازنویسی مقاله را بر عهده داشتند، گروهی که از ChatGPT استفاده کردند در مقایسه با گروهی که از مشاور انسانی کمک گرفتند، مراحل مهمی مانند «تشخیص نیاز خود»، «ارزیابی کمک دریافتی» و «بازبینی نهایی» را حذف کردند. آنها مستقیما درخواست راه‌حل می‌دادند و آن را بدون پردازش عمیق پیاده‌سازی می‌کردند.

نظرسنجی از ۷۰۰۰ دانش‌آموز در هفت کشور اروپایی نشان می‌دهد که بیش از نیمی از آنان (۵۶٪) از هوش مصنوعی برای «کسب اطلاعات» و نزدیک به نیمی (۴۵٪) برای «دریافت توضیح مفاهیم» استفاده می‌کنند. نگران‌کننده‌تر آنکه ۳۱٪ از دانش‌آموزان اعتراف کرده‌اند که از هوش مصنوعی برای دریافت «راه‌حل کامل تکالیف» استفاده می‌کنند.

در یک مطالعه یک‌ساله دیگر، محققان دریافتند دانش‌آموزانی که صرفا برای کسب دانش (نه برای همراهی مجازی) با چت‌بات‌ها تعامل داشتند، به تدریج استقلال یادگیری خود را از دست دادند. هرچه تعداد تعاملات با چت‌بات برای مقاصد ابزاری بیشتر می‌شد، «حضور اجتماعی» و «خودتنظیمی یادگیری» کاهش می‌یافت.

«سهولت» در یادگیری همیشه مطلوب نیست. آموزش موثر نیازمند «دشواری مطلوب» (Desirable Difficulty) است. هوش مصنوعی عمومی این دشواری را حذف می‌کند

همچنین مطالعه‌ای در آلمان نشان داد دانش‌آموزانی که برای یک وظیفه تحقیق علمی از LLM استفاده کردند، بار شناختی کمتری احساس می‌کردند (یعنی کار برایشان آسان‌تر بود)، اما کیفیت استدلال و استنتاج نهایی آنها در مقایسه با گروهی که از موتور جستجوی گوگل استفاده کردند، به طور معناداری پایین‌تر بود. «سهولت» در یادگیری همیشه مطلوب نیست. آموزش موثر نیازمند «دشواری مطلوب» (Desirable Difficulty) است. هوش مصنوعی عمومی این دشواری را حذف می‌کند و در نتیجه مسیرهای عصبی مرتبط با حل مساله و تفکر انتقادی کمتر تحریک می‌شوند. نظام آموزشی باید به دنبال ابزارهایی باشد که این دشواری را حفظ کنند (مثلا با ارائه سرنخ، نه پاسخ مستقیم).

معلم در خطر حاشیه‌نشینی

تهدید هوش مصنوعی تنها متوجه دانش‌آموزان نیست. معلمان نیز در معرض «واگذاری شناختی» قرار دارند. بر اساس نظرسنجی TALIS 2024 سازمان OECD، به طور متوسط ۳۶درصد از معلمان دوره اول متوسطه در کشورهای عضو از هوش مصنوعی در کار خود استفاده می‌کنند، اما این میزان تنوع بالایی دارد: از ۷۵درصد در سنگاپور و امارات متحده عربی تا کمتر از ۲۰درصد در فرانسه و ژاپن. از میان کاربران، ۶۸درصد از AI برای خلاصه‌سازی موضوعات تدریسی و ۶۴درصد برای تولید طرح درس استفاده می‌کنند. این یعنی استفاده غالب معلمان، در راستای «جایگزینی» وظایف است، نه «ارتقا».

بر اساس داده‌های تالیس ۳۶٪ معلمان از هوش مصنوعی استفاده می‌کنند (با تنوع شدید کشوری از ۷۵٪ در سنگاپور تا کمتر از ۲۰٪ در فرانسه و ژاپن). از میان کاربران، ۶۸٪ برای خلاصه‌سازی و ۶۴٪ برای تولید طرح درس از AI استفاده می‌کنند. ۷۵٪ معلمان فاقد مهارت کافی برای تدریس با AI هستند.

گزارش OECD پنج سطح تعامل معلم و هوش مصنوعی را معرفی می‌کند:

تراکنشی (Transactional)
موقعیتی (Situational)
عملیاتی (Operational)
عملی-تاملی (Praxical)
هم‌افزا (Synergistic)

تنها سطح پنجم (هم‌افزا) مطلوب است. در سطوح پایین‌تر، معلم به تدریج به «تاییدکننده خروجی ماشین» تبدیل می‌شود. گزارش هشدار می‌دهد که اگر معلمان زیر نظر اسکریپت‌ها یا داشبوردهایی کار کنند که حرکات آموزشی آنها را تعیین می‌کند، هویت حرفه‌ای آنان به «کارگر خط تولید» نزدیک می‌شود. جالب اینجاست که به طور متوسط ۷۵درصد معلمان در OECD اعلام کرده‌اند که فاقد دانش یا مهارت کافی برای آموزش با هوش مصنوعی هستند و حدود ۵۰درصد از این گروه معتقدند اساسا نباید از AI در تدریس استفاده کرد.

استفاده انبوه از ابزارهای هوش مصنوعی بدون بازطراحی نقش معلم و بدون ارائه آموزش‌های بنیادین، نه تنها بهره‌وری نمی‌آفریند، بلکه فرسایش سرمایه انسانی گران‌بهایی به نام «معلم» را تسریع می‌کند. شاخص موفقیت نباید کاهش ساعت کاری معلم باشد، بلکه باید «افزایش عاملیت (Agency) و قضاوت حرفه‌ای» او تعریف شود.

نویسندگانی که ۵ ایده از هوش مصنوعی دریافت کردند، بالاترین نمرات خلاقیت و کیفیت نوشتار را نسبت به گروه بدون دریافت ایده داشتند. اندازه اثر متوسط تا بزرگ (بین ۰.۲ تا ۰.۶+) نشان‌دهنده افزایش معنادار است. با این حال، شباهت محتوایی داستان‌های تولیدشده با کمک AI بیشتر از گروه بدون AI بود که هشداردهنده است.

بهره‌وری واقعی ممکن است

با وجود هشدارها، گزارش OECD شواهد امیدوارکننده‌ای از بهره‌وری واقعی و همکاری ثمربخش انسان و ماشین ارائه می‌دهد. یک کارآزمایی تصادفی‌شده روی ۲۵۹ معلم در ۶۸ مدرسه متوسطه در انگلستان نشان داد که استفاده هدفمند از هوش مصنوعی مولد (همراه با راهنمایی عملی)، زمان برنامه‌ریزی هفتگی دروس را به طور متوسط از ۸۱.۵ دقیقه به ۵۶.۲ دقیقه کاهش داد، یعنی کاهشی معادل ۳۱درصد بدون آنکه کیفیت طرح‌های درسی و منابع آموزشی آسیب ببیند.

هوش مصنوعی در صورتی کارآمد است که «آموزش‌محور» طراحی شود، نه «عمومی».

در حوزه پشتیبانی از معلمان کم‌تجربه، نتایج حتی درخشان‌تر است. ابزار Tutor CoPilot که توسط دانشگاه استنفورد توسعه یافته، در یک کارآزمایی تصادفی‌شده با ۹۰۰ معلم خصوصی (Tutor) و ۱۸۰۰ دانش‌آموز در جوامع محروم ایالات متحده، نرخ قبولی دانش‌آموزان را به طور متوسط ۴ واحد درصد افزایش داد. اما نکته کلیدی اینجاست: برای معلمانی که در ابتدا «کم‌کیفیت‌ترین» ارزیابی شده بودند، این افزایش ۹ واحد درصد بود. همچنین معلمانی که از این ابزار استفاده کردند، کمتر به ارائه پاسخ مستقیم تمایل نشان دادند و بیشتر از سوالات راهنما (Guiding Questions) استفاده کردند.

هوش مصنوعی در صورتی کارآمد است که «آموزش‌محور» طراحی شود، نه «عمومی». تفاوت نسخه استاندارد ChatGPT با نسخه آموزشی آن، تفاوت بین افت ۱۷درصد در یادگیری و افزایش ۹ درصدی در عملکرد است. نظام آموزشی باید به جای منع استفاده از AI، روی تهیه و بومی‌سازی «نسخه‌های آموزشی» متمرکز شود که اصول یادگیری (مثل داربست‌زنی، پرسش سقراطی و بازخورد فرآیندی) در آنها پیاده شده باشد.

این یافته‌ها برگرفته از یک آزمایش عملی و کنترل‌شده است که به مدت دو هفته در یک دوره مقدماتی فیزیک در آموزش عالی ایالات متحده در سال ۲۰۲۳ اجرا شد.

مدل مطلوب؛ همکاری انتقادی

گزارش OECD سه الگوی اصلی تعامل انسان و هوش مصنوعی را مشخص می‌کند:

جایگزینی (Replacement)
مکمل‌سازی (Complementarity)
ارتقا (Augmentation)

مدل جایگزینی (اتوماسیون کامل وظایف معلم) گرچه بهره‌ور است، اما هزینه پنهان آن «کاهش مهارت» و «تضعیف رابطه انسانی» است. مدل مکمل‌سازی (AI داده می‌دهد، معلم تصمیم می‌گیرد) بهتر است، اما معلم را فراتر از توان فعلی خود ارتقا نمی‌دهد.

مدل مطلوب، یعنی ارتقا (Augmentation)، مستلزم سطح پنجم «هم‌تیمی معلم و AI» است. در این سطح، معلم و سیستم یکدیگر را نقد می‌کنند، فرضیات را به چالش می‌کشند و به فهمی مشترک می‌رسند که از توان هرکدام به تنهایی فراتر می‌رود. در حال حاضر چنین ابزارهایی نادرند. گزارشی از یک نمونه موفق با مشارکت ۱۰ معلم ریاضی نشان می‌دهد که توسعه محتوای آموزشی با این روش از چند ماه به چند ساعت کاهش یافت و بار کاری درک‌شده معلمان ۵۰درصد کمتر شد. همچنین در یک مطالعه با ۱۶۰۰ دانشجو، ابزار پشتیبانی از بازخورد همتا (Peer Feedback) مبتنی بر AI باعث افزایش موقت کیفیت بازخورد شد، اما پس از حذف ابزار، مهارت‌های دانشجویان به سطح اولیه بازگشت. یعنی «ارتقا» رخ نداده بود، تنها «کمک لحظه‌ای» ارائه شده بود.

سهم کاربران اینترنت از ChatGPT در فاصله سال‌های ۲۰۲۴ تا ۲۰۲۵ در تمام کشورهای OECD رشد داشته است. با این حال، ۶۰٪ از این استفاده در کشورهای پردرآمد متمرکز شده و سهم کشورهای کم‌درآمد کمتر از ۱٪ است. این آمار هشداردهنده نشان می‌دهد دسترسی به هوش مصنوعی پیشرفته در حال تبدیل شدن به یک «شکاف دیجیتال جدید» است.

عدالت آموزشی و رقابت ژئوپلیتیکی

گزارش OECD به صراحت به پیامدهای ژئوپلیتیکی و عدالت‌محور این موضوع اشاره می‌کند. کشورهایی که AI را صرفا به عنوان ابزار کاهش هزینه می‌بینند، در بلندمدت به کیفیت سرمایه انسانی خود آسیب می‌زنند. در مقابل، کشورهایی که از AI برای تقویت قضاوت حرفه‌ای معلمان و یادگیری عمیق استفاده می‌کنند، در اقتصاد دیجیتال مزیت پایداری خواهند داشت. در حال حاضر، داده‌های ترافیک وب نشان می‌دهد که ۶۰درصد استفاده از هوش مصنوعی مولد در کشورهای پردرآمد است، در مقابل ۳۹درصد در کشورهای با درآمد متوسط و کمتر از یک درصد در کشورهای کم‌درآمد.

کشورهای پیشرو (مثل استونی با برنامه AI Leap و هلند با NOLAI) در حال سرمایه‌گذاری روی ابزارهای بومی و متناسب با برنامه درسی ملی خود هستند.

اما فناوری می‌تواند پلی برای عبور از این شکاف باشد. پروژه AI Unplugged در برزیل نشان داد که حتی با دسترسی محدود به اینترنت (مثلا یک بار در هفته)، می‌توان از AI برای پشتیبانی از معلمان در مناطق روستایی استفاده کرد. در این پروژه، معلمان از برگه‌های تصویری دانش‌آموزان عکس می‌گرفتند و آفلاین، AI کیفیت انشا را تحلیل می‌کرد. مدل‌های زبانی کوچک (Small Language Models) که روی گوشی موبایل اجرا می‌شوند، راهی امیدوارکننده برای عبور از شکاف دیجیتال هستند. با این حال، در حال حاضر این مدل‌ها در اجرای راهبردهای پیچیده‌یادی (مثل روش سقراطی) ناتوانند و اغلب پاسخ مستقیم می‌دهند.

هوش مصنوعی می‌تواند شکاف دیجیتال را کاهش دهد (مثلا با مدل‌های زبانی کوچک و آفلاین)، اما در صورت عدم سیاست‌گذاری، می‌تواند آن را عمیق‌تر کند. کشورهای پیشرو (مثل استونی با برنامه AI Leap و هلند با NOLAI) در حال سرمایه‌گذاری روی ابزارهای بومی و متناسب با برنامه درسی ملی خود هستند. ایجاد «ابزارهای حاکمیتی هوش مصنوعی در آموزش» به اندازه داشتن «ابر ملی» یا «نیمه‌هادی ملی» مهم است.

: نتایج حاصل از یک کارآزمایی روی ۹۰۰ معلم خصوصی و ۱۸۰۰ دانش‌آموز در جوامع محروم ایالات متحده نشان می‌دهد که استفاده از Tutor Copilot نرخ قبولی دانش‌آموزان را به طور متوسط ۴ واحد درصد افزایش داده است. با این حال، تأثیر این ابزار برای معلمانی که در ابتدا «کم‌کیفیت‌ترین» ارزیابی شده بودند، بسیار چشمگیرتر بوده و نرخ قبولی را ۹ واحد درصد (از ۵۶٪ به ۶۵٪) افزایش داده است.

توصیه‌های عملی چهارگانه برای آموزش و پرورش

۱. بازتعریف نظام ارزشیابی (از محصول به فرآیند): نظام ارزشیابی باید از سنجش «خروجی» (انشا، پاسخ نهایی) به سمت سنجش «فرآیند» (تاریخچه تعامل با AI، توانایی بازخوردگیری، کیفیت گفت‌وگو، ثبت مراحل تفکر) حرکت کند. ابزارهایی مانند پلتفرم FLoRA نشان داده‌اند که ردیابی فرآیندهای خودتنظیمی یادگیری (Self-regulation) می‌تواند پیش‌بینی‌کننده قوی‌تری از عملکرد نسبت به خود نمره نهایی باشد.

۲. توانمندسازی معلمان (فراتر از مهندسی پرامپت): برنامه‌های توسعه حرفه‌ای معلمان نباید محدود به «نحوه سوال پرسیدن از ChatGPT» شود. بلکه باید شامل این موارد باشد

طراحی سناریوی یادگیری با AI
نقد و اصلاح خروجی ماشین
تنظیم سطح خودکارسازی
آشنایی با مفاهیمی مثل توهم مدل، سوگیری الگوریتمی و حریم خصوصی داده

۳. توسعه و تدارک ابزارهای «معلم-محور» با قابلیت نظارت انسانی (Human-in-the-Loop): نظام تدارکات دولتی باید به سمتی حرکت کند که ابزارهای خریداری‌شده دارای ویژگی‌های زیر باشند: امکان مشاهده تعامل دانش‌آموز با AI، امکان اصلاح خروجی قبل از دیده شدن توسط دانش‌آموز، امکان تنظیم سطح «توهم» مدل متناسب با هدف یادگیری، و امکان «وتو» یا «نادیده گرفتن» توصیه‌های سیستم توسط معلم.

۴. ایجاد ائتلاف ملی برای هوش مصنوعی آموزشی (NEAIR): با الهام از نمونه هلند (NOLAI – National Education Lab AI)، استونی (AI Leap) و کره جنوبی (مجوزدهی به توتورهای AI منطبق با برنامه درسی ملی)، یک همکاری سه‌جانبه میان دولت (وزارت آموزش)، دانشگاه‌ها (علوم تربیتی و کامپیوتر) و بخش خصوصی (ادتک) برای طراحی، اعتبارسنجی و بومی‌سازی ابزارهای هوش مصنوعی آموزشی تشکیل شود.

آینده مطلوب، نه «مدرسه بدون معلم» است و نه «معلم وابسته به هوش مصنوعی». آینده مطلوب، معلمی است که با AI بهتر می‌بیند، دقیق‌تر تصمیم می‌گیرد، سریع‌تر بازخورد می‌دهد، اما همچنان مسئول، صاحب‌اختیار و انسانی باقی می‌ماند. تصمیم‌گیری در این مقطع تاریخی، تعیین‌کننده آن است که AI در آموزش، «شریک حرفه‌ای» خواهد بود یا «ماشین فرسایش حرفه‌ای».

OECD Digital Education Outlook 2026

https://pvst.ir/o2b

0 نظر

ارسال دیدگاه لغو پاسخ