آیا شاد جوابگوی نیاز آموزشی دانشآموزان خواهد بود؟
آموزش یکی از نخستین خدماتی است که در زمان جنگ دچار اختلال میشود. جنگ دوازدهروزه…
۲۴ اسفند ۱۴۰۴
۲۹ اردیبهشت ۱۴۰۵
زمان مطالعه : ۱۳ دقیقه

گزارش تازه سازمان همکاری و توسعه اقتصادی (OECD) با عنوان «چشمانداز دیجیتال آموزش ۲۰۲۶» با تجزیه و تحلیل بیش از ۱۰۰ مطالعه تجربی، دادههای پیمایشی از ۲۰ کشور و بررسی دهها نمونه موردی، جامعترین تصویر از وضعیت هوش مصنوعی مولد در آموزش را ارائه میدهد.
بهگزارش پیوست، سازمان همکاری و توسعه اقتصادی (OECD) در گزارش خود با عنوان «چشمانداز دیجیتال آموزش ۲۰۲۶» هشدار میدهد استفاده بیضابطه دانشآموزان از ابزارهای هوش مصنوعی مولد مانند ChatGPT، عملکرد تمرینی آنها را تا ۱۲۷درصد افزایش میدهد، اما در آزمونهای بدون دسترسی به هوش مصنوعی، این دانشآموزان تا ۱۷درصد ضعیفتر از همسالانی عمل میکنند که هرگز از این ابزارها استفاده نکردهاند. این پدیده که «توهم تبحر» نام گرفته، زنگ خطری جدی برای نظامهای آموزشی جهان است.
با این حال، همین گزارش نشان میدهد که هوش مصنوعی میتواند زمان برنامهریزی درسی معلمان را ۳۱درصد کاهش دهد و نرخ قبولی دانشآموزان معلمان کمتجربه را ۹ واحد درصد افزایش دهد. سوال کلیدی برای سیاستگذاران آموزشی این است: چگونه میتوان از هوش مصنوعی به عنوان «شریک حرفهای» استفاده کرد، بدون آنکه به «ماشین فرسایش مهارتها» تبدیل شود؟
استفاده از هوش مصنوعی مولد (مثل ChatGPT) عملکرد ظاهری دانشآموزان را به طرز چشمگیری افزایش میدهد، اما شواهد محکمی وجود دارد که این افزایش عملکرد اغلب به یادگیری عمیق و پایدار منجر نمیشود. در یک مطالعه میدانی در مقیاس بزرگ در ترکیه روی دانشآموزان پایه نهم تا یازدهم، این نتایج بدست آمده است: دانشآموزانی که از نسخه استاندارد ChatGPT استفاده کردند، عملکرد تمرینی آنها ۴۸درصد بهتر از گروه کنترل بود. نسخه آموزشی (Tutor) که برای جلوگیری از پاسخ مستقیم طراحی شده بود، این افزایش را به ۱۲۷درصد رساند. با این حال، هنگامی که دسترسی به ابزار قطع شد و دانشآموزان در یک محیط کتاببسته (بدون دسترسی به AI) مورد آزمون قرار گرفتند، دانشآموزان گروه ChatGPT عملکردی ۱۷درصد بدتر از گروهی داشتند که هرگز از هوش مصنوعی استفاده نکرده بودند.
این پدیده در گزارش OECD «توهم تبحر» (False Mastery) نامیده شده است. دانشآموز وظیفه را درست انجام میدهد، اما فرآیندهای شناختی و فراشناختی لازم برای یادگیری را طی نکرده است. در مطالعهای دیگر در ایالات متحده با مشارکت دانشجویان ۵ دانشگاه، از آنها خواسته شد انشایی ۲۰ دقیقهای بنویسند. گروهی که از ChatGPT استفاده کردند، نمرات بالاتری گرفتند، اما تنها ۱۲٪ آنها یک ساعت بعد توانستند بخشی از انشای خود را دقیقا به خاطر بیاورند، در حالی که این نسبت در گروههایی که به تنهایی یا با موتور جستجو کار کردند، ۸۹درصد بود. تصویربرداری مغزی این دانشجویان نشان داد که فعالیت نواحی مرتبط با تفکر اجرایی در گروه استفادهکننده از ChatGPT به طور قابلتوجهی کاهش یافته است.
این پدیده را «بار شناختی معکوس» نیز مینامند: هوش مصنوعی به جای تسهیل، فرآیندهای مغزی ضروری برای یادگیری را تضعیف میکند.
این یافتهها یک هشدار راهبردی روشن است. تکیه بر سنجشهای سنتی (نمره تمرین، کیفیت انشا، پاسخ به سوالات تشریحی) در عصر هوش مصنوعی گمراهکننده است. آموزش و پرورش در صورتی که نتواند «فرآیند یادگیری» را از «نتیجه ظاهری» تفکیک کند، با نسلی از دانشآموزان مواجه خواهد شد که در انجام تکالیف با کمک ماشین ماهرند، اما در تفکر مستقل، دانش بنیادین و توانایی حفظ و بازیابی اطلاعات ضعیف هستند. این پدیده را «بار شناختی معکوس» نیز مینامند: هوش مصنوعی به جای تسهیل، فرآیندهای مغزی ضروری برای یادگیری را تضعیف میکند.
گزارش OECD با استناد به مطالعات متعدد، مفهومی به نام «تنبلی فراشناختی» (Metacognitive Laziness) را معرفی میکند. در یک مطالعه بر روی دانشجویان چینی که وظیفه بازنویسی مقاله را بر عهده داشتند، گروهی که از ChatGPT استفاده کردند در مقایسه با گروهی که از مشاور انسانی کمک گرفتند، مراحل مهمی مانند «تشخیص نیاز خود»، «ارزیابی کمک دریافتی» و «بازبینی نهایی» را حذف کردند. آنها مستقیما درخواست راهحل میدادند و آن را بدون پردازش عمیق پیادهسازی میکردند.

در یک مطالعه یکساله دیگر، محققان دریافتند دانشآموزانی که صرفا برای کسب دانش (نه برای همراهی مجازی) با چتباتها تعامل داشتند، به تدریج استقلال یادگیری خود را از دست دادند. هرچه تعداد تعاملات با چتبات برای مقاصد ابزاری بیشتر میشد، «حضور اجتماعی» و «خودتنظیمی یادگیری» کاهش مییافت.
«سهولت» در یادگیری همیشه مطلوب نیست. آموزش موثر نیازمند «دشواری مطلوب» (Desirable Difficulty) است. هوش مصنوعی عمومی این دشواری را حذف میکند
همچنین مطالعهای در آلمان نشان داد دانشآموزانی که برای یک وظیفه تحقیق علمی از LLM استفاده کردند، بار شناختی کمتری احساس میکردند (یعنی کار برایشان آسانتر بود)، اما کیفیت استدلال و استنتاج نهایی آنها در مقایسه با گروهی که از موتور جستجوی گوگل استفاده کردند، به طور معناداری پایینتر بود. «سهولت» در یادگیری همیشه مطلوب نیست. آموزش موثر نیازمند «دشواری مطلوب» (Desirable Difficulty) است. هوش مصنوعی عمومی این دشواری را حذف میکند و در نتیجه مسیرهای عصبی مرتبط با حل مساله و تفکر انتقادی کمتر تحریک میشوند. نظام آموزشی باید به دنبال ابزارهایی باشد که این دشواری را حفظ کنند (مثلا با ارائه سرنخ، نه پاسخ مستقیم).
تهدید هوش مصنوعی تنها متوجه دانشآموزان نیست. معلمان نیز در معرض «واگذاری شناختی» قرار دارند. بر اساس نظرسنجی TALIS 2024 سازمان OECD، به طور متوسط ۳۶درصد از معلمان دوره اول متوسطه در کشورهای عضو از هوش مصنوعی در کار خود استفاده میکنند، اما این میزان تنوع بالایی دارد: از ۷۵درصد در سنگاپور و امارات متحده عربی تا کمتر از ۲۰درصد در فرانسه و ژاپن. از میان کاربران، ۶۸درصد از AI برای خلاصهسازی موضوعات تدریسی و ۶۴درصد برای تولید طرح درس استفاده میکنند. این یعنی استفاده غالب معلمان، در راستای «جایگزینی» وظایف است، نه «ارتقا».
گزارش OECD پنج سطح تعامل معلم و هوش مصنوعی را معرفی میکند:
تنها سطح پنجم (همافزا) مطلوب است. در سطوح پایینتر، معلم به تدریج به «تاییدکننده خروجی ماشین» تبدیل میشود. گزارش هشدار میدهد که اگر معلمان زیر نظر اسکریپتها یا داشبوردهایی کار کنند که حرکات آموزشی آنها را تعیین میکند، هویت حرفهای آنان به «کارگر خط تولید» نزدیک میشود. جالب اینجاست که به طور متوسط ۷۵درصد معلمان در OECD اعلام کردهاند که فاقد دانش یا مهارت کافی برای آموزش با هوش مصنوعی هستند و حدود ۵۰درصد از این گروه معتقدند اساسا نباید از AI در تدریس استفاده کرد.
استفاده انبوه از ابزارهای هوش مصنوعی بدون بازطراحی نقش معلم و بدون ارائه آموزشهای بنیادین، نه تنها بهرهوری نمیآفریند، بلکه فرسایش سرمایه انسانی گرانبهایی به نام «معلم» را تسریع میکند. شاخص موفقیت نباید کاهش ساعت کاری معلم باشد، بلکه باید «افزایش عاملیت (Agency) و قضاوت حرفهای» او تعریف شود.

با وجود هشدارها، گزارش OECD شواهد امیدوارکنندهای از بهرهوری واقعی و همکاری ثمربخش انسان و ماشین ارائه میدهد. یک کارآزمایی تصادفیشده روی ۲۵۹ معلم در ۶۸ مدرسه متوسطه در انگلستان نشان داد که استفاده هدفمند از هوش مصنوعی مولد (همراه با راهنمایی عملی)، زمان برنامهریزی هفتگی دروس را به طور متوسط از ۸۱.۵ دقیقه به ۵۶.۲ دقیقه کاهش داد، یعنی کاهشی معادل ۳۱درصد بدون آنکه کیفیت طرحهای درسی و منابع آموزشی آسیب ببیند.
هوش مصنوعی در صورتی کارآمد است که «آموزشمحور» طراحی شود، نه «عمومی».
در حوزه پشتیبانی از معلمان کمتجربه، نتایج حتی درخشانتر است. ابزار Tutor CoPilot که توسط دانشگاه استنفورد توسعه یافته، در یک کارآزمایی تصادفیشده با ۹۰۰ معلم خصوصی (Tutor) و ۱۸۰۰ دانشآموز در جوامع محروم ایالات متحده، نرخ قبولی دانشآموزان را به طور متوسط ۴ واحد درصد افزایش داد. اما نکته کلیدی اینجاست: برای معلمانی که در ابتدا «کمکیفیتترین» ارزیابی شده بودند، این افزایش ۹ واحد درصد بود. همچنین معلمانی که از این ابزار استفاده کردند، کمتر به ارائه پاسخ مستقیم تمایل نشان دادند و بیشتر از سوالات راهنما (Guiding Questions) استفاده کردند.
هوش مصنوعی در صورتی کارآمد است که «آموزشمحور» طراحی شود، نه «عمومی». تفاوت نسخه استاندارد ChatGPT با نسخه آموزشی آن، تفاوت بین افت ۱۷درصد در یادگیری و افزایش ۹ درصدی در عملکرد است. نظام آموزشی باید به جای منع استفاده از AI، روی تهیه و بومیسازی «نسخههای آموزشی» متمرکز شود که اصول یادگیری (مثل داربستزنی، پرسش سقراطی و بازخورد فرآیندی) در آنها پیاده شده باشد.
گزارش OECD سه الگوی اصلی تعامل انسان و هوش مصنوعی را مشخص میکند:
مدل جایگزینی (اتوماسیون کامل وظایف معلم) گرچه بهرهور است، اما هزینه پنهان آن «کاهش مهارت» و «تضعیف رابطه انسانی» است. مدل مکملسازی (AI داده میدهد، معلم تصمیم میگیرد) بهتر است، اما معلم را فراتر از توان فعلی خود ارتقا نمیدهد.
مدل مطلوب، یعنی ارتقا (Augmentation)، مستلزم سطح پنجم «همتیمی معلم و AI» است. در این سطح، معلم و سیستم یکدیگر را نقد میکنند، فرضیات را به چالش میکشند و به فهمی مشترک میرسند که از توان هرکدام به تنهایی فراتر میرود. در حال حاضر چنین ابزارهایی نادرند. گزارشی از یک نمونه موفق با مشارکت ۱۰ معلم ریاضی نشان میدهد که توسعه محتوای آموزشی با این روش از چند ماه به چند ساعت کاهش یافت و بار کاری درکشده معلمان ۵۰درصد کمتر شد. همچنین در یک مطالعه با ۱۶۰۰ دانشجو، ابزار پشتیبانی از بازخورد همتا (Peer Feedback) مبتنی بر AI باعث افزایش موقت کیفیت بازخورد شد، اما پس از حذف ابزار، مهارتهای دانشجویان به سطح اولیه بازگشت. یعنی «ارتقا» رخ نداده بود، تنها «کمک لحظهای» ارائه شده بود.

گزارش OECD به صراحت به پیامدهای ژئوپلیتیکی و عدالتمحور این موضوع اشاره میکند. کشورهایی که AI را صرفا به عنوان ابزار کاهش هزینه میبینند، در بلندمدت به کیفیت سرمایه انسانی خود آسیب میزنند. در مقابل، کشورهایی که از AI برای تقویت قضاوت حرفهای معلمان و یادگیری عمیق استفاده میکنند، در اقتصاد دیجیتال مزیت پایداری خواهند داشت. در حال حاضر، دادههای ترافیک وب نشان میدهد که ۶۰درصد استفاده از هوش مصنوعی مولد در کشورهای پردرآمد است، در مقابل ۳۹درصد در کشورهای با درآمد متوسط و کمتر از یک درصد در کشورهای کمدرآمد.
کشورهای پیشرو (مثل استونی با برنامه AI Leap و هلند با NOLAI) در حال سرمایهگذاری روی ابزارهای بومی و متناسب با برنامه درسی ملی خود هستند.
اما فناوری میتواند پلی برای عبور از این شکاف باشد. پروژه AI Unplugged در برزیل نشان داد که حتی با دسترسی محدود به اینترنت (مثلا یک بار در هفته)، میتوان از AI برای پشتیبانی از معلمان در مناطق روستایی استفاده کرد. در این پروژه، معلمان از برگههای تصویری دانشآموزان عکس میگرفتند و آفلاین، AI کیفیت انشا را تحلیل میکرد. مدلهای زبانی کوچک (Small Language Models) که روی گوشی موبایل اجرا میشوند، راهی امیدوارکننده برای عبور از شکاف دیجیتال هستند. با این حال، در حال حاضر این مدلها در اجرای راهبردهای پیچیدهیادی (مثل روش سقراطی) ناتوانند و اغلب پاسخ مستقیم میدهند.
هوش مصنوعی میتواند شکاف دیجیتال را کاهش دهد (مثلا با مدلهای زبانی کوچک و آفلاین)، اما در صورت عدم سیاستگذاری، میتواند آن را عمیقتر کند. کشورهای پیشرو (مثل استونی با برنامه AI Leap و هلند با NOLAI) در حال سرمایهگذاری روی ابزارهای بومی و متناسب با برنامه درسی ملی خود هستند. ایجاد «ابزارهای حاکمیتی هوش مصنوعی در آموزش» به اندازه داشتن «ابر ملی» یا «نیمههادی ملی» مهم است.

۱. بازتعریف نظام ارزشیابی (از محصول به فرآیند): نظام ارزشیابی باید از سنجش «خروجی» (انشا، پاسخ نهایی) به سمت سنجش «فرآیند» (تاریخچه تعامل با AI، توانایی بازخوردگیری، کیفیت گفتوگو، ثبت مراحل تفکر) حرکت کند. ابزارهایی مانند پلتفرم FLoRA نشان دادهاند که ردیابی فرآیندهای خودتنظیمی یادگیری (Self-regulation) میتواند پیشبینیکننده قویتری از عملکرد نسبت به خود نمره نهایی باشد.
۲. توانمندسازی معلمان (فراتر از مهندسی پرامپت): برنامههای توسعه حرفهای معلمان نباید محدود به «نحوه سوال پرسیدن از ChatGPT» شود. بلکه باید شامل این موارد باشد
۳. توسعه و تدارک ابزارهای «معلم-محور» با قابلیت نظارت انسانی (Human-in-the-Loop): نظام تدارکات دولتی باید به سمتی حرکت کند که ابزارهای خریداریشده دارای ویژگیهای زیر باشند: امکان مشاهده تعامل دانشآموز با AI، امکان اصلاح خروجی قبل از دیده شدن توسط دانشآموز، امکان تنظیم سطح «توهم» مدل متناسب با هدف یادگیری، و امکان «وتو» یا «نادیده گرفتن» توصیههای سیستم توسط معلم.
۴. ایجاد ائتلاف ملی برای هوش مصنوعی آموزشی (NEAIR): با الهام از نمونه هلند (NOLAI – National Education Lab AI)، استونی (AI Leap) و کره جنوبی (مجوزدهی به توتورهای AI منطبق با برنامه درسی ملی)، یک همکاری سهجانبه میان دولت (وزارت آموزش)، دانشگاهها (علوم تربیتی و کامپیوتر) و بخش خصوصی (ادتک) برای طراحی، اعتبارسنجی و بومیسازی ابزارهای هوش مصنوعی آموزشی تشکیل شود.
آینده مطلوب، نه «مدرسه بدون معلم» است و نه «معلم وابسته به هوش مصنوعی». آینده مطلوب، معلمی است که با AI بهتر میبیند، دقیقتر تصمیم میگیرد، سریعتر بازخورد میدهد، اما همچنان مسئول، صاحباختیار و انسانی باقی میماند. تصمیمگیری در این مقطع تاریخی، تعیینکننده آن است که AI در آموزش، «شریک حرفهای» خواهد بود یا «ماشین فرسایش حرفهای».
OECD Digital Education Outlook 2026