چطور نگرانیها درمورد هوش مصنوعی در سال ۲۰۲۴ جای خود را به خوشبینی دادند
فناوران سالها است که درمورد خطرات احتمالی و جدی هوش مصنوعی برای آینده بشر هشدار…
۱۳ دی ۱۴۰۳
۲۳ تیر ۱۴۰۳
زمان مطالعه : ۲ دقیقه
تاریخ بهروزرسانی: ۱۳ مرداد ۱۴۰۳
وبگاه گنجور، آمار جدیدی از این مجموعه اشعار آنلاین زبان و ادبیات فارسی منتشر کرده است که طبق این آمار تا تاریخ ۲۲ تیرماه ۱۴۰۳ در وبگاه گنجور مجموعا ۱,۴۰۸,۲۶۴ بیت شعر در دسترس قرار گرفته است. بسامد واژگان شمرده شده در متن گنجور بیش از ۳۲۸ هزار واژه غیرتکراری است. عطار نیشابوری، صائب تبریزی، مولانا، فردوسی و جامی پنج شاعری هستند که رده یک الی پنج را به خود اختصاص دادهاند و بیشترین شعر آمده از آنهاست.
به گزارش پیوست، این نکته در جمعآوری و ارائه گزارش آماری از وبگاه گنجور ذکر شده است که بنا به دلایل مختلفی از جمله وجود چند نسخه از آثار شعرا، یک بیت محسوب شدن مصرعهای بند قالبهای ترکیبی و غیره، آمار منتشر شده تقریبی و حدودی است.
در وبگاه گنجور مجموعا ۱,۴۰۸,۲۶۴ بیت شعر منتشر شده است که ۹۹ درصد این اشعار به زبان فارسی است. اما در این مجموعه اشعاری به زبانهای دیگر عربی، ترکی، کردی و غیره با فراوانی بسیار کم وجود دارد. قالب پرتکرار اشعار موجود غزل، مثنوی و قصیده است. عطار نیشابوری، صائب تبریزی، مولانا، فردوسی و جامی پنج شاعری هستند که بیشترین اشعار گنجور متعلق به این افراد است. سعدی و حافظ نیز به ترتیب در ردههای ۱۷ام و ۸۲ام قرار دارند.
تعداد ابیات منتشر شده در گنجور از عطار بیش از ۹۵هزار، صائب بیش از ۷۷هزار و مولانا حدود ۶۷هزار است.
در متن گنجور بیش از ۴۵ میلیون واژه شمرده شده که شمار واژگان غیرتکراری برابر ۳۲۸,۳۷۷ واژه عنوان شده است. و، از، که، به، در، را، تو، ز، بر و آن ۱۰ واژهای است که درصد بالایی از واژگان موجود را شامل میشود.
در گزارش این وبگاه آمده است، به علت اینکه بیشترین بسامد مربوط به حروف ربط و واژگان کمتاثیر است؛ جهت واضحتر شدن اطلاعات معنیدار، امکان حذف واژگان کمهوادار از آمار کلی وجود دارد.
در این آمار، اسامی شاعران به ترتیب و به صورت نزولی مرتب شده است که با کلیک روی اسامی هر یک میتوان آمار و اطلاعات مربوط به اشعار او در گنجور را مشاهده کرد.