معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۷ مهر ۱۴۰۳
زمان مطالعه : ۱۱ دقیقه
هوش مصنوعی رخشای با توجه به فرهنگ ایرانی، در مسیر تولید مدل هوش مصنوعی فارسی قرار گرفته است. این استارتآپ با ارائه مدلهای پردازش متنی با عنوان زال و تصویری اختصاصی با عنوان شهرزاد به فرهنگ ایرانی توجه خاصی کرده است. برای بررسی بیشتر، با شمشاد امیر خراسانی، بنیانگذار و مدیرعامل رخشای، گفتوگو کردیم.
چه عاملی موجب شد تا تصمیمگرفتید مدل زبانی طراحی کنید و مزیت و برتری رخشای به نسبت سایر مدلها را در چه چیزی میدانید؟
تصمیم به طراحی مدل زبانی نتیجه تصمیمگیری سه برنامهنویس ارشد بود که با تحقیقات گسترده در زمینههای بیگ دیتا و هوش مصنوعی طی یک دهه، به این نتیجه رسیدند که باید سرویسی مبتنی بر هوش مصنوعی و حوزههای مرتبط ارائه دهند. هدف ما تأسیس استارتآپی با ایدهآلهایی بزرگ برای تمدن و فرهنگ ایرانشهری بود تا بتوانیم در زمینه هوش مصنوعی مولد در چرخه پیشرفت و توسعه کشور عزیزمان نقشآفرین باشیم.
مزیت کلیدی هوش مصنوعی رخشای در پردازش تصویر و پردازش متنی، در الگوریتمهای پردازشی آن است که بهطور ویژه تلاش میکند تا با فرهنگ چند هزار ساله ایرانی همسو شود و آن را در توسعه خود گنجاند.
با توجه به سرویسهای رایگان AI که هماکنون در دسترس است مزیت رقابتی شما چیست و چرا مخاطب به جای استفاده از سرویسهای رایگان باید هزینه پرداخت کند و اشتراک شما را تهیه کند؟
بسیاری از سرویسهای هوش مصنوعی به صورت رایگان در دسترس هستند، اما هوش مصنوعی رخشای مزایای منحصر به فردی دارد. بهعنوان مثال، رخشای برای کاربران جدید خود ۵ هزار کلمه رایگان برای استفاده از مدلهای زال و شهرزاد ارائه میدهد و این امکان بدون محدودیت زمانی است.
مدلهای پردازش متنی زال و پردازش تصویر شهرزاد بهطور ویژه با فرهنگ و آداب ایرانی آشنا هستند و همین امر رخشای را در میان رقبا متمایز میکند. این ویژگیها به کاربران ایرانی کمک میکند تا تجربهای بومی و متناسب با فرهنگ خود به دست آورند.
در مقابل، دیگر سرویسهای هوش مصنوعی مولد به طور کامل رایگان نیستند و نسخههای رایگان آنها معمولاً با محدودیتهایی همراه هستند که برای استفاده حرفهای به خرید اشتراک نیاز دارند. از طرفی، هزینه استفاده از سرویسهای رخشای به دلیل بهینه بودن و بینیاز به پرداختهای دلاری، بسیار مقرون بهصرفهتر است.
علاوه بر این، اعتبارهای خریداریشده در رخشای نامحدود و بر اساس میزان استفاده هستند، به این معنا که کاربران دیگر نیازی به نگرانی درباره انقضای زمان اعتبار خود ندارند.
بهنظر شما توانایی رقابت در بازار جهانی را دارید؟
مزیت رقابتی ما در رخشای نسبت به سایر رقبای خود در این است که با پشتوانه سه سال تحقیق مقدماتی و یک سال و شش ماه فعالیت عمومی، توانستهایم از بسیاری از چالشهای فنی و DevOps عبور کنیم. این پیشینه قوی، به رخشای این امکان را میدهد تا معیارهای استانداردی برای مدلهای خود تعیین کرده و کیفیت تحلیل و عملکرد آن را به وضوح نسبت به سایر سرویسها به نمایش بگذاریم.
رخشای به عنوان نسخهای کاربردی و مناسب برای کاربران فارسیزبان و ایرانی، نیازهای خاص این گروه را به خوبی برآورده میکند و قابلیت رقابت در بازار جهانی را برای تمام فارسیزبانان دارد.
پیشبینی شما از زمان سودآور شدن رخشای چه زمانیاست؟
ما یک شرکت خصوصی با سرمایهگذاری شخصی هستیم که بر طراحی، زیرساختهای انسانی، و هوش مصنوعی تمرکز کرده و تا کنون به صورت کاملاً Bootstrap فعالیت کردهایم. در ۶ ماه ابتدایی، برنامه B2C ما به سود معقولی رسید و از آن زمان، برنامه B2B ما توانسته سود قابل توجهی برای شرکت به ارمغان بیاورد که ادامه فعالیت ما به عنوان یک شرکت نرمافزاری ایرانی در حوزه هوش مصنوعی را تضمین میکند. با ارائه سرویسها و خدمات جدید، هدف ما افزایش چند برابری این درآمدهاست.
چطور برنامهریزی کردید تا زال (مدل پردازش متنی رخشای) بتواند به استانداردهای جهانی دستیارهای هوش مصنوعی برسد؟
یکی از ویژگیهای اصلی تیم توسعه رخشای، تمرکز ویژه بر تحقیق و توسعه (R&D) است. بیش از هفتاد درصد از هزینههای کلی ما به این حوزه اختصاص یافته و با کارشناسان متخصص در سراسر جهان مشورت میشود.
مدل زال که در سامانه ما استفاده میشود، بر پایه پیشرفتهترین روشهای پردازش زبان طبیعی (NLP) و یادگیری عمیق بنا شده است. در این مدل، از ابزارها و چارچوبهای تخصصی نظیر TensorFlow برای ساخت و بهینهسازی شبکههای عصبی پیچیده، NLTK برای پیشپردازش متون و تجزیه و تحلیلهای آماری، SpaCy برای استخراج موجودیتهای نامدار (NER) و تحلیل وابستگیهای نحوی، و Gensim برای مدلسازی موضوعات و بردارهای کلمه استفاده شده است.
برای دستیابی به استانداردهای جهانی، زیرساختهای محاسباتی پیشرفته شامل چندین سرور با پردازندههای گرافیکی (GPUs) و واحدهای پردازش تانسور (TPUs) در مراکز دادههای مختلف به کار گرفته شدهاند. این ساختار محاسباتی به زال امکان میدهد تا حجم عظیمی از دادههای متنی را به صورت فوری پردازش و بهینهسازی کند و تجربهای پیشرفته در تعاملات هوش مصنوعی ارائه دهد.
با توجه به حساسیتهای فرهنگی، چه چالشهایی در آموزش هوش مصنوعی شهرزاد برای پردازش تصاویر داشتهاید؟
یکی از اساسیترین چالشها و نکاتی که تیم ما به آن توجه ویژهای داشت، مشکلات مربوط به محتواهای اولیه در پردازش تصویر مدل شهرزاد و حساسیتهای فرهنگی و اعتقادی بود. بهعنوان اولین نمونه در حوزه هوش مصنوعی، ما باید این مشکلات را به صورت کاملاً ابتکاری حل میکردیم.
چالش اصلی در اینجا کمبود منابع اولیه دادههای تصویری بود که باعث شد کیفیت شهرزاد در مراحل اولیه رضایتبخش نباشد. با این حال، به لطف دادههای ورودی کاربران و سیستم پیشرفته ذخیرهسازی بصری که تیم برنامهنویسی با پایتون ایجاد کرده بود، توانستیم به مرور دادههای پردازشی شهرزاد را گسترش دهیم و مدل بهینهشده شهرزاد را معرفی کنیم. در حال حاضر، علاوه بر دادههای موجود از بستر وب، مدل قادر به دسترسی به بیش از ۱۳ هزار تصویر تولیدی خود است.
برای حل حساسیتهای فرهنگی، سامانه ما طبق قوانین جاری کشور ابتدا درخواستهای کاربران را فکتچک میکند و از بروز اطلاعات حساس جلوگیری میکند. همچنین، پس از انتشار اثر، نظارت انسانی نیز روی محتوا انجام میشود.
با وجود این تدابیر، به دلیل نبود قوانین روشن در زمینه نوظهور هوش مصنوعی، همچنان با چالشهایی مواجه هستیم.
چقدر مخاطب دارید؟ چه میزان مخاطبی برای آینده رخشای در نظر دارید؟
بیش از یازده هزار کاربر در سامانه داریم که نسبت به پنلهای مارکتینگ پیشبینی شده در سال ۱۴۰۴ رشدی بیش از ۱۰ برابری را تجربه کنیم. البته قطعا پایداری سامانه را بیشتر مد نظر قرار می دهیم .
میزان رضایت کاربران از عملکرد هوش مصنوعی شما چطور ارزیابی شده؟ آیا بازخوردهای کاربران باعث تغییراتی در الگوریتمها شده است؟
برای ارزیابی میزان رضایت کاربران از عملکرد هوش مصنوعی، سامانه رخشای از سه روش مختلف استفاده میکنیم. روش اول نظرسنجی اختصاصی از کاربران پرمصرف رخشای هست.در این روش، کاربرانی که سابقه استفاده طولانی و تعامل بالا با ما دارند بهطور هدفمند نظرسنجی میشوند تا بازخورد عمیقتری درباره تجربه و نیازهایشان دریافت کنیم. این دادهها معمولاً شامل جزئیات عملکرد هوش مصنوعی در سناریوهای پیچیده و کاربردهای خاص است.
در روش دیگری که برای ارزیابی داریم. نظرسنجی عمومی از تمامی کاربران است. در این روش، بازخورد گستردهتری از کاربران با سطوح مختلف تجربه جمعآوری میشود. نظرسنجیها بهصورت دورهای و در سطح کلیتر انجام میشوند تا روند کلی رضایت کاربران سنجیده و نقاط ضعف عمومی شناسایی گردد.
همچنین جدا از نظرسنجیها بازخوردهای مستقیم از کاربران را که بهصورت غیررسمی از طریق کانالهای مختلف مانند ایمیل، تماسهای پشتیبانی، و شبکههای اجتماعی دریافت میشود، ارزیابی میکنیم. این بازخوردها نقش کلیدی در بهبود تجربه کاربری و شناسایی سریع مشکلات دارد.
نظرات دریافتی، بهویژه از کاربران پرمصرف و کارشناسان، مستقیماً در بهینهسازی و تغییرات الگوریتمی هوش مصنوعی ما اعمال میشود. تیم فنی سامانه از این بازخوردها برای شناسایی مشکلات عملکردی، بهبود دقت مدلها و افزایش کارایی در حوزههای مختلف استفاده میکند.
بر اساس بازخوردهای کاربران، زال یک و دو به ترتیب با بیش از ۶۰ درصد و ۸۰ درصد رضایت دارند. همچنین شهرزاد یک بیش از ۴۰ درصد رضایت و شهرزاد دو بیش از ۹۰ درصد رضایت از سوی کاربران رخشای را دارند.
از نظر امنیت اطلاعات، چگونه دادههای کاربران را پردازش و ذخیره میکنید تا از حملات سایبری محافظت کنید؟
رمزنگاری دادههای رخشای در حین انتقال (بین کاربر و سرور) با استفاده از رمزنگاریهای قوی (مانند TLS) محافظت میشوند تا از استراق سمع و حملات میانجی (MITM) جلوگیری شود. ناشناسسازی دادهها دادههای شخصی کاربران ناشناسسازی یا حذف میشوند تا اطلاعات حساسی مانند نام، آدرس، یا سایر جزئیات قابل شناسایی به طور مستقیم ذخیره یا پردازش نشود.
همچنین سیستمهای امنیتی ما بهطور مداوم بهروزرسانی میشوند تا با جدیدترین تهدیدات امنیتی و آسیبپذیریها مقابله کنند. البته دادههای کاربر برای مدت طولانی ذخیره نمیشود و در صورت نیاز به حذف آن، دادهها به صورت ایمن از سیستمها پاک میشوند.
آیا برنامهای برای ورود به بازارهای بینالمللی دارید؟
بله از ابتدا کار نگاهی به این مورد داشته و متناسب با پایداری شبکه که دائم در حال مانیتورینگ است زیرساختهای خودمان را بررسی می کنیم . مزیت های رقابتی در زال ۳ و ۴ که در آینده ای نزدیک رونمایی می شوند بعد از پایداری می توانند مزیت مارا نسبت به رقبا بزرگ به رخ بکشد و مشوق کاربران کشور های دیگر باشد .
کشورهای هدف کشورهای همسایه و به خصوص کشورهای حوزه تمدنی زبان فارسی و سپس کشورهای حاشیه خلیج همیشه فارس و بعد از این موارد به صورت عمومی برای تمامی کشورها است.
بزرگترین چالشها و مشکلاتی که در توسعه هوش مصنوعی مبتنی بر فرهنگ ایرانی داشتید چه بوده و چطور آن را حل کردید؟
توسعه هوش مصنوعی مبتنی بر فرهنگ ایرانی با چالشهای مختلفی روبهرو است که برخی از مهمترینهای آنها را خدمتتون عرض میکنم.
دسترسی به دادههای مناسب و بومی یکی از بزرگترین چالشها، کمبود دادههای با کیفیت و معتبر در زبان فارسی و همچنین دادههای مرتبط با فرهنگ ایرانی است. بسیاری از مدلهای هوش مصنوعی بر اساس دادههای بزرگمقیاس آموزش دیدهاند که عمدتاً به زبانهای انگلیسی یا دیگر زبانهای پرکاربرد هستند. برای حل این مشکل، تیمها و سازمانهای فعال در این زمینه به جمعآوری دادههای بومی از منابع مختلف (مانند کتابها، مقالات، محتوای آنلاین و…) و توسعه مجموعه دادههای خاص به زبان فارسی پرداختهاند.
تنوع زبانی و لهجهها هم چالش بهشدت سختی بود. زبان فارسی به خودی خود دارای تنوع گویشی و لهجهای است که فهم و پردازش آن را پیچیده میکند. چالش دیگر در این زمینه، توسعه مدلهایی است که قادر به درک و پردازش صحیح این تنوع باشند. برای مقابله با این چالش، مجموعه دادههای متنوعی از لهجهها و گویشهای مختلف ایرانی جمعآوری شده و مدلها با دادههای مختلف آموزش داده شدهاند تا تنوع زبان را بهتر پوشش دهند.
کمبود ابزارهای تخصصی برای زبان فارسی از مشکلات قابل توجه بود. ابزارهای پردازش زبان طبیعی (NLP) و سایر ابزارهای هوش مصنوعی، بیشتر برای زبانهای رایج دنیا مانند انگلیسی توسعه داده شدهاند. به همین دلیل برای زبان فارسی ابزارهای مشابهی با کیفیت مناسب در دسترس نیست. برای حل این مشکل، توسعهدهندگان ایرانی اقدام به توسعه کتابخانهها و ابزارهای بومی کردهاند. بهعنوان مثال، برخی مدلهای پردازش زبان طبیعی برای زبان فارسی از ابتدا طراحی و آموزش داده شدهاند.
هماهنگی هوش مصنوعی با ارزشها و فرهنگ ایرانی نیز یکی دیگر از چالشها است. نیاز به انطباق هوش مصنوعی با ارزشها و فرهنگهای خاص جامعه ایران است. در برخی موارد، محتوای تولید شده توسط مدلهای هوش مصنوعی ممکن است با ارزشهای اجتماعی و فرهنگی ناسازگار باشد. برای مقابله با این مسئله، الگوریتمهایی توسعه یافتهاند که قادر به شناسایی و فیلتر محتوای نامناسب بوده و محتوای تولید شده را با فرهنگ و ارزشهای محلی همسو کنند.
حمایت مالی و زیرساختهای فنی هم واقعا معضل سختی است که ما در کار داشتیم.توسعه و آموزش مدلهای بزرگ نیاز به زیرساختهای قوی محاسباتی دارد که ممکن است در برخی مواقع محدود باشد. سرمایهگذاری در زیرساختهای محاسباتی و همکاری با نهادهای دولتی و خصوصی برای تأمین منابع مالی و فنی کمک کرده تا این مانع تا حدودی کاهش یابد.
چه اندازه به آینده هوش مصنوعی مولد در ایران امیدوار هستید و چه اقداماتی برای بومیسازی این فناوری در پیش دارید؟
آینده هوش مصنوعی مولد در ایران دارای پتانسیل بالایی است، اما تحقق آن به چند عامل کلیدی بستگی دارد.برای توسعه هوش مصنوعی مولد، نیاز به زیرساختهای قوی محاسباتی و ذخیرهسازی دادهها است. سرمایهگذاری در مراکز داده، پردازندههای قدرتمند و شبکههای ارتباطی میتواند پیشنیاز مهمی باشد.
یکی از چالشهای مهم برای بومیسازی هوش مصنوعی مولد، دسترسی به دادههای با کیفیت و بزرگمقیاس است. جمعآوری، سازماندهی و برچسبگذاری دادهها در بخشهای مختلف از جمله زبان فارسی و فرهنگهای محلی میتواند نقش کلیدی در آموزش مدلهای مولد داشته باشد.
تربیت متخصصان و محققان هوش مصنوعی و تقویت تیمهای پژوهشی در دانشگاهها و صنایع داخلی اهمیت بالایی دارد. حمایت از پروژههای تحقیقاتی و آموزش نیروی کار ماهر میتواند تأثیر مثبتی بر این مسیر داشته باشد از سوی دیگر تدوین قوانین و مقررات مناسب برای استفاده و توسعه هوش مصنوعی، حفاظت از حقوق کاربران و تنظیم مقررات مرتبط با دادهها و حریم خصوصی از دیگر عواملی است که میتواند بر روند بومیسازی تأثیر بگذارد.
همکاری با کشورهای پیشرفته در حوزه هوش مصنوعی و تبادل دانش و تجربه میتواند به تسریع فرآیند بومیسازی کمک کند. ایجاد شراکتهای علمی و تجاری با کشورهای پیشرو در این زمینه بسیار مفید خواهد بود.
از اقدامات مهم برای بومیسازی این فناوری میتوان به ایجاد پلتفرمهای داخلی هوش مصنوعی مولد، پشتیبانی از زبان فارسی و فرهنگ بومی، حمایت از استارتاپهای مرتبط و سرمایهگذاری در تحقیق و توسعه اشاره کرد.