علی خیرآبادی نویسنده میهمان

پیوست » فناوری » هوش مصنوعی » توسعه مدل‌های تصویری و متنی فارسی در استارت‌آپ رخشای

توسعه مدل‌های تصویری و متنی فارسی در استارت‌آپ رخشای

علی خیرآبادی

نویسنده میهمان

۷ مهر ۱۴۰۳

زمان مطالعه : ۱۱ دقیقه

هوش مصنوعی رخشای با توجه به فرهنگ ایرانی، در مسیر تولید مدل هوش مصنوعی فارسی قرار گرفته است. این استارت‌آپ با ارائه مدل‌های پردازش متنی با عنوان زال و تصویری اختصاصی با عنوان شهرزاد به فرهنگ ایرانی توجه خاصی کرده است. برای بررسی بیشتر، با شمشاد امیر خراسانی، بنیان‌گذار و مدیرعامل رخشای، گفت‌وگو کردیم.

چه عاملی موجب شد تا تصمیم‌گرفتید مدل زبانی طراحی کنید و مزیت و برتری رخشای به نسبت سایر مدل‌ها را در چه چیزی می‌‌دانید؟

تصمیم به طراحی مدل زبانی نتیجه تصمیم‌گیری سه برنامه‌نویس ارشد بود که با تحقیقات گسترده در زمینه‌های بیگ دیتا و هوش مصنوعی طی یک دهه، به این نتیجه رسیدند که باید سرویسی مبتنی بر هوش مصنوعی و حوزه‌های مرتبط ارائه دهند. هدف ما تأسیس استارت‌آپی با ایده‌آل‌هایی بزرگ برای تمدن و فرهنگ ایرانشهری بود تا بتوانیم در زمینه هوش مصنوعی مولد در چرخه پیشرفت و توسعه کشور عزیزمان نقش‌آفرین باشیم.

مزیت کلیدی هوش مصنوعی رخشای در پردازش تصویر و پردازش متنی، در الگوریتم‌های پردازشی آن است که به‌طور ویژه تلاش می‌کند تا با فرهنگ چند هزار ساله ایرانی همسو شود و آن را در توسعه خود گنجاند.

با توجه به سرویس‌های رایگان AI که هم‌اکنون در دسترس است مزیت رقابتی شما چیست و چرا مخاطب به جای استفاده از سرویس‌های رایگان باید هزینه پرداخت کند و اشتراک شما را تهیه کند؟

بسیاری از سرویس‌های هوش مصنوعی به صورت رایگان در دسترس هستند، اما هوش مصنوعی رخشای مزایای منحصر به فردی دارد. به‌عنوان مثال، رخشای برای کاربران جدید خود ۵ هزار کلمه رایگان برای استفاده از مدل‌های زال و شهرزاد ارائه می‌دهد و این امکان بدون محدودیت زمانی است.

مدل‌های پردازش متنی زال و پردازش تصویر شهرزاد به‌طور ویژه با فرهنگ و آداب ایرانی آشنا هستند و همین امر رخشای را در میان رقبا متمایز می‌کند. این ویژگی‌ها به کاربران ایرانی کمک می‌کند تا تجربه‌ای بومی و متناسب با فرهنگ خود به دست ‌آورند.

در مقابل، دیگر سرویس‌های هوش مصنوعی مولد به طور کامل رایگان نیستند و نسخه‌های رایگان آن‌ها معمولاً با محدودیت‌هایی همراه هستند که برای استفاده حرفه‌ای به خرید اشتراک نیاز دارند. از طرفی، هزینه استفاده از سرویس‌های رخشای به دلیل بهینه بودن و بی‌نیاز به پرداخت‌های دلاری، بسیار مقرون به‌صرفه‌تر است.

علاوه بر این، اعتبارهای خریداری‌شده در رخشای نامحدود و بر اساس میزان استفاده هستند، به این معنا که کاربران دیگر نیازی به نگرانی درباره انقضای زمان اعتبار خود ندارند.

به‌نظر شما توانایی رقابت در بازار جهانی را دارید؟

مزیت رقابتی ما در رخشای نسبت به سایر رقبای خود در این است که با پشتوانه سه سال تحقیق مقدماتی و یک سال و شش ماه فعالیت عمومی، توانسته‌ایم از بسیاری از چالش‌های فنی و DevOps عبور کنیم. این پیشینه‌ قوی، به رخشای این امکان را می‌دهد تا معیارهای استانداردی برای مدل‌های خود تعیین کرده و کیفیت تحلیل و عملکرد آن را به وضوح نسبت به سایر سرویس‌ها به نمایش بگذاریم.

رخشای به عنوان نسخه‌ای کاربردی و مناسب برای کاربران فارسی‌زبان و ایرانی، نیازهای خاص این گروه را به خوبی برآورده می‌کند و قابلیت رقابت در بازار جهانی را برای تمام فارسی‌زبانان دارد.

پیش‌بینی‌ شما از زمان سودآور شدن رخشای چه زمانی‌است؟

ما یک شرکت خصوصی با سرمایه‌گذاری شخصی هستیم که بر طراحی، زیرساخت‌های انسانی، و هوش مصنوعی تمرکز کرده و تا کنون به صورت کاملاً Bootstrap فعالیت کرده‌ایم. در ۶ ماه ابتدایی، برنامه B2C ما به سود معقولی رسید و از آن زمان، برنامه B2B ما توانسته سود قابل توجهی برای شرکت به ارمغان بیاورد که ادامه فعالیت ما به عنوان یک شرکت نرم‌افزاری ایرانی در حوزه هوش مصنوعی را تضمین می‌کند. با ارائه سرویس‌ها و خدمات جدید، هدف ما افزایش چند برابری این درآمدهاست.

چطور برنامه‌ریزی کردید تا زال (مدل پردازش متنی رخشای) بتواند به استانداردهای جهانی دستیارهای هوش مصنوعی برسد؟

یکی از ویژگی‌های اصلی تیم توسعه رخشای، تمرکز ویژه بر تحقیق و توسعه (R&D) است. بیش از هفتاد درصد از هزینه‌های کلی ما به این حوزه اختصاص یافته و با کارشناسان متخصص در سراسر جهان مشورت می‌شود.

مدل زال که در سامانه ما استفاده می‌شود، بر پایه پیشرفته‌ترین روش‌های پردازش زبان طبیعی (NLP) و یادگیری عمیق بنا شده است. در این مدل، از ابزارها و چارچوب‌های تخصصی نظیر TensorFlow برای ساخت و بهینه‌سازی شبکه‌های عصبی پیچیده، NLTK برای پیش‌پردازش متون و تجزیه و تحلیل‌های آماری، SpaCy برای استخراج موجودیت‌های نام‌دار (NER) و تحلیل وابستگی‌های نحوی، و Gensim برای مدل‌سازی موضوعات و بردارهای کلمه استفاده شده است.

برای دستیابی به استانداردهای جهانی، زیرساخت‌های محاسباتی پیشرفته شامل چندین سرور با پردازنده‌های گرافیکی (GPUs) و واحدهای پردازش تانسور (TPUs) در مراکز داده‌های مختلف به کار گرفته شده‌اند. این ساختار محاسباتی به زال امکان می‌دهد تا حجم عظیمی از داده‌های متنی را به صورت فوری پردازش و بهینه‌سازی کند و تجربه‌ای پیشرفته در تعاملات هوش مصنوعی ارائه دهد.

با توجه به حساسیت‌های فرهنگی، چه چالش‌هایی در آموزش هوش مصنوعی شهرزاد برای پردازش تصاویر داشته‌اید؟

یکی از اساسی‌ترین چالش‌ها و نکاتی که تیم ما به آن توجه ویژه‌ای داشت، مشکلات مربوط به محتواهای اولیه در پردازش تصویر مدل شهرزاد و حساسیت‌های فرهنگی و اعتقادی بود. به‌عنوان اولین نمونه در حوزه هوش مصنوعی، ما باید این مشکلات را به صورت کاملاً ابتکاری حل می‌کردیم.

چالش اصلی در اینجا کمبود منابع اولیه داده‌های تصویری بود که باعث شد کیفیت شهرزاد در مراحل اولیه رضایت‌بخش نباشد. با این حال، به لطف داده‌های ورودی کاربران و سیستم پیشرفته ذخیره‌سازی بصری که تیم برنامه‌نویسی با پایتون ایجاد کرده بود، توانستیم به مرور داده‌های پردازشی شهرزاد را گسترش دهیم و مدل بهینه‌شده شهرزاد را معرفی کنیم. در حال حاضر، علاوه بر داده‌های موجود از بستر وب، مدل قادر به دسترسی به بیش از ۱۳ هزار تصویر تولیدی خود است.

برای حل حساسیت‌های فرهنگی، سامانه ما طبق قوانین جاری کشور ابتدا درخواست‌های کاربران را فکت‌چک می‌کند و از بروز اطلاعات حساس جلوگیری می‌کند. همچنین، پس از انتشار اثر، نظارت انسانی نیز روی محتوا انجام می‌شود.

با وجود این تدابیر، به دلیل نبود قوانین روشن در زمینه نوظهور هوش مصنوعی، همچنان با چالش‌هایی مواجه هستیم.

چقدر مخاطب دارید؟ چه میزان مخاطبی برای آینده رخشای در نظر دارید؟

بیش از یازده هزار کاربر در سامانه داریم که نسبت به پنل‌های مارکتینگ پیش‌بینی شده در سال ۱۴۰۴ رشدی بیش از ۱۰ برابری را تجربه کنیم. البته قطعا پایداری سامانه را بیشتر مد نظر قرار می دهیم .

میزان رضایت کاربران از عملکرد هوش مصنوعی شما چطور ارزیابی شده؟ آیا بازخوردهای کاربران باعث تغییراتی در الگوریتم‌ها شده است؟

برای ارزیابی میزان رضایت کاربران از عملکرد هوش مصنوعی، سامانه رخشای از سه روش مختلف استفاده می‌کنیم. روش اول نظرسنجی اختصاصی از کاربران پرمصرف رخشای هست.در این روش، کاربرانی که سابقه استفاده طولانی و تعامل بالا با ما دارند به‌طور هدفمند نظرسنجی می‌شوند تا بازخورد عمیق‌تری درباره تجربه و نیازهایشان دریافت کنیم. این داده‌ها معمولاً شامل جزئیات عملکرد هوش مصنوعی در سناریوهای پیچیده و کاربردهای خاص است.

در روش دیگری که برای ارزیابی داریم. نظرسنجی عمومی از تمامی کاربران است. در این روش، بازخورد گسترده‌تری از کاربران با سطوح مختلف تجربه جمع‌آوری می‌شود. نظرسنجی‌ها به‌صورت دوره‌ای و در سطح کلی‌تر انجام می‌شوند تا روند کلی رضایت کاربران سنجیده و نقاط ضعف عمومی شناسایی گردد.

همچنین جدا از نظرسنجی‌ها بازخوردهای مستقیم از کاربران را که به‌صورت غیررسمی از طریق کانال‌های مختلف مانند ایمیل، تماس‌های پشتیبانی، و شبکه‌های اجتماعی دریافت می‌شود، ارزیابی می‌کنیم. این بازخوردها نقش کلیدی در بهبود تجربه کاربری و شناسایی سریع مشکلات دارد.

نظرات دریافتی، به‌ویژه از کاربران پرمصرف و کارشناسان، مستقیماً در بهینه‌سازی و تغییرات الگوریتمی هوش مصنوعی ما اعمال می‌شود. تیم فنی سامانه از این بازخوردها برای شناسایی مشکلات عملکردی، بهبود دقت مدل‌ها و افزایش کارایی در حوزه‌های مختلف استفاده می‌کند.

بر اساس بازخوردهای کاربران، زال یک و دو به ترتیب با بیش از ۶۰ درصد و ۸۰ درصد رضایت دارند. همچنین شهرزاد یک بیش از ۴۰ درصد رضایت و شهرزاد دو بیش از ۹۰ درصد رضایت از سوی کاربران رخشای را دارند.

از نظر امنیت اطلاعات، چگونه داده‌های کاربران را پردازش و ذخیره می‌کنید تا از حملات سایبری محافظت کنید؟

رمزنگاری داده‌های رخشای در حین انتقال (بین کاربر و سرور) با استفاده از رمزنگاری‌های قوی (مانند TLS) محافظت می‌شوند تا از استراق سمع و حملات میانجی (MITM) جلوگیری شود. ناشناس‌سازی داده‌ها داده‌های شخصی کاربران ناشناس‌سازی یا حذف می‌شوند تا اطلاعات حساسی مانند نام، آدرس، یا سایر جزئیات قابل شناسایی به طور مستقیم ذخیره یا پردازش نشود.

همچنین سیستم‌های امنیتی ما به‌طور مداوم به‌روزرسانی می‌شوند تا با جدیدترین تهدیدات امنیتی و آسیب‌پذیری‌ها مقابله کنند. البته داده‌های کاربر برای مدت طولانی ذخیره نمی‌شود و در صورت نیاز به حذف آن، داده‌ها به صورت ایمن از سیستم‌ها پاک می‌شوند.

آیا برنامه‌ای برای ورود به بازارهای بین‌المللی دارید؟

بله از ابتدا کار نگاهی به این مورد داشته و متناسب با پایداری شبکه که دائم در حال مانیتورینگ است زیرساخت‌های خودمان را بررسی می کنیم . مزیت های رقابتی در زال ۳ و ۴ که در آینده ای نزدیک رونمایی می شوند بعد از پایداری می توانند مزیت مارا نسبت به رقبا بزرگ به رخ بکشد و مشوق کاربران کشور های دیگر باشد .

کشور‌های هدف کشور‌های همسایه و به خصوص کشور‌های حوزه تمدنی زبان فارسی و سپس کشور‌های حاشیه خلیج همیشه فارس و بعد از این موارد به صورت عمومی برای تمامی کشور‌ها است.

بزرگ‌ترین چالش‌ها و مشکلاتی که در توسعه هوش مصنوعی مبتنی بر فرهنگ ایرانی داشتید چه بوده و چطور آن را حل کردید؟

توسعه هوش مصنوعی مبتنی بر فرهنگ ایرانی با چالش‌های مختلفی روبه‌رو است که برخی از مهم‌ترین‌های آن‌ها را خدمتتون عرض می‌کنم.

دسترسی به داده‌های مناسب و بومی یکی از بزرگ‌ترین چالش‌ها، کمبود داده‌های با کیفیت و معتبر در زبان فارسی و همچنین داده‌های مرتبط با فرهنگ ایرانی است. بسیاری از مدل‌های هوش مصنوعی بر اساس داده‌های بزرگ‌مقیاس آموزش دیده‌اند که عمدتاً به زبان‌های انگلیسی یا دیگر زبان‌های پرکاربرد هستند. برای حل این مشکل، تیم‌ها و سازمان‌های فعال در این زمینه به جمع‌آوری داده‌های بومی از منابع مختلف (مانند کتاب‌ها، مقالات، محتوای آنلاین و…) و توسعه مجموعه‌ داده‌های خاص به زبان فارسی پرداخته‌اند.

تنوع زبانی و لهجه‌ها هم چالش به‌شدت سختی بود. زبان فارسی به خودی خود دارای تنوع گویشی و لهجه‌ای است که فهم و پردازش آن را پیچیده می‌کند. چالش دیگر در این زمینه، توسعه مدل‌هایی است که قادر به درک و پردازش صحیح این تنوع باشند. برای مقابله با این چالش، مجموعه داده‌های متنوعی از لهجه‌ها و گویش‌های مختلف ایرانی جمع‌آوری شده و مدل‌ها با داده‌های مختلف آموزش داده شده‌اند تا تنوع زبان را بهتر پوشش دهند.

کمبود ابزارهای تخصصی برای زبان فارسی از مشکلات قابل توجه بود. ابزارهای پردازش زبان طبیعی (NLP) و سایر ابزارهای هوش مصنوعی، بیشتر برای زبان‌های رایج دنیا مانند انگلیسی توسعه داده شده‌اند. به همین دلیل برای زبان فارسی ابزارهای مشابهی با کیفیت مناسب در دسترس نیست. برای حل این مشکل، توسعه‌دهندگان ایرانی اقدام به توسعه کتابخانه‌ها و ابزارهای بومی کرده‌اند. به‌عنوان مثال، برخی مدل‌های پردازش زبان طبیعی برای زبان فارسی از ابتدا طراحی و آموزش داده شده‌اند.

هماهنگی هوش مصنوعی با ارزش‌ها و فرهنگ ایرانی نیز یکی دیگر از چالش‌ها است. نیاز به انطباق هوش مصنوعی با ارزش‌ها و فرهنگ‌های خاص جامعه ایران است. در برخی موارد، محتوای تولید شده توسط مدل‌های هوش مصنوعی ممکن است با ارزش‌های اجتماعی و فرهنگی ناسازگار باشد. برای مقابله با این مسئله، الگوریتم‌هایی توسعه یافته‌اند که قادر به شناسایی و فیلتر محتوای نامناسب بوده و محتوای تولید شده را با فرهنگ و ارزش‌های محلی همسو کنند.

حمایت مالی و زیرساخت‌های فنی هم واقعا معضل سختی است که ما در کار داشتیم.توسعه و آموزش مدل‌های بزرگ نیاز به زیرساخت‌های قوی محاسباتی دارد که ممکن است در برخی مواقع محدود باشد. سرمایه‌گذاری در زیرساخت‌های محاسباتی و همکاری با نهادهای دولتی و خصوصی برای تأمین منابع مالی و فنی کمک کرده تا این مانع تا حدودی کاهش یابد.

چه اندازه به آینده هوش مصنوعی مولد در ایران امیدوار هستید و چه اقداماتی برای بومی‌سازی این فناوری در پیش دارید؟

آینده هوش مصنوعی مولد در ایران دارای پتانسیل بالایی است، اما تحقق آن به چند عامل کلیدی بستگی دارد.برای توسعه هوش مصنوعی مولد، نیاز به زیرساخت‌های قوی محاسباتی و ذخیره‌سازی داده‌ها است. سرمایه‌گذاری در مراکز داده، پردازنده‌های قدرتمند و شبکه‌های ارتباطی می‌تواند پیش‌نیاز مهمی باشد.

یکی از چالش‌های مهم برای بومی‌سازی هوش مصنوعی مولد، دسترسی به داده‌های با کیفیت و بزرگ‌مقیاس است. جمع‌آوری، سازماندهی و برچسب‌گذاری داده‌ها در بخش‌های مختلف از جمله زبان فارسی و فرهنگ‌های محلی می‌تواند نقش کلیدی در آموزش مدل‌های مولد داشته باشد.

تربیت متخصصان و محققان هوش مصنوعی و تقویت تیم‌های پژوهشی در دانشگاه‌ها و صنایع داخلی اهمیت بالایی دارد. حمایت از پروژه‌های تحقیقاتی و آموزش نیروی کار ماهر می‌تواند تأثیر مثبتی بر این مسیر داشته باشد از سوی دیگر تدوین قوانین و مقررات مناسب برای استفاده و توسعه هوش مصنوعی، حفاظت از حقوق کاربران و تنظیم مقررات مرتبط با داده‌ها و حریم خصوصی از دیگر عواملی است که می‌تواند بر روند بومی‌سازی تأثیر بگذارد.

همکاری با کشورهای پیشرفته در حوزه هوش مصنوعی و تبادل دانش و تجربه می‌تواند به تسریع فرآیند بومی‌سازی کمک کند. ایجاد شراکت‌های علمی و تجاری با کشورهای پیشرو در این زمینه بسیار مفید خواهد بود.

از اقدامات مهم برای بومی‌سازی این فناوری می‌توان به ایجاد پلتفرم‌های داخلی هوش مصنوعی مولد، پشتیبانی از زبان فارسی و فرهنگ بومی، حمایت از استارتاپ‌های مرتبط و سرمایه‌گذاری در تحقیق و توسعه اشاره کرد.

هوش مصنوعی

https://pvst.ir/j1v

یک دیدگاه

یوسف اکبری گفت:
۱۴۰۴-۰۴-۲۹ در ۱۲:۱۸ ب٫ظ
سلام آره واقعا رخشا خیلی مزخرفه بعد ادعا داره که مدل هوش مصنوعی داره اما مشخص که api چون سرعت پردازش هیچ موتور واقعی این قدر سریع نیس توی جنگ ۱۲ روزه هم مشخص شد که apiچون کلا سایتشون بالا نمیومد بعد ادعا دارن که اسرائیل به زیر ساختشون حمله کرده خنده دار نیس اخه؟
به نظر شما چرا اسرائیل باید به یک سایت که apiچت جی پی تی حمله سایبری کنه
واقعا فکر میکنن مردم این قدر بی سوادن که نفهمن api ؟
قضاوت با شما تست کنین کاملا بهتون ثابت میشه.
ارسال پاسخ

ارسال دیدگاه لغو پاسخ