شان اون، مدیر موسسه علوم اطلاعات کلوداِرا (Cloudera) در این گفتوگو درباره رابطه یادگیری ماشین و هادوپ، آینده آپاچی ماتوت و چرایی اهمیت یادگیری ماشین سخن میگوید.
گرایشهای اصلی یادگیری ماشین در حال حاضر چه هستند؟ صادقانه بگویم، من فکر میکنم یادگیری ماشین هنوز هم برای بسیاری از شرکتها موضوعی پیشرفته است. زیرساخت اکثر سازمانها مبتنی بر گزارشها و تحلیلهای گزارشدهنده غیرتخمینی است و تحلیل پیشگویانه هنوز موضوعی دشوار و پرهزینه به حساب میآید. اما تکنیکها و ابزارهای یادگیری ماشین در حال رشد هستند و بسیاری از آنها تبدیل به پروژههای متن باز شدهاند. بنابراین دستکم این احتمال وجود دارد که شرکتهای متوسط بتوانند تکنیکهای یادگیری ماشین را پیادهسازی کنند و به باور من سال گذشته و سال جاری زمان بیداری فرصتها در این حوزه بوده است. اکثر مشتریان ما هنوز در اول راهند اما برنامههای پنجساله برای توسعه تحلیلهای پیشگویانه دارند. ما اخیرا با جیک مانیکس، مدیر یادگیری ماشین توییتر گفتوگویی داشتهایم. او معتقد است یادگیری ماشین همان مسیری را طی میکند که پروژه بزرگدادهها طی کرد. یعنی تا چند سال دیگر بر محبوبیتش افزوده میشود ولی کسی نمیداند واقعا با چه چیزی سر و کار دارد یا باید چطور از آن استفاده کند. آیا شما با این ادعا موافقید؟ بله، جیک قیاس خوبی انجام داده است. من فکر میکنم ایدههای زیادی به یادگیری ماشین و بزرگدادهها تزریق میشوند. بسیاری معتقدند قضیه به همین سادگی است که شما انبوهی از داده دارید و ماشینتان با عصایی جادویی از این داده چیز یاد میگیرد. ماجرا در عمل اصلا به این سادگی نیست. امروزه دیگر مثل پنج سال گذشته مقیاس دادهها اهمیتی ندارد؛ قبل از هر چیز تحلیل آماری مهم است و اکنون آمارشناسهایی در این زمینه کار میکنند که نمیدانند سیستمهای تحلیلی چه هستند و از طرف دیگر مهندسانی داریم که نمیدانند آمار چیست. در حال حاضر شکاف بین دو حوزه علوم داده بزرگ و بزرگتر شده است. معتقدم اکنون فقط در موقعیتی هستیم که میتوانیم بگوییم یادگیری ماشین از پس چه کارهایی برمیآید و قادر به...
شما وارد سایت نشدهاید. برای خواندن ادامه مطلب و ۵ مطلب دیگر از ماهنامه پیوست به صورت رایگان باید عضو سایت شوید.