فرصتهای روشنایی در دادههای غیرساختاریافته پنهان است
به روشنایی مجال دهید
۲۸ خرداد ۱۳۹۸
زمان مطالعه : ۶ دقیقه
شماره ۶۸
تاریخ بهروزرسانی: ۲۳ مهر ۱۳۹۸
در عصر فناوری داده به منزله پول است. اطلاعات خام تولیدشده در حجمهای زیاد که از طریق رسانههای اجتماعی، سیستمهای تراکنشی، موتورهای جستوجو و تکنولوژیهای بیشمار دیگر مدفون شده و بعد از تحلیل، آشکار میشود، میتواند فرضیههایی برای تصمیمگیری و ایجاد مسیرهای جدید در آینده ارائه دهد. تا همین اواخر رویکرد منفعلانه به تحلیل و داده اقدامی رایج بود. سازمانها با هدف ارائه گزارش، از قابلیتهای تحلیل برای محدود کردن نمونههای داده ساختاریافته استفاده میکردند. اما مسائل مربوط به کیفیت در زمینه دادهها و نبود پیچیدگی کاربر و ناتوانی برای یکپارچهسازی دادهها در سیستمهای سازمانی منجر به ایجاد بینشهایی میشد که در بهترین حالت محدود و در بدترین حالت گمراهکننده بودند. امروزه مدیران ارشد اطلاعات از ابزارهای مختلف مثل یادگیری ماشین، بصریسازی، پردازش زبان طبیعی و تحلیلهای شناختی برای پاسخ دادن به سوالات و شناسایی بینشها و الگوهای ارزشمند استفاده میکنند؛ کاری که چند سال قبل غیرممکن به نظر میآمد. در واقع تحلیل در حال حاضر بر حوزه فناوری اطلاعات و سرمایهگذاری غلبه دارد. تحلیل تاریک در درجه اول روی دادههای خام مبتنی بر متن تمرکز دارد که تحلیل نشدهاند و تاکید آنها بر دادههای غیرساختاریافته یا ساختارنیافته است که امکان دارد شامل چیزهایی مثل پیامهای متنی، اسناد، ایمیل، فایلهای صوتی و ویدئویی و تصاویر باشد. بررسیهای تحلیل تاریک همچنین وب عمیق، وب پنهان یا دیپوب (deep web) را هدف قرار میدهد که هر چیز آنلاینی را در بر میگیرد که توسط موتورهای جستوجو نشان داده نمیشود؛ از جمله مجموعهای از سایتهای غیرقابل دسترس و ناشناس که با عنوان دارکوب یا وب تاریک شناخته میشوند. مصاحبه دقیق اندازه دیپوب غیرممکن است اما برخی تحمین میزنند وب تاریک ۵۰۰ برابر بزرگتر از وب آشکار یا surface web است که اکثر مردم به طور روزانه از آن استفاده میکنند. در فضای کسبوکار که داده به عنوان منبع مالی، مسالهای رقابتی است، منابع...
شما وارد سایت نشدهاید. برای خواندن ادامه مطلب و ۵ مطلب دیگر از ماهنامه پیوست به صورت رایگان باید عضو سایت شوید.
وارد شویدعضو نیستید؟ عضو شوید