دادههای تاریک اطلاعاتی دیجیتالی است که مورد استفاده قرار نمیگیرد. این مساله بسیار پیش میآید که سازمانی دادههای تاریک خود را به دلایلی کنار بگذارد؛ به خاطر قدیمی بودنشان یا وقتگیر بودن استفاده از آنها و… در چنین سناریویی اطلاعات، پروندهها یا اسناد ممکن است شامل اطلاعات ناقص یا قدیمیای باشند که به اشتباه تحلیل شدهاند یا در فرمتهای فایل یا روی ابزارهایی ذخیره شدهاند که قدیمیاند و دیگر از آنها استفاده نمیشود. عبارت «داده تاریک» روزبهروز بیشتر استفاده میشود و بیشتر در ارتباط با بزرگداده و داده عملیاتی قرار میگیرد؛ مثلاً فایلهای server log میتوانند سرنخهایی در مورد رفتار بازدیدکننده سایت ارائه دهند که داده ساختارنیافته است، و داده موقعیت جغرافیایی تلفن همراه میتواند الگوهای ترافیکی را نشان دهد که به برنامهریزی کسبوکار کمک میکند. داده تاریک میتواند در ایجاد منابع درآمدی جدید، حذف و کاهش هزینههای اضافی موثر واقع شود. بسیاری از سازمانها امروزه در حال استفاده از هدوپ هستند تا بتوانند دادههای تاریک مفید را شناسایی کنند و از آنها در کسبوکار خود بهره ببرند. منبع: تکتارگت