اواخر سال 2011 بزرگ دادهها به یک موضوع داغ در تقریبا هر حوزه مرتبط با فناوری اطلاعات تبدیل شد. «شرکت دادههای بینالمللی» یا آیدیسی (IDC) در تعریف فناوریهای بزرگ دادهها آن را «نسل جدیدی از فناوریها و معماریها میداند که با ضبط، استخراج، کشف یا تحلیل فوری انبوهی از انواع مختلف دادهها؛ ارزش اقتصادی آنها را استخراج میکند.» مبحث بزرگ دادهها سه عنصر اصلی دارد: اول خود دادهها، دوم تحلیل دادهها و در آخر ارائه نتایج تحلیل. پس محصولات و خدماتی پیرامون بزرگ دادهها با یک یا همه عناصر فوق ارائه میشوند. البته جهان دیجیتالی نیز خود متشکل از دادههاست ـ همه انواع دادهها. اما بخش عمدهای از دادههای جدید که امروزه تولید میشوند، در نوع خود ساختاریافته نیستند. این بدان معناست که در غالب موارد، ما شناخت کمی از دادهها داریم مگر اینکه به نوعی آنها را دستهبندی کنیم یا برای هر کدام برچسب بگذاریم؛ کاری که در نهایت منجر به شکلگیری متاداده (metadata) خواهد شد. متادادهها یکی از خردهبخشهای جهان دیجیتالی است که با سرعتی فراتر از خردهبخشهای دیگر رشد میکند (هرچند متاداده یک بخش کوچک از کل جهان دیجیتال است). ما معتقدیم تا سال 2020 یکسوم دادهها در جهان دیجیتالی (بیش از 13 هزار هگزابایت) ارزشی در حد بزرگ دادهها خواهند یافت اما به این شرط که ابتدا دستهبندی و تحلیل شوند. البته همه دادهها نیز الزاما برای تحلیل بزرگ دادهها مفید نیستند. اما برخی انواع دادهها هستند که برای تحلیل بسیار مناسبند، مثل: تصاویر ویدئویی امنیتی: عموما، متادادههای کلی (تاریخ، زمان، مکان و...) به صورت خودکار به تصاویر ویدئویی پیوست میشوند. با گسترش دوربینهای مداربسته، فرصتها برای گنجاندن هوش بیشتر در آنها نیز گسترش مییابد. طوری که امروزه شاهدیم در دوربینهای پیشرفته تصاویر فورا ضبط، تحلیل و طبقهبندی میشوند. این فرآیند میتواند باعث تسریع در روند تحقیقات جنایی شود، تحلیل الگوهای خرید (با توجه به ترافیک...