نسخه فیزیکی

  • شهر کتاب مرکزی تهران – خیابان دکتر شریعتی – بالاتر از خیابان استاد مطهری – نبش کوچه کلاته – فروشگاه مرکزی شهر کتاب
  • شهر کتاب کاشانک نیاوران، کاشانک، نرسیده به سه راه آجودانیه
  • نشر ثالث خیابان کریم‌خان زند، بین خیابان ایرانشهر و ماهشهر، پلاک ۱۵۰
  • شهر کتاب سعادت آباد انتهای خیابان ایران‌زمین، جنب فرهنگسرای ابن‌سینا، شهر کتاب ابن‌سینا
شماره 41 جهان پرونده - پیوست جهان صفحه 135

مروری بر تاثیر توییتر بر منابع داده‌ها و اطلاعات

مشکل ناشناخته‌ها

استفاده از داده‌های رسانه‌های اجتماعی، به ویژه داده‌های توییتر در تحقیقات دانشگاهی در حوزه مسائل اخلاقی، حقوقی و روش‌شناختی، چالش‌های خاصی دارد. وثیم احمد بر اساس تلاش قبلی خود در کسب داده‌های توییتر، به همین مساله می‌پردازد و لیستی از چالش‌های احتمالی پیش روی محققان را معرفی می‌کند. او همچنین لینک‌های متنوعی از منابع را برای دانشمندان حوزه اجتماعی ارائه کرده است که به دنبال بررسی بیشتر چنین چالش‌هایی هستند.
در این یادداشت به برخی از مسائل روش‌شناختی، اخلاقی، حریم خصوصی و مالکیت فکری اشاره می‌کنم که در استفاده از توییتر به عنوان یک منبع داده‌ای ایجاد می‌شوند.
از توییتر می‌توان به عنوان منبع داده‌ای برای تحقیقات علوم اجتماعی در هر دو جریان‌های کنونی و تاریخی استفاده کرد اما در عین حال می‌توان از منابع داده‌ای سنتی‌تری مانند نظرسنجی و مصاحبه نیز بهره برد. توییتر اکنون ۳۱۶ میلیون کاربرد فعال ماهانه با ۵۰۰ میلیون توییت در روز دارد. مارک اسیمت از بنیاد تحقیقات رسانه اجتماعی در کنفرانس وب آینده به این مساله اشاره دارد که هرچند میادین و برج‌های شهر هنوز هم مهم هستند اما افراد بیشتری همچنان به دنبال توییت کردن رخدادهای جدیدند.
کسب داده‌های توییتری نیازی به هیچ برنامه کامپیوتری یا مهارت‌های پیشرفته ندارد. البته معمولاً چالش‌های خاصی در زمینه استفاده از داده‌های رسانه‌های اجتماعی در تحقیقات دانشگاهی و به ویژه در مورد داده‌های توییتری شکل می‌گیرد که دانشمندان اجتماعی برای اولین بار با آنها مواجه می‌شوند. در ادامه لیستی از برخی چالش‌های احتمالی در صورت استفاده از توییتر به عنوان یک منابع داده‌ای در تحقیقات آکادمیک ارائه می‌دهیم و منابع دیگری را معرفی می‌کنیم که می‌توانند راهنمایی برای این‌گونه مسائل باشند:

مسائل اخلاقی: در جمع‌آوری و بازیابی اطلاعات از منابع داده‌ای بزرگ، شاید نتوان اجازه‌ای آگاهانه از تمامی شرکت‌کنندگان کسب کرد، صرفاً به این دلیل که حجم توییت‌های دریافتی بسیار بالاست. مسائل اخلاقی نیز در زمینه بازنشر آن توییت در انتشارات دانشگاهی وجود دارد که باید با دقت بالا در موضوعات حساسی مانند کسب رضایت پیش از افشای هویت یا توییت کاربر، به آنها رسیدگی شود.

مسائل حقوقی: اشتراک‌گذاری پایگاه‌های داده‌ای تحت شرایط خدماتی توییتر ممنوع است اما محققان می‌توانند شماره شناسه توییت را به اشتراک بگذارند که محققان دیگر از آن برای دسترسی به منبع داده‌ای استفاده خواهند کرد. اگر به هر دلیلی امکان اشتراک‌گذاری شناسه توییت نباشد، اشتراک‌گذاری کلیدواژه‌ها و زمان بازیابی داده، می‌تواند به محققان در رسیدن به آن منبع داده‌ای کمک کند. در ضمن ممکن است شرایط خاصی برای نشر توییت در یک نشریه خاص وجود داشته باشد، به این معنی که راهنمای توییتر باید رعایت شود. می‌توانید به شرایط خدمات توییتر مراجعه کنید.

بازیابی منابع داده‌ای: استفاده از کلیدواژه‌های خاص با هشتگ شاید نتواند همه داده‌های مربوط به یک موضوع را بازیابی کند. این مساله می‌تواند در صورت استفاده مشترک از چند موتور جست‌وجو مفید باشد که تا جای ممکن از واژه‌های جست‌وجوی متعدد استفاده شود و منبع داده‌ای بر اساس کلیدواژه‌های نامربوط فیلتر شود. دلیل این مساله آن است که نبود برخی کلیدواژه‌ها یا هشتگ‌ها، می‌تواند یک انحراف نظام‌مند به وجود آورد که نهایتاً به یک نمونه منحرف هم منتهی خواهد شد. می‌توانید به گزارش دموس و ایپوس موری درباره نمایندگی مراجعه کنید. منابع داده نیز احتمالاً بر اساس زبان مورد استفاده برای بازیابی محدود خواهند شد، مثلاً استفاده از کلیدواژه انگلیسی Ebola درباره همه‌گیری این بیماری، نتوانست توییت‌های مربوط به این بیماری به زبان‌های دیگر را بازیابی کند.

هزینه: داده‌های توییتری بسیار هزینه‌بر است و اگر امکان بازیابی یا ایجاد یک سیستم برای بازیابی داده‌های توییتر طی هفت روز درباره یک موضوع مورد علاقه وجود نداشته باشد، رسیدن به داده‌ها بسیار دشوار می‌شود. دلیل این مساله آن است که اکوسیستم API رایگان تنها می‌تواند داده توییترهایی تا هفت روز قبل از آن را بازیابی کند. داده‌های توییتر ممکن است بسته به زمان بازیابی و واژه جست‌وجو متغیر باشند. همچنین می‌توان به صورت رایگان تخمینی از هزینه کاربرد داده‌های توییتری را با استفاده از Sifer به دست آورد.

نمایندگی: کاربران توییتر نمی‌توانند نماینده جمعیت آفلاین کشور باشند، این کاربران حتی نماینده کاربران اینترنت هم نیستند و به احتمال زیاد داده‌های توییتر نمی‌تواند نماینده دقیق کاربران توییتر نیز باشد. دلیلش این است که کاربران توییتر همه در مورد مساله‌ای خاص توییت نمی‌کنند، مثلاً در دوره همه‌گیر شدن ابولا، همه کاربران توییتر توییتی در مورد این موضوع نداشته‌اند. همچنین مهم است به خاطر داشته باشیم همان افراد در همه اوقات در حال توییت نیستند، و نهادهایی مانند سازمان‌ها یا افرادی با هویت‌های غیرفردی مانند روزنامه‌نگاران هم توییت می‌کنند. همان‌طور که گزارش دموس و ایپوس موری نشان می‌دهد، داده‌های تولیدشده توییتر نماینده کاربران توییتر نیست زیرا معمولاً تعداد کمی از اکانت‌ها تنها می‌توانند نماینده بخشی از منابع داده‌ای باشند.

اسپم: مساله لینک‌های نادرست در میان هشتگ‌ها نیز بسیار مهم است (به معنی توییت‌هایی که با کلیک روی آنها به جایی نامرتبط برده می‌شوید) و موضوعات محبوب در توییتر ممکن است اسپم بسیار بالایی داشته باشند. حتی تایید اینکه کاربر واقعی یا جعلی است هم دشوار است. معمولاً اکانت‌های جعلی یا برای افزایش (غیرواقعی) فالوور کاربران دیگر (مشاهیر یا سیاست‌مداران) یا بازتوییت مطالب و محبوب نشان دادن آنها استفاده می‌شوند – در مواردی که تعداد زیادی اکانت، مطالب یک کاربر را بازتوییت می‌کنند. میزان وجود اکانت‌های جعلی، بازتوییت‌ها و محبوبیت‌های جعلی در توییتر دقیقاً معلوم نیست اما این واقعیت که چنین بسته‌هایی به صورت رایگان و از طریق جست‌وجوی گوگل پیدا می‌شوند نشان‌دهنده محبوبیت آنها میان کاربران است.

ناشناخته‌ها: مسائل روش‌شناختی نیز به احتمال زیاد در زمینه استفاده از داده‌های رسانه‌های اجتماعی، به ویژه داده‌های توییتر در حوزه این تحقیقات وجود دارد که در حال حاضر آشنایی‌ای با آنها نداریم. از این رو باید در نتیجه‌گیری‌های خود بر اساس توییتر بسیار محتاط باشیم

نظر بگذارید

اولین نفری باشید که نظر میگذارد

اعلان برای
avatar
wpDiscuz