يلقي كيت كراوفورد ، الباحث الرئيسي في Microsoft Research ، عرضًا رائعًا في مؤتمر ستراتا لعام 2013 ، بإلقاء نظرة فاحصة على البيانات الضخمة وما يعنيه ، واستكشاف بعض ما تسميه كراوفورد "أوهام خوارزمية" والقيود المفروضة على حلول البيانات الواسعة النطاق التي يتم احتضانها في أجزاء كثيرة من عالم الأعمال.
باستخدام تشبيه أساسي لإدراك بصري يتضمن قطة دوارة ، يوضح كروفورد أنه على الرغم من أن البيانات الضخمة ضرورية للعديد من تطبيقات الأعمال ، إلا أن هناك أكثر من طريقة لتفسير العديد من نتائج مجموعات البيانات التي قد تبدو موضوعية لصانعي القرار البشري .
وقالت كروفورد مستشهدة بورقة تنعكس فيها مع المؤلف المشارك ديفيد بويد على بعض المبادئ الرئيسية لاستخدام البيانات الضخمة ، بما في ذلك ما تسميه كراوفورد "الأساطير" أو الاعتقاد بأن البيانات الضخمة تجلب الحقيقة المطلقة "يمكن رؤية الأشياء بشكل مختلف". والموضوعية للمشروع. وقالت إن القادة غالباً ما يربطون البيانات الكبيرة مباشرة برؤية موضوعية للعين ، مع تجاهل ما أسمته القيود أو الاعتبارات الأساسية الثلاثة التي قد تؤثر على هذه الموضوعية بطرق أساسية: التحيز والإشارة والحجم.
بدءًا من التحيز ، يستخدم Crawford أمثلة للفيضانات في أستراليا والولايات المتحدة لإظهار أن البيانات الضخمة لا تتطابق دائمًا مع الواقع في الشارع. إنها تربط بين المبدأ الثاني ، إشارة ، توضح كذلك كيف يمكن لمجموعات البيانات أن تعكس الحقائق الخفية التي يمكن أن تشوه النتائج بشدة. وكمثال على ذلك ، استشهد كروفورد بأنواع متعددة من خرائط العالم التي تم تطويرها في محاولة لإظهار رؤية موضوعية للحجم النسبي للقارات والأمم.
وقال كروفورد "الخرائط ليست محايدة." "نحن نقوم باختيارات في كل مرة نقرر فيها تمثيل بياناتنا."
لتوضيح المبدأ بشكل أكبر ، يستخدم Crawford مثال تطبيق يقوم بإبلاغ مسئولي المدينة عن الحفر في بوسطن ، مما يشير إلى أن هذه الأنواع من التطبيقات التي تعمل على الهواتف الذكية والأجهزة المحمولة يمكن أن ينتهي بها الأمر إلى جعل التقارير الشاملة تبدو مثل خرائط التعداد تشير إلى العمر النسبي والدخل عبر مدينة أو بلدية.
وقال كراوفورد "إننا نواجه خطر زيادة ترسيخ أنواع معينة من عدم المساواة الاجتماعية" ، مشيرًا إلى أولئك الذين قد يتم استبعادهم من مجموعة كبيرة من البيانات بسبب الاختلافات في استخدام التكنولوجيا.
"ماذا يحدث إذا كنت تعيش في ظل مجموعات البيانات الكبيرة؟" قالت.
بالإضافة إلى ذلك ، يتحدث كراوفورد أيضًا عن الأبحاث التي أجريت منذ سنوات والتي تساءلت عما إذا كانت المعلومات عالية المستوى تمثل دائمًا بيانات أكثر دقة وما إذا كانت "بانوراما موضوعية" تعمل دائمًا على أنها تمثيل أكثر دقة من البيانات على نطاق أصغر. كما يطلب كراوفورد من المستمعين أن يفكروا ليس فقط في البيانات الضخمة ، ولكن في "البيانات بعمق" وبهذا ، فهي تعني البيانات التي توجه القراء حقًا نحو الواقع الموضوعي ، بدلاً من التملص على التفاصيل بنهج أكثر عالمية والتي ، بينما أسهل في الفهم ، قد تتجاهل العناصر الرئيسية لما هو موجود بالفعل.