استخدام الخوارزميات للتنبؤ بالانتخابات: محادثة مع linzer

2026

سيقدم درو مؤتمر قمة البيانات الضخمة ، 30 و 31 يناير في لاس فيجاس: http://analytics.theiegroup.com/bigdata-lasvegas ، إلى جانب متحدثين من أوباما لأمريكا ، بست باي ، ينكدين ، نيويورك تايمز ، Nokia و Bitly و Barnes & Nobles و Walmart Labs وغيرها الكثير.

رابط التسجيل: http://bit.ly/Zs3wms

أجرى جورج هيل هذه المقابلة ونشرت في مجلة Big Data Innovation.

أي نوع من رد الفعل كان هناك لتوقعاتك؟

ركزت معظم ردود الفعل على الفرق في الدقة بين أولئك منا الذين درسوا استطلاعات الرأي العام ، وتوقعات "الشعور الغريزي" للنقاد والمعلقين المشهورين. في يوم الانتخابات ، مثّل محللو البيانات مثلي ، Nate Silver (مدونة New York Times FiveThirtyEight) ، وسيمون جاكمان (جامعة ستانفورد وهوفينجتون بوست) ، وسام وانج (Princeton Election Consortium) فرص إعادة انتخاب أوباما بأكثر من 90٪ ، وتوقعوا بشكل صحيح 332 صوتا انتخابيا لأوباما باعتبارها النتيجة الأكثر احتمالا. في غضون ذلك ، قال خبراء مثل كارل روف وجورج ويل وستيف فوربس إن رومني سيفوز - وفي بعض الحالات بسهولة. وقد أدى هذا إلى الحديث عن "انتصار لل quants" والتي آمل أن تستمر في الانتخابات المقبلة.

كيف تقيم الخوارزمية المستخدمة في تنبؤاتك؟

قدّر نموذج التنبؤ الخاص بي نتائج تصويت الولاية والتصويت الانتخابي النهائي ، في كل يوم من أيام الحملة ، بدءًا من يونيو. أردت أن يكون تقييم هذه التوقعات عادلة وموضوعية قدر الإمكان - وألا يترك لي أي مجال للمناورة إذا كانت خاطئة. لذلك ، قبل شهر تقريبًا من الانتخابات ، نشرت على موقعي مجموعة من ثمانية معايير تقييم أستخدمها بمجرد معرفة النتائج. كما اتضح ، عمل النموذج بشكل مثالي. لقد تنبأ خلال الصيف بأن يفوز أوباما بجميع ولاياته لعام 2008 مخصوماً منها ولاية إنديانا ونورث كارولينا ، وبالكاد ابتعد عن هذا التنبؤ حتى بعد أن ارتفع الدعم لأوباما في سبتمبر ، ثم تراجع بعد أول مناقشة رئاسية.

كانت كمية البيانات المستخدمة خلال هذه الحملة من قبل المحللين المستقلين وفرق الحملات ضخمة ، فما نوع الآثار المترتبة على ذلك بالنسبة لاستخدام البيانات في عام 2016؟

أثبتت حملة 2012 أنه يمكن إدارة مصادر متعددة ومتنوعة للمعلومات الكمية وموثوقيتها وتطبيقها بنجاح في مجموعة متنوعة من الأهداف. كنا الغرباء قادرين على التنبؤ بنتيجة الانتخابات في وقت مبكر. داخل الحملات ، كانت هناك خطوات هائلة في استهداف الناخبين وتتبع الرأي وجمع الأموال وإقبال الناخبين. الآن بعد أن علمنا أن هذه الأساليب يمكن أن تنجح ، أعتقد أنه لا يوجد عودة. أتوقع من المراسلين والمعلقين في الحملة أن يأخذوا عملية المسح الاستقصائي على نحو أكثر جدية في عام 2016. وعلى الرغم من أن أوباما والديمقراطيين يبدو أنهم يتمتعون حاليًا بميزة في تكنولوجيا الحملة ، إلا أنني سأندهش إذا لم يستطع الجمهوريون اللحاق بالركب بسرعة.

هل تعتقد أن نجاح هذه الحملة التي تعتمد على البيانات يعني أن مديري الحملات بحاجة الآن لأن يكونوا محللين وأيضًا خبير استراتيجي؟

قد لا يحتاج مديرو الحملات لأن يكونوا محللين ، لكن يجب أن يكون لديهم تقدير أكبر للكيفية التي يمكن بها تسخير البيانات والتكنولوجيا لصالحهم. تستخدم الحملات دائمًا أبحاث الاستقصاء لصياغة الإستراتيجية وقياس معنويات الناخبين. ولكن هناك الآن مجموعة من الأدوات القوية الأخرى المتاحة: مواقع الشبكات الاجتماعية ، وقواعد بيانات الناخبين ، والهواتف الذكية المحمولة ، وتسويق البريد الإلكتروني ، على سبيل المثال لا الحصر. وهذا بالإضافة إلى التطورات الحديثة في منهجيات الاقتراع ونمذجة الرأي الإحصائي. هناك الكثير من الابتكار يحدث في سياسة الحملة الأمريكية في الوقت الحالي.

لقد تمكنت من التنبؤ بنتائج الانتخابات قبل 6 أشهر ، فما رأيك في الإطار الزمني الأقصى الواقعي للتنبؤ بدقة بالنتيجة باستخدام تقنيات التحليل الخاصة بك؟

حوالي أربعة أو خمسة أشهر تقريبًا بقدر ما يسمح لنا العلم بالذهاب الآن ؛ وهذا حتى يدفع بها قليلاً. قبل ذلك ، لم تكن استطلاعات الرأي غنية بالمعلومات الكافية حول النتيجة النهائية: إما أن الكثير من الناس إما لم يحسموا أمرهم أو لم يبدأوا في الاهتمام بالحملة. تبدأ العوامل الاقتصادية والسياسية التاريخية التي ثبت أنها مرتبطة بنتائج الانتخابات في فقدان قوتها التنبؤية بمجرد تجاوزنا نطاق الـ 4 إلى 5 أشهر تقريبًا. لحسن الحظ ، لا يزال هذا يمنح الحملات متسعًا من الوقت لرسم الاستراتيجية واتخاذ القرارات حول كيفية تخصيص مواردها.