مراجعة كتاب (الكل يكذب): البيانات الضخمة وقدرة الانترنت على اكتشاف الخفايا

إعداد دعاء أبو عصبة:

 رغم أن العلوم الإنسانية ليست متصدّرة في قائمة اهتماماتي القرائية، إلا أنني أجد العناوين التي تبحث في طبيعة الإنسان جذّابة جدًا، أبحث عن أقرب إجابة مقنعة لسؤال “لماذا نحن هكذا؟”، لكن تبقى مشكلة العلوم الإنسانية (علم النفس وعلم الاجتماع) وحتى العلوم السياسية والاقتصاد؛ كلها من المستبعد أن نختصرها بقانون واحد بسيط خالد لكل زمان ومكان كما في العلوم الطبيعية، فليس ثمة قانون لاحتمالية أن يصبح الفرد عنصريًا بناءً على مكان سكنه ومستواه المادي مثرلًا، ولا يمكننا التنبؤ بفشل ثورة في بلد ما، أي أننا ببساطة لا يمكن أن نتنبأ بمستقبل أي ظاهرة تتعلق بتفكير البشر وحياتهم إلا بالتخمينات أو بتعميم نتيجة عينة على المجتمع.

ورغم التقدّم الهائل الذي أحرزته علوم المخ والأعصاب في إدخال أدواتها للبحث عن إجابات الأسئلة النفسية والمجتمعية، مثل قياس زمن ردّة الفعل واتساع حدقة العين وزرع الأقطاب الكهربائية لإجراء التجارب اللغوية؛ إلا أن هذه الأساليب لم تعطِنا صورة لأفكار الإنسان المعقّدة، كما تخيّل أفونسو كروش في رواية (الرسّام تحت المجلى) جهازًا يعطينا صورة لأخلاق الإنسان وروحه كما يتم تصوير العظام بالأشعة السينية، كل الأدوات المتوفرة لا تجعل من أسئلتنا واضحة ثم الإجابة عنها بنعم أو لا. فهل ما زال الأمر على هذا الحال؟ أم بإمكاننا بظهور أدوات جديدة بداية الوثوق أكثر بتلك العلوم كما نثق في الفيزياء؟
على الجانب الخلفي من كتاب (الكلّ يكذب)، معرّف الكاتب الأمريكي سيث ستيفنز-دافيتوس على أنه (عالِم بيانات وخبير اقتصادي)، أما قائمة العناوين تحوي على حقيقة الكراهية وحقيقة الجنس وأشياء كثيرة عن أنفسنا هي ساحة العلوم الإنسانية وعلوم الأعصاب، فكيف ستساعدنا البيانات الضخمة في الإجابة عن تلك الأسئلة؟ وهل هذه هي الأداة التي ستنقل العلوم الإنسانية نقلة نوعية؟
كارل بوبر، فيلسوف العلم الذي وضع أحجار الأساس للتفريق بين ما هو علم رصين وما هو مجرد آراء لا يمكن التحقق من صحتها، ها هو بنظرته الجدّية أتخيله يجلس قبالة سيث ستيفنز- دافيدوتس ليحدثونا قليلًا حول هذا الأمر.

بوبر: أهلاً عزيزي دافيدوتس، سمعت عن كتابك (الكل يكذب) وقد أثار فضولي بشكل كبير ولم أستطع إلا أن أندهش بما وصل له العلم من أدوات جديدة.

دافيدوتس: كم يبدو مهمًّا بالنسبة لي أن أكون من أوائل مَن شقّو هذا الطريق في بحث وتطوير أدوات جديدة علمية تنقل علم الاجتماع نقلة نوعية، قد يصبح حينها في نظرك ووفقًا لمنهجك علمًا حقيقيًا.

بوبر: تعرف كم أنا صارم بهذا الأمر، أخشى أن تكون قد استخدمت أسلوب المصطلحات غير المفهومة من أجل أن تحصد الإعجاب، العلم يصل بعبارات بسيطة وواضحة كما في الفيزياء، فالطاقة تساوي الكتلة في مربع سرعة الضوء في كل مكان وزمان، ولكن حين تدعّم النظريات بالمصطلحات المرنة والثقيلة تتركنا في حيرة وتساؤل عن مدى فائدتها العملية.

دافيدوتس: أشك أنك حين تطلع على العالَم الآن، ستتساءل عن علماء نظرية الأوتار إن كان ما يقومون به هو أمر علمي، أم أنهم غارقون في نوع من رياضة الجمباز الذهني، ولكن ادّعاء أن ثمة معادلة رياضية واحدة أحدثت ثورة في علم الاجتماع فهذا ضرب من الجنون، لا يمكن أن نُخضِع الأدمغة البشرية لقوانين بسيطة خالدة.

بوبر: حسنًا، ولكن أنا هنا بحاجة لتوضيح هذا الأمر، فكما تعلم حين كنت أقارن بين ما يقوله سيجموند فرويد وما يقوله أينشتاين مثلًا أشعر أني أستمع لترهات مجمّعة تسمي نفسها (علم نفس) وليست إلا آراء فرويد الشخصية، لا يمكن لنا أن نقول عنها خاطئة، فهل الأدوات الجديدة ستجعل الأمر قابلًا للتفنيد وإن لم يوجِد قانونًا بسيطًا؟

دافيدوتس: سأوضح الأمر بمثال، أتيحت لي الفرصة للتحقق من صحة كلام فرويد باستخدام قوة علم البيانات، وهذا عن طريق جعلها قابلة للتفنيد، مثلًا في موضوع الرموز القضيبية التي تظهر في الأحلام مثل الموز؛ حوّلت افتراضه إلى سؤال يمكن الإجابة عنه، فهل حصل الموز على شعبية أكبر عن باقي أنواع الطعام؟ للتحقق حصلت على بيانات من تطبيق “شادو” الذي يطلب من مستخدميه تسجيل أحلامهم، وشرعت في ترميز الأطعمة المدرجة في عشرات الآلاف من الأحلام، ومن هنا وضعت سببين لتكرار الحلم بالأطعمة: أولها مدى استخدامها والثاني يتعلق بمدى اللذة التي تسببها، ومن هنا وجدت أن الطعام الذي يأخذ شكل القضيب لا يعني زيادة احتمالية ظهوره في الأحلام مقارنةً بمدى شعبيته، إذن استطعت أن أثبت خطأ نظرية فرويد حول هذه القضية، وقد قمت بالمزيد من الأبحاث عن نظريات أخرى له، مثل هل الأخطاء في الكتابة تعبر عن رغبات مكبوتة؟ وهل تتشكل الغريزة الجنسية عبر تجارب الطفولة؟

بوبر: أعتقد أن الأمر بحاجة للتوقف عنده وإعادة السؤال حول المنهجية العلمية، أشكرك على حرصك على محاولة إعطاء الكثير من الأسئلة الشائكة حول تصرفات البشر المزيد من الموثوقية، لنكشف الخفايا باستخدام علم حقيقي.

دافيدوتس: أنا على ثقة بأن مستقبل علم البيانات مشرق، وسيظهر لنا فرويد آخر عالم بيانات، وميشيل فوكو القادم عالم بيانات، وربما كارل ماركس أيضًا.
من فترة قريبة شاهدت فيلمًا عبقريًا أعتقد أنني دعوت الكثير من الأصدقاء لمشاهدته، وكانت لديّ أمنية _وما زالت_ لنقاش هذا الفيلم، وقد كتبت عنه هنا. خلال قراءتي لأفكار الكتاب حول الأشياء التي من الممكن أن تتنبأ بها البيانات الضخمة والتي سأعود لها بعد قليل، برز برأسي سؤالٌ حول التنبؤ بحركة سوق الأسهم من خلال هذه البيانات _خاصة أن الكاتب خبير اقتصادي_، وإذ بي أجد موضوع الفصل الأخير مشتملًا لهذا الأمر، ولكن الجواب المختصر للسؤال كان “لا”.

الرياضيات لغة الطبيعة، كل شيء حولنا يمكن أن يمثل ويصبح مفهومًا من خلال الأرقام، لو تم تخطيط الأرقام بنظام فستظهر تفاصيل الأرقام، لذا فهناك تفاصيل في كل مكان حولنا بالطبيعة، حلقة الأوبئة والمرض، الزيادة والنقصان للسكان، دوران الشمس، زيادة وانخفاض منسوب النيل؛ إذًا .. ماذا عن سوق الأسهم المالية؟

كون تلك الأرقام تمثل الاقتصاد العالمي، ملايين الأيدي في العمل وبلايين العقول، شبكة واسعة من الصراخ بالحياة للكائن الحي، كائن حي طبيعي.

فرضيتي: ضمن سوق الأسهم المالية فهناك تفاصيل أيضًا أمامي تمامًا تختفي وراء الأرقام دائمًا، إنها لعبة الأرقام، إنها لعبة الأرقام من فيلم Pi.

ناقش الكتاب ما أطلق عليه اسم (لعنة تعدد الأبعاد)، وهي ببساطة أن تحصل على نتيجة شيطانية مقنعة جدًا بأنها مبتغاك، في حين أنها مجرد احتمال عشوائي يظهر عندما يكون هناك الكثير من المتغيرات أو الأبعاد، وهذه هي الحفرة التي سقط بها كل من حاول الوصول لما كان يبحث عنه ماكس كوهين، التنبؤ بسوق الأسهم.
البيانات الضخمة تتيح لنا أشياء كثيرة جدًا جدًا، بدءًا من بيانات البحث في جوجل، أو حالات مواقع التواصل الاجتماعي، أو بيانات من تطبيقات أخرى لا حصر لها، وهنا يجد عالِم البيانات نفسه أمام كثير من المتغيرات، ويقوم بالكثير من الأبحاث التي قد توقعه فريسة لعنة تعدد الأبعاد.

مثلًا يمكن أن يشير التعبير عن الطمأنينة في تغريدات تويتر، إلى ارتفاع مؤشر داو جونز الصناعي بعد ستة أيام تحديدًا من ظهور التغريدات، وهذا ما حدث مع فريق من علماء الحاسب من جامعة إنديانا ومانشستر، وبناءً على هذه النتائج قاموا ببناء صندوق تحوط للاستفادة من النتائج، وهنا وقعوا في لعنة تعدد الأبعاد حيث أنهم بحثوا بأعداد مهولة من المتغيرات مما أدى لحدوث الصدفة الإحصائية لتحقيق المبتغى بشكل زائف.

ومن هنا سأعتذر لصديقي ماكس كوهين الذي حاوطته الأرقام لسنين طويلة والتهمت دماغه المسكين بالمزيد من الصداع، للأسف ما زال العلم غير قادرٍ على التنبؤ بالكثير من الأمور التي تكون أسبابها أكبر مما يمكن شموله والبحث في العلاقات السببية بينها، وأعتذر أيضًا للعلماء في مجال الجينوم البشري لأن ثمة تعقيدات في ربط صفة بشرية معينة مع جين معيّن، وقد وقعت أخطاء بهذا الصدد كما حدث مع روبرت بلومين الذي ظن أنه اكتشف الموروثة التي تحدد معدل الذكاء.

وهنا ناقش الكاتب فكرة مهمة، وهي أن يتواضع الباحث جدًا وأن يعلم مقدّمًا أنه قد يستهلك سنينًا من عمره ثم لا يحصل إلا على جداول وخوارزميات لم تؤدِّ إلى أي نتيجة صالحة.
في حواراتي الجادّة مؤخرًا تبيّن لي من حيث لا أدري أن الأفكار التي أدافع عنها عادةً تُصنّف على أنها “أكثر راديكالية” وليبرالية (وهي باختصار تدعو لتقبّل الأقليّات وفتح باب التساؤل عن أخلاقية بعض التصرفات)، لم أكن مطلعة على هذه التسميات تحديدًا، لكن كل ما أملكه من أفكار والتي غالبًا تكون على شكل تساؤلات لا يقينيات، كلها كانت نتيجة لمحاولة التوسع بالمجالات العلمية والتفكير بعدم حقيقية الواقع بناءً على ميكانيكا الكم مثلًا، أو التفكير ببراءة المجرمين بناءً على خفايا الجينات وعلم الأعصاب، أو التساؤل عن أخلاقية تحكم الإنسان في الحيوانات.

لا أكون سعيدةً أبدًا حين يتم تصنيفي تحت أي بند، وربما هذه الليبرالية بعينها. يخبرنا تشرتشل بأنه:
بعيدًا عن أن هذا مجرد رأي شخصي، فهل من الممكن أن يكون فقط هذا السبب؟

كنت قد اشتكيت بكثرة بأنني أعاني من شعوري بالتقدم بالسن، فكل تلك الأغاني التي أستمع لها قد مرّ عليها على الأقل خمسة عشر عامًا، وكل ذوقي في الملابس وأشياء أخرى كثيرة توقّف عند سن معيّن، ولكنّي لم أعد أجد مبررات منطقية لما أحمله من ذوق سوى أنني تحديدًا كنت مراهقة قبل عام 2010، فهل هذا ينطبق على أفكاري أيضًا؟ يأتي الكاتب العزيز ليؤكد لي هذا الكلام باستخدام بحوثه حول تفضيلات فرق البيسبول والآراء السياسية وأشياء أخرى تشكّل هوية الإنسان، حيث يفخر الفرد بأفكاره الخاصة ويستعرض مبرراته التي يراها أكثر منطقية من غيره، ونتيجة البحوث باختصار هي أننا نشكّل هوياتنا لسببٍ تافهٍ جدًا وهو تاريخ الميلاد!
علم النفس الضخم، هو مسمّىً أطلقه الكاتب على استخدام البيانات الضخمة للإجابة عن الأسئلة النفسية، يهتم باستخلاص مجموعات بيانات ضخمة للبالغين ويعمل على ربطها بأحداث مهمة في مرحلة الطفولة، فمثلًا أُجريت أبحاث (على يد عالم تحليل البيانات يائير غيتزا وعالم السياسة والإحصائي أندرو جيلمان) أثبتت أن وجهات النظر السياسية تتشكل في فترة حاسمة بين سن ١٤ إلى ٢٤، ثم تستمر معهم للأبد ولا يمكن تغيير آرائهم بعدها بسهولة.

هذا يفتح الباب واسعًا لاستكشاف المزيد من التفضيلات والآراء التي يشكلّها البشر، قد تكون حاسمة جدًا للكثير من النقاشات أو الجدالات الفارغة، حيث سيحسم الأمر عمر الشخص أو مكان تواجده أو حالة أسرته المادية أو أية ظروف أخرى.
لا أعرف صراحةً لماذا أقتني كتابًا يتهمني بالكذب جزافًا، ولكني حين اطلعت على محتواه وجدت أنني أكذب كثيرًا، ففي الوقت الذي أقوم فيه بكتابة منشور على فيس بوك لأشكر صديقة ما أو أصف جلسة حوارية بالرائعة والمثمرة، أذهب لجوجل لأسأله عن أسباب عدم تقبّلي لمعتقدات الآخرين، وربما أبحث عن كل المقالات المعادية لهم لأستزيد، ثم أرتدي وجهًا محايدًا على أقل تقدير _إن لم يكن مجاملًا_ لأتجنب الظهور بصورة أنني لا أتقبل كل الآراء.
في الواقع أن الكذب يتعدّى الفرق بين ما نحب أن نظهره للناس في مواقع التواصل مقابل ما نبحث عنه حقيقةً في جوجل أو حتى في المواقع الإباحية؛ يتعداه إلى شيء أكثر خطرًا وهو الكذب في الاستبيانات أو الأسئلة الإحصائية، وهنا نحن نتحدث عن دراسات ضخمة بُني عليها نتائج كانت ببساطة كاذبة لأنها استخدمت بيانات كاذبة، وقد تم كشف هذا الكذب باستخدام البيانات، فمثلًا تم إثبات أن أعداد الأشخاص الذين قالوا أنهم يتبرعون لجامعاتهم بعد التخرج منها يفوق كثيرًا الأعداد الحقيقية من بيانات الجامعات، في حين لا يمكن التحقق بسهولة من أمور أخرى كالتحيّز ضد فئة معينة، إلا أن هذا أصبح متاحًا الآن.

أعترف أنني لم أفاجأ من النتائج التي وصل إليها الكتاب، رغم أنها مقلقة جدًا حول وضع الكائنات البشرية، ولكني طالما طرحت فكرة أننا فعليًا نحتقر علنًا الأشياء التي نفعلها بعيدًا عن الأعين، أو الأشياء التي أصلًا لم يسبق أن رغبنا بفعلها، فها هو يخبرنا بأن الناس ما زالوا عنصريين تجاه بعضهم، وأن الكثير من الأهل نادمون على إنجاب الأطفال، وأنهم يميزون بين الذكر والأنثى، ففي حين يهتمون بذكاء الذكر وتطويره يكونون قلقين على جمال الأنثى ووزنها، وفي حين أنهم يدّعون الإخلاص في زواجهم والتقزز من الكثير من التصرفات الجنسية، إلا أنهم يبحثون بكثرة عن سفاح المحارم والمثلية الجنسية والاغتصاب.
جد من الضرورة الحديث حول أن كتاب الكل يكذب قد نجح في شموليته، فكل سؤال أو اعتراض خطر ببالي وجدت له إجابة، مثلًا ليس كل شخص يبحث عن أمر ما في جوجل هو راغب بفعله حقًا، وهذا قد يضعنا أمام تساؤل الاستفادة من البيانات الضخمة في المجال الجنائي والأخلاقي.

تم الاستفادة من بيانات جوجل لتحديد أعداد النساء اللاتي يقمن بالإجهاض الذاتي في المنزل خاصةً في المناطق التي لا توفر عمليات الإجهاض بطريقة شرعية في المستشفيات، كما تم التعرف على وجود أعداد كبيرة من الإساءات للأطفال في فترة الركود الاقتصادي رغم عدم وجود أعداد كبيرة من القضايا والتبليغات، وتم التعرف على احتمالية وجود هجوم على المسلمين في منطقة معينة بسبب البحث في كلمات عنصرية تجاههم أو سؤال عن كيفية قتلهم.
ربما أنا أتخذ موقفًا أقل حماسًا من الأمر، ففي حين استطاعت البحوث التنبؤ بالكثير من النتائج، إلا أن تعقّد حياة البشر ما زال في ازدياد، لكن يبقى هناك سرٌّ ما فيما يُعرف بـ (حكمة الحشد)، فالأعداد المهولة من البيانات هي ما قد تجعلنا نجانب الصواب، فقد تم التنبؤ باحتمالية انتشار الأنفلونزا في منطقة معينة، وتم التنبؤ بطراز السيارة التي قد تعجبك، أو البضائع التي ستلفت انتباهك، أو حتى الأفلام التي قد تثير اهتمامك على نيتفليكس.

النقطة المهمة في استخدام البيانات في المجال الاقتصادي، هي أن الحرب بين المستهلك والمنتج ما تزال عادلة، ففي حين نخشى من فكرة التنبؤ بتفضيلاتنا وإلقاء الإعلانات على رؤوسنا ودفعنا من حيث لا ندري للشراء، وأكثر من ذلك التنبؤ بأعلى سعر قد ندفعه لعرضه علينا _قد تخيلت أن العالم أصبح ماكينات لحلب البشر كمستهلكين لأشياء لا يحتاجونها_ إلا أن الشركات معرّضة أيضًا لتحكم المستهلك الذي يعطي تقييمات سلبية كما يشاء فيحجم غيره عن التعامل معها.
ربما سنتقدم كثيرًا في تحديد أماكن وأسباب انتشار مرض خطير، ربما سنحدد الأشخاص المحتمل أن يُقدِموا على جريمة معينة، وهذا كله سيجعل من علم البيانات الذي أصبح أداة فعّالة في يد العلوم الإنسانية ليجعلنا نخرج من حالة “الردح” الثقافي لتردي الأحوال الاجتماعية والأخلاق الفردية بعد غياب المرجعية، ولربما حينها نقترب من المرجعية الحقيقية التي سيتفق عليها كل البشر، ولكن الحياة تميل عادةً لإعادة خلق التوازن من جديد، فكلما يتم حل مشكلة معينة (في نظرنا أنها مشكلة ربما قد لا تكون كذلك)، تُخلق بالمقابل مشاكل وأمراض وأشياء لم نكن نتخيل أنها ستكون سببًا لها، ولكن يبقى الأمر أننا كبشر لن نستطيع الاستسلام للقدر، بل سنبقى جاهزين لكسر أقلام الآلهة وإعادة خلق حيواتنا من جديد.رغم أن العلوم الإنسانية ليست متصدّرة في قائمة اهتماماتي القرائية، إلا أنني أجد العناوين التي تبحث في طبيعة الإنسان جذّابة جدًا، أبحث عن أقرب إجابة مقنعة لسؤال “لماذا نحن هكذا؟”، لكن تبقى مشكلة العلوم الإنسانية (علم النفس وعلم الاجتماع) وحتى العلوم السياسية والاقتصاد؛ كلها من المستبعد أن نختصرها بقانون واحد بسيط خالد لكل زمان ومكان كما في العلوم الطبيعية، فليس ثمة قانون لاحتمالية أن يصبح الفرد عنصريًا بناءً على مكان سكنه ومستواه المادي مثلًا، ولا يمكننا التنبؤ بفشل ثورة في بلد ما، أي أننا ببساطة لا يمكن أن نتنبأ بمستقبل أي ظاهرة تتعلق بتفكير البشر وحياتهم إلا بالتخمينات أو بتعميم نتيجة عينة على المجتمع.