الإحصائيات .. أن نحسن التعامل معها


مقالة نشرت ٢٥ يوليو ٢٠١١


• أغلب من يموت، يموت في المستشفيات. من الأفضل تفادي المستشفيات.
• الأطفال ذووا الأقدام الأكبر، أكثر مهارة في الإملاء.
• أثبتت الإحصائيات أن النساء أفضل قيادة للسيارات من الرجال.
• الذين التحقوا برياض الأطفال، هم أكثر عنفاً من الذين بقوا في بيوتهم.
• 73% يقولون أن القذافي سيترك ليبيا.
• ساهر (نظام كاميرات لمراقبة الطرق) خفض الوفيات بنسبة 31%.
• انفلونزا الخنازير قد تقتل 120 مليون شخص.
• الأكثر جلوساً أقصر عمراً.
• عدم تنظيف الأسنان يؤدي إلى أمراض في القلب و آلام المفاصل.

أعرف أن لديك أمثلة أخرى أكثر طرافة وغرابة .ما قرأت أعلاه ليس من صنعي و ما لديك من أمثلة أخرى ليس من عندك. الإحصائيات تملأ الصحف و تغدي وسائل الإعلام والانترنت و الرسائل القصيرة و تشغل وسائل الاتصال الجديدة. إنها خطرة للغاية، بحكم سهولة تصديقها و بحكم تسخيرها لبرمجة الرأي العام و الدعاية وإشغال الناس. هي سهلة المتناول وصولاً وإقناعاً للناس، رغم أن الناس لا تعرف كيف تقرأها وتستوعبها وتفهمها؛ تناقض!
الناس تعتقد أن الإحصائيات أرقامٌ، والأرقام تتكلمُ. فكيف لنا أن نرد على الأرقام ونشكك فيها، والأرقام جاء بها باحثون!. الأرقام معنى من معاني الدقة والصرامة والرياضيات، وحين تكون كذلك، فمن المقنع تصديقها.
الحال أن الإحصائيات – وليس الإحصاء الذي سنتعرف إليه بعد قليل، الإحصائياتأرخص دليل أو برهان يمكن تجهيزه أو تلفيقه لمن يريد أن يستخدمه لمصلحة. هو أكثر وصولاً و إقناعاً و أكثر ما يكتفي به الجمهور مهما قلّ المقدار. و قد سارت مقولة تقول:
“يمكنك أن تثبت أي شئ بالإحصائيات
. يمكن أن للإحصائيات تروج لشئ أو تثني عن شئ، أن تقنع الناس وتجعلهم واثقين بقناعة أريد لهم أن يقتنعوا بها واثقين. هكذا أصبحت الإحصائيات وسيلة سهلة المنال للتزييف والكذب والترويج للمنتجات والبضائع والدعاية وبرمجة الرأي العام. لقد قام مرة السير ديليك:
“هناك ثلاثة أنواع من الكذب: الكذب و الكذب الملعون و الإحصائيات
.
ولكي لا أجمع كل شئ وأسبب نفورا ً من الإحصاء من حيث لا نشعر؛ لنعرف ما هو الإحصاء في البدء ونتعرف إلى المشكلة التي نحن بصددها ثم نحاول أن نعرف كيف نتعامل معها.

الإحصاء هو علم رياضي يدرس جمع و ترتيب و تحليل و تفسير و عرضالمعلومات. ببساطة، الإحصاء علم نقيس به كل شئ حولنا و نحاول أن نفهمه.
الإحصاء يقسم أحياناً إلى إحصاء وصفي، نستخدمه لنجمع معلومات تسهل علينا صياغة وصف لما حولنا، و إلى إحصاء استنتاجي نجمع من خلاله معلومات تساعدنا في تقصي الاستنتاجات و استخراج معارف جديدة وحقائق لم تكن حاضرة في البدء. الإحصاء، نستخدمه لدراسة الماضي وللتنبؤ بالمستقبل و لنعرف حقائق تساعدنا في اتخاذ القرارات.
وقد يخطر ببال القارئ سؤال عن علم الاحتمالات. وأقول لتقريب الفرق، أن الإحصاء هو استخراج نتائج في موضوع لم نحص كل أفراه ولكن بالاعتماد على بعض أفراده. أما الاحتمال فهو استخراج النتائج الممكنة في موضوع نعرف كل أفراده و نريد أن نعرف بعض الأفراد الذين ستكون في النتيجة. مثال الاحتمالات هو نرد اللعب. نعرف كل أفراده، و هي وجوه مكعب النرد التي تبدأ من 1 إلى 6. ولكن علم الاحتمال يهتم بأي وجه بعض سيكون النتيجة لو رمينا النرد عشوائياً. الإحصاء سيسعفنا في حالات لا نسطيع أو يصعب فيها علينا حساب كل الأفراد، ولذلك نكتفي بعينة بحجم ما يفي لاستخراج النتائج نستخدم فيها تقنيات رياضية لمراعاة المزيد من الدقة.
الاحصاء والاحتمالات
الإحصاء علم غاية في الأهمية، ولتأكيد أهميته أقول أنه يستخدم في سلسلة خطوات المنهج العلمي. المنهج العلمي هو الوسيلة الصارمة التي تنتج لنا أوثق المعارف وأرقاها. في المنهج العلمي، نستخدم الإحصاء لدراسة نتائج التجريب أو التنبؤ و قياس نجاح الفرضية لكي تتحول إلى نظرية. هكذا يتوفر البرهان والدليل لينقل الفرضية إلى مستوى النظرية العلمية وتنتقل إلى مستوى نقول أنها معرفة معتمدة.
في المنهج العلمي، نحاول أن نستخدم الإحصاء بأقل قدر ممكن من التدخل الذي يمكن أن يعدل أو يبدل في النتائج. ولكي نكون أكثر دقة، فإننا إذا صممنا تجربة إحصائية ونحن نطبق المنهج العلمي في عمل علمي، فإن التجربة يجب أن تكون قابلة لإعادة إجرائها بنفس الظروف في مكان مختلف و على أيدي علماء آخرين مع مجموعة مختلفة من العينات. وإذا فشلت التجربة و وقعنا على ما ينقض ما نؤسس له، ذهبت الفرضية وكان علينا العمل على تأسيس فرضية جديدة.
هناك مشكلة في الإحصائيات تأتي من التدخل أو تصميم و إجراء تجربة على موضوعات تتأثر بالملاحظة. ولكي لا نُعقِّد الموضوع بحكاية فيزياء الكم، سيكون مثالنا اجراء التجارب في المجالات الإنسانية والاجتماعية. إنه لمن الواضح الفرق بين أجراء تجربة احصائية على بشر لمعرفة كيف يتصرفون مثلاً وبين أجراء تجربة على فرضية في حركة الأجسام. التجربة على الإنسان أكثر تعقيداً حيث سيكون من الصعب الابتعاد عن التأثير على النتائج من قبل من يجري التجربة أو بشعور من تجرى عليه التجربة أو وضعه في ظروف غير اعتيادية أو في فهم تصوره وصدقه في الإجابة أو رد الفعل.
الإحصاء تكمن أهميته في أنه يهتم باللايقينيات. لنقل أن لدينا شيئا من اللايقين بخصوص إن كانت ستمطر و كمية المطر. لن يهم علم الإحصاء شرحُ ومعرفةُ كيفية المطر بقدر ما يهمه في أن يعرف إن كانت ستمطر أم لا و ما كمية المطر. هكذا يكتب دينيس ليندلي في وصف الفلسفة من الإحصاء.
الإحصاء إذن ليس مزحة. الإحصاء يجب أن نعرف ماذا نحسب و كيف نحسب. و إذا فعلنا ذلك بكل دقة وصرامة و افترضنا أننا تجاوزنا الإجراء، كان أمامنا معضلة جديدة هي معضلة الحكم على النتائج التي استخرجناها؛ معضلة تفسيرها وعرضها.
هذا هو الإحصاء، أما الإحصائيات فهي نتاج هذا الإحصاء و مشكلتها أنها يمكن أن تكون تقارير و حقائق مزيفة أو خاطئة ونتصورها مبنية على أسس صارمة مادامت استندت على الإحصاء.
هل تذكرون هذا التسجيل الذي يعلمنا حقائق جديدة عن أرقام ظننا معرفتها جمعاً وضرباً وطرحاً؟ لنشاهد هذا ثم نواصل:
المشكلة تكمن في الاستخدام و المغالطة إذن.
ما يحدث هنا في هذا التسجيل يمكن أن يحدث في الإحصائيات بشكل مقارب. هذا غير سوء الفهم من قبل من لا يعرف الإحصاء أو بسبب سوء تفسير النتائج أو عرضها.
ولكي نحسن التعامل مع الإحصائيات في حياتنا اليومية، علينا نعرف أن الإحصائياتهي جواب. نتائج معلومات جمعت ورتبت وحللت وفسرت وعرضت. لكي نحسن التعامل مع الإحصائيات علينا أن نطلب دوما معرفةالسؤال الذي كانت الإحصائياتجواباً عليه. فمثلاً، قد نسمع عن مجموعة من الإحصائيات التي تقارن رواتب الرجال برواتب النساء ونرى تناقضاً بين هذه الإحصائيات. وبافتراض أن هذه الإحصائياتوصلت إلينا صحيحة، يجب أن نسأل، ماذا كان السؤال في هذه الإحصائيات، هل تقارن رواتب الرجال الذين يعملون في دوام عمل كامل مع نساء في دوام عمل كامل؟ هل المقارنة بين دوام عمل كامل و دوام مجتزأ؟ هل هي مقارنة بين مجموعات في نفس المجتمع؟ يجب على الإحصائية أن تقول لنا بدقة ما هو السؤال لما هو جواب. قلما سنجد تلك الدقة في وسائل الإعلام.
سيكون من الحكمة النظر في حجم العينة التي أجريت عليها الإحصائية. الإحصائيات التي تجرى على مجموعات لمعرفة موقف سياسي، قد يكفي أن يكون حجمها مثلا 1000 فرد. أما بالنسبة للعينات التي سندرس عليها إحصائية نجاعة دواء جديد، فستكون بالآلاف لكي نضمن دراسة شريحة متنوعة تختلف في الظروف والجغرافية و طبيعتها المرضية والصحية و الوراثية. حجم العينة أمر يعتمد على طبيعة السؤال والموضوع وسيكون من المضحك عمل تقرير عن إحصائية في أمر غاية في الأهمية كنجاعة جواء ويكون حجم العينة 5 أفراد لتكون النسبة 87.3% لمن كان للدواء عليهم تأثيرا إجيابيا! هذا ما لن نتوقع حدوثه مع الأدوية؛ ولكن كثيراً ما يحدث في إحصائيات أخرى يقوم بها صحفيون و مروّجون قد لا يحتاجون فيها لإجراء تجربة على الإطلاق.
نعرف أن سؤالاً ما نطرحه لكي نجري تجربة مصممة لإحصائية، سيجعلنا نقرر عن حجم العينة. هل نستطيع أن نصل لكل فرد من أفراد الموضوع؟ قد يستحيل ذلك أو يصعب أو قد تكون يجعل أمر إجراء التجربة واستخراج النتائج غير دقيق. لنأخذ مثالاً، كيف نستيطع أن نعرف متى يصحو الناس في لندن؟ هل سيكون من المناسب أن نمرر استبياناً إلى كل راكبي المترو ونسألهم أو نحصيهم بسبب وجودهم هناك؟ ماذا عن من لم يكن في المترو أو لا يستخدمه و يستخدم وسائل أخرى؟ هنا نطلب من صاحب الإحصائية أن يشرح لنا ما هو السؤال وكيف دبر التجربة لكي يصل للجواب لمعرفة الدقة في عمله من أجل استخراج النتائج. هل هناك حل آخر غير لمعرفة متى يصحو أهل لندن غير طريق المترو؟
من أشهر الإحصائيات التي سمعنا بها هي معدل الوفاة لمن أصيب بانفلونزا الخنازير في وقت كانت موجة الفيروس ذروة الإعلام. الذين راجعوا الموضوع وتابعوه عن كثب، اتضح لهم أن الإحصائية نتائجها مبالغ فيها. كان يجب أن يكون في سؤال تلك الإحصائية استبعاد لمن لديه أمراض مزمنة أو خطرة. كان يجب الأخذ بعين الإعتبار معرفة معدل الوفاة في المناطق التي أجريت فيها الإحصائية و مقارنته بمعدل الوفاة مع انتشار هذا الفيروس.
يجب أن نفهم طبيعة السؤال وهل فيه شي من التدخل و التأثير على النتائج. كيف سندرس طبيعة مجموعة من الطيور وردود أفعالها، هل خطة التجربة والسؤال الذي نعمل عليه يؤثر في الطيور ويخرجها عن طبيعتها أو يجعلنا نركز على أمر ونهمل أمراً آخر يؤثر في العملية؟ مثل ذلك مثل إجراء احصائيات على طلاب وموظفين يعلمون أننا نجري عليهم الإحصائية. ولكي نتفادى التدخل، هناك وسائل وتقنيات منها التعمية المزدوجة وعمل تجارب محكمة لكي نقلل قدر الإمكان من إفساد أو تجيير النتائج.
عندما نجري تجربة للجواب على سؤال، علينا أن نستخدم أدق الوسائل والمعارف حال الإجراء. لدراسة الطقس مثلا والتنبؤ به، يجب أن نستخدم الوسائل العلمية الدقيقة في الحسابات والأجهزة ونعتمد على ما قام عليه أحدث دليل علمي. هكذا نُحسِّن النتائج ونجعها أكثر حيادية وأكثر دقة.
هناك سقطات شائعة تقع فيها الإحصائيات و قراء الإحصائيات. لنفترض أننا تجاوزنا الخطأ في مراحل الجمع والترتيب والتحليل. هناك هفوات تقع في مرحلة تفسير النتائج و عرضها والوصول إلى الحقائق. إن التفسير والعرض قد يفسد كل ما جهدنا من أجله في المراحل الأولى و قد يوقعنا في خطأ كبير في النهاية كإحصائيين أو من يسهلك نتاجهم.
من الأخطاء الشائعة سوء معرفة المصطلحات. قد نرى كلمة “strong>معدل” في إحصائية ما. لكن كلمة “معدل” تأتي في معان مختلفة. من أنواع المعدل في الإحصائيات، المتوسط والوسط والوسيط. وتسهيلاً، فإنالمتوسط ببساطة هو قسمة مجموع الأفراد على عددهم. أما الوسط فهو النقطة الوسطى في توزيع النتائج. أما الوسيط فهو النقطة الأكثر تكراراً في النتائج. و حسب نوعية السؤال والموضوع الذي ندرسه، يكون أحد انواع المعدل هذه مناسباً لوصف ما وجدناه في الواقع. لنأخذ مثالاً على ذلك معدل رواتب مجموعة من الموظفين. إذا جمعنا رواتبهم وقسمناها على عددهم فهذا إحصاء خاطئ. ماذا لو كان راتب أحدهم أو مجموعة قليلة منهم أضعافاً مضاعفة من الباقي أو كان العكس. إن ذلك سيخرج لنا المعدل وكان المفترض أن نحص على الوسيط وهي الراتب الأكثر تكراراً أو مقاربة للمدى الذي تتكرر فيه غالبية الرواتب.
كثيرا ما يحاول الإعلام عمل دراما من نتائج الإحصائيات. لنقل أن إحصائية أفادت بأن عدد المصابين بفيروس ما، قد يصل إلى خمسة ملايين نسمة. سيكون من الخطأ أن ينشر بين الناس أن عدد المصابين قد تجاوز الخمسة ملايين. “قد يصل” يعني أن القيمة القصوى هي تلك أما تجاوز فيعني أن “القيمة الدنيا” هي تلك والقصوى لا نعرفها. إن خبراً كهذا أكثر درامية ورعباً ورواجاً من الآخر. حال ذلك حال وصف ارتفاع في درجة الحرارة بنسبة ستكون بمقدار 11 درجة مؤية وهو ارتفاع لو كان مفاجأ لكان كارثة؛ لكنه لو كان بالتدريج خلال موسم الصيف مثلاً، سيكون عادياً.
الأرقام تحمل معانٍ والمعاني تكتسب من السياق. و نحن لسنا معتادين على استخدام الأرقام من المليارات والترليونات حياتنا اليومية. إن الملايين والمليارات كمصروفات لشخص ما تختلف عنها لو ربطناها بمصروفات دولة، ويزداد الأمر وضوحاً بمعرفة الفترة الزمنية وموضوع المصروفات. و ارتفاع درجة الحرارة في مدينة ما درجة مئوية واحدة يختلف عن ارتفاعها عموما في كل كوكب الأرض وهي في حالة الأرض ستكون سبب خلل في النظام الإيكولوجي.
الطريقة التي تعمل بها الإحصائيات مختلفة عن طريقة بناء المعارف التي تعتمد على المنهج العلمي. العملية الإحصائية هي جزئية من خطوات المنهج العلمي. أما أن تستقل بذاتها فستؤدي حتماً إلى تزعزع الثقة بالنتائج. كثيراً ما تجرى الإحصائياتلدراسة متغيرين اثنين أو عنصرين لنعرف كيف يترابطا معا. دراسة الترابط هذا يعطي انطباعاً لدى الناس أنهما مثل سبب ومسبب. مثل أن التدخين سبب لسرطان الرئة وأن الجلوس كثيراً سبب من أسباب الموت سريعاً. هناك بديهة عن الإحصائيين أن دراسة الترابط ليس بالضرورة معنى للسببية بين المترابطين. ربما كان هنا سبب خفي لم نُعنى بدراسته يقع في خلفية ما ندرس أو لا يقع يعطينا أنطباعا بترابطهما سببياً. وإذا ظهر في الإحصائيات أن هناك رقماً أو نسبة تحمل في طياتها “أهمية إحصائية” لنجاعة دواء ما في تجربة، فذلك قد لا يعني أن له “أهمية واقعية“. هكذا يضع الإحصائيون مجموعة من التقنيات لتزكية الإحصيائيات و وزنها بمقادير مثل مقدار الثقة ومقدار الشك. وهي نسب توضع لوضع احتياط للخطأ في الحساب والعد والإحصاء واستخلاص النتائج. هكذا عندما تجرد أصوات الإنتخابات، توضع نسبة الخطأ بمقدار 6% مثلاً ويكون مقدار الثقة 94%.
وهناك معايير نقيس بها عدم الامكانية والاحتمالية تساعد في تحديد إن كان ما ظهر فيالإحصائيات خاضع للصدفة أم هو أمر متعلق بما نلاحظه في التجربة. هذه المعايير ومعايير أخرى تساعد في التأكد من كون هذا الدواء الذي ندرس فاعلٌ أم هو مجرد بلاسيبو أو هل هناك فعلا فرق في معدلات الوفاة بين الرجال والنساء في محيط ما.
كثيراً ما نسقط في التعميم بسبب التسرع أو عدم الدقة. كثيراً ما تروج الشائعات ضد شركة سيارات لخلل ظهر في اليوم الفائت وحسب؛ أو يروج لنظام مراقبة الطرق بالكاميرات بأن معدل الحوادث قد انخفض بنسبة كبيرة لمجرد تشغيله هناك. هل قلّت الحوادث صدفة في الفترة التي تمت المراقبة فيها، هل المراقب والدارس ظاهر لمن استخدم الشارع، كيف كان الطرق، هل هو موسم سفر عن البلدة، هل كان الشارع تحت الإصلاح، هل الكاميرات ظاهرة، هل هناك شئ آخر؟
النسب و المخاطر عالم رحب للتزييف والاستغلال. لو أخذنا مثلا نسبة التغير عند الإحصائيين نجدهم يقسمونها إلى نسبة تغير نسبي ونسبة تغير مطلق. وحتى لا يفلت مني القارئ، أضع هنا مثالاً مبسطاً. قد تجدون صحيفة تنشر خبراً مرعباً كهذا: “20% هي نسبة زيادة خطر الإصابة بالقولون لمن يأكل اللحوم الحمراء”. وحين نقترب من الإحصائية الأصلية، نجد أن نسبة الإصابة بالقولون دون ربطه باللحوم الحمراء عند الناس هي 5% فقط. أما الزيادة في الإصابة لمن أكل اللحوم الحمراء حسب الدراسة فهو 20% في هذه المجموعة. هل لاحظتم الفرق؟ إنها 20% من 5% أي 1% بما يؤدي إلى نسبة زيادة بمقدار 5%+1% وهي 6% وهذه النسبة ليست مرعبة ولن تكون خبراً ذي أهمية حينها.
قد تقوم الصحف بـقلب بعض النسب لجعلها أكثر درامية و جذباً. وجدت دراسة أن نسبة النقصان في ارتفاع ضغط الدم لسبب جيني هو 1 في كل 10 من الناس؛ هكذا فإذا بالصحيفة تنشر الإحصائية مقلوبة لتكون خبراً: 9 من كل 10 لديهم زيادة في ارتفاع ضغط الدم لسبب جيني. هنا لابد أن ننتبه للنسبي والمطلق للمجموع وحجم العينة وننتبة للسؤال الذي عليه هذا الجواب.
قد نقوم بإحصائية لمعرفة جرائم الاعتداء بالأسلحة ونضعها في تصنيفات. ثم ندرس الأمر من جديد لمعرفة نسبة التغير. إذا وجدنا أن معدل الاعتداء بالسكين قد انخفض فلا يعني ذلك أن معدل الإعتداء بالأسلحة قد انخفض كلياً. علينا أن ندرس النسبة، نسبة ماذا في ماذا؟ ماذا حدث في الكل، هل هناك نوع من السلاح توفر وأخذ المعتدون بتبنيه وتركوا السكاكين مثلا؟ يجب أن توضع النسب في سياقها ويجب أن نعرف الأفراد وحجم العينة ونسأل كل الأسئلة التي عرفنا أعلاه.
الإحصائيات نتيجة للإحصاء، والإحصاء علم رياضي، لكن هذا لا ينزهُ الإحصائيات و لا يجعلها نأخذها أخذ التسليم. الإحصاء يمكن اساءة استخدامه كما يمكن اساءة استخدام الرياضيات والمعارف الأخرى لصنع الزيف خارج المنهج العلمي والمجتمع العلمي. الإحصاء علم علينا أن نحسن استخدامه لننجز به إحصائيات صحيحة نستخرج بها نتائج عن أمور كانت لا يقينية. وعلينا أن نحسن القراءة وتناول ما يصلنا من إحصائيات قد نتخذ بناء عليها قرارات في حياتنا قد تكون في مستويات مختلفة من الخطورة وقد تصنع لنا تصورات خاطئة عن الحياة وعن ما حولنا. حتى الإحصائيات الصحيحة قد تخذلها قلة الموضوعية أو قلة الخبرة وقد تتآلب عليها وسائل الإعلام وتصنع منها ما تشاء. نحتاج أن نسأل من نفّد الإحصائية ومن دفع تكاليفها ومن اشتراها ونعرف أين نبحث عنالإحصائيات لنقرأها ونستوعبها. ولكي نستوعبها يجب أن نتثقف قليلا ونتعلم قليلا في الإحصاء من الموسوعات العامة على أقل تقدير، ما دمنا تحت رحمة هذه الأرقام والتقارير والنشرات والأخبار الإحصائية. العلوم والمعارف الإنسانية المعتمدة لا تبنى بالإنشاء وصياغة الكلام ولا تصنع بزيف الأرقام والنسب وحكاية القصص. إن ما يصنع ذلك هو الشك الصارم والمنهج العلمي، و لا بد أن ندرب أدمغتنا على تذوق هذا المنهج؛ أن نعودها على التفكير العلمي والشك والتفكير النقدي.
::. فاضل التركي
::. ملاحظة: بعض الأمثلة التي استخدمتها من المصدر الأول أجريت عليها بعض التعديلات تسهيلاً وتوصيلاً للفكرة.
مصادر واستزادة :

تعليقات

المشاركات الشائعة