اعدادوشمار بتاتے ہیں کہ 1990 کی دہائی میں دنیا بھر میں غیرقانونی منشیات کے استعمال میں اضافہ ہوا اور اسی عرصے میں مذہبی اجتماعات میں شرکاء...
اعدادوشمار بتاتے ہیں کہ 1990 کی دہائی میں دنیا بھر میں غیرقانونی منشیات کے استعمال میں اضافہ ہوا اور اسی عرصے میں مذہبی اجتماعات میں شرکاء کی تعداد میں اضافہ ہوا۔ اس سے نتیجہ کیا نکلتا ہے؟ اس سے اگر کوئی یہ نتیجہ نکالے کہ مذہبی اجتماع میں شرکت منشیات استعمال کرنے پر مائل کر دیتی ہے تو کیا یہ درست ہے؟ نہیں، اور یہ ایک عام مغالطہ ہے۔ تعلق کی ممکنہ وضاحت چار طریقے سے ہو سکتی ہیں۔
مذہبی محفل میں شرکت منشیات کے استعمال کی طرف مائل ہونے کا باعث بنتی ہے۔ منشیات کے استعمال کے رجحان میں اضافے کی وجہ مذہبی اجتماع میں شرکاء کی تعداد کا اضافہ ہے۔
منشیات کا استعمال کرنے والا پچھتاتا ہے اور اس سے بچنے اور چھوڑنے کے لئے مذہب کی طرف رجوع کرتا ہے۔ مذہبی اجتماعات میں اضافے کی وجہ منشیات میں اضافہ ہے۔
کوئی تیسرا فیکٹر ان دونوں کی وجہ ہے۔ مثال کے طور پر، زندگی میں سٹریس میں اضافہ ہوا ہے۔ اس وجہ سے کچھ لوگ مذہب کی طرف رجوع کرتے ہیں اور کچھ لوگ منشیات میں فرار ڈھونڈتے ہیں۔ تیسرا فیکٹر ان دونوں میں اضافے کا باعث ہے۔
یہ کوریلیشن اتفاقی ہے۔ دونوں آزاد ویری ایبل ہیں۔ یہ صرف اتفاق ہے کہ اس پیرئیڈ میں دونوں میں اضافہ دیکھنے میں آیا ہے۔
یعنی الف کی وجہ ب ہو سکتا ہے۔ ب کی وجہ الف ہو سکتا ہے۔ دونوں کی وجہ ج ہو سکتا ہے یا پھر کوئی وجہ نہیں ہو سکتی۔ ہمیں ابھی اضافی انفارمیشن ڈھونڈنی ہیں اور پھر تجزیے سے کسی نتیجے کی طرف بڑھا جا سکتا ہے۔
(یہ مغالطہ اعدادوشمار کی مدد سے میڈیا پر اقتصادیات، سیاست، بزنس، سماجیات پر بحث کرنے والے معزز ماہرین کا سب سے پسندیدہ ہے۔ فلاں چیز کیوں بہتر یا خراب ہو گئی؟ اپنے پسند کے نتیجے پر چھلانگ لگا لیں۔ اور یہ والے سچ بہت پسند کئے جاتے ہیں)۔
اس مغالطے کی شرح ڈیٹا مائننگ نے بہت بڑھا دی ہے کیونکہ ڈیٹا ہر طرح کے پیٹرن دکھا دیتا ہے۔ اس پر ایک دلچسپ ویب سائٹ ٹائلر وگن نے بنائی ہے، (لنک آخر میں) جس میں کئی طرح کے اتفاقی پیٹرن دیکھے جا سکتے ہیں۔ آپ دیکھ سکتے ہیں کہ امریکہ کی ٹیکنالوجی پر خرچ کرنے کا بہت ہی اچھا تعلق اس سے ہے کہ اس سال کتنے لوگ دم گھٹنے سے مرے۔ یا پھر اداکار نکولس کیج کی فلمیں جس سال زیادہ بنتی ہیں، اس سال سوئمنگ پول میں ڈوب جانے والوں کی تعداد زیادہ ہوتی ہے یا آرگینک فوڈ کی فروخت کا ریلیشن آٹزم کے کیسز سے ہے۔
۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔
اس مغالطے کو برعکس بھی استعمال کیا جاتا ہے۔ اگر دو مظاہر کے درمیان کوئی ربط ہے تو اس کا مطلب وجہ ہونا لازم نہیں لیکن ممکن ہو سکتا ہے اور صرف “تعلق کا مطلب وجہ نہیں” کہہ کر اسے ایک طرف نہیں پھینکا جا سکتا۔ اس کا مطلب یہ ہے کہ اگر تعلق plausible (قرینِ قیاس) ہے اس تعلق کو مزید باریک بینی سے دیکھنے کی ضرورت ہے۔
میڈیکل سائنس میں کلینیکل ٹرائلز کی وجہ اسی ربط کو سامنے لانا ہے۔
کاز تک پہنچنے کے کئی طریقے ہیں۔ جب یہ مشاہدہ ہوا کہ سگریٹ نوشی کا تعلق پھیپھڑے کے سرطان سے ہے تو تمباکو کی صنعت نے یہی دفاع استعمال کیا تھا کہ “تعلق کا مطلب وجہ نہیں”۔ ان کا موقف تھا کہ اس کی وجہ ماحولیاتی فیکٹر ہیں جیسا کہ بڑھتی ہوئی آلودگی۔ لیکن اگر ایسا ہوتا تو سرطان کے کیس بالعموم آبادی میں بڑھتے۔ سگریٹ نوش افراد میں اس اضافے کا مطلب یہ تھا کہ آلودگی اس کی وضاحت نہیں کرتی تھی۔
اگلا دفاع تھا کہ کوئی اور تیسرا فیکٹر ایکس ہے جو جس میں ہو، وہ پھیپھڑوں کے کینسر کا شکار بھی ہوتا ہے اور سگریٹ نوشی کی طرف مائل بھی ہوتا ہے۔ اب اس کا کیسے معلوم کیا جائے؟ “سگریٹ نوشی کینسر کا باعث” ہے کا مفروضہ یہ پیشگوئی کرے گا کہ سگریٹ چھوڑ دینے والے کے لئے کینسر کا رِسک کم ہو جانا چاہیے۔ بغیر فلٹر والے سگریٹ میں امکان فلٹر والے سگریٹ سے زیادہ ہونا چاہیے۔ طویل مدت اور کثرت سے سگریٹ نوشی کرنے والے میں امکان کبھی کبھار کی سگریٹ نوشی سے زیادہ ہونا چاہیے۔ اس طرح کے ڈیٹا کے تجزیے نے ہمیں صاف صاف بتا دیا کہ “سگریٹ نوشی کینسر کا باعث ہے”۔
۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔
ڈیٹا کے درمیان ربط کا معلوم کرنا اور اس کی وجہ ڈھونڈنا ۔۔ سائنسی طریقے کا ایک بڑا ہی اہم حصہ ہے۔ اس کے اپنے طریقے اور پروٹوکول ہیں۔ نہ ہی یہ آسان ہے اور نہ ہی یہ غلطی سے خالی۔ لیکن جب اس کو طریقے سے جانچا جائے تو پھر کسی بھی تُک بازی کے مقابلے میں بہتر نتائج دیتے ہیں۔
تحریر: وہارا امباکر
(جاری ہے)
اتفاقی کورریلیشن دیکھنے کے لئے
https://www.tylervigen.com/spurious-correlations
تعلق اور وجہ
اعدادوشمار بتاتے ہیں کہ 1990 کی دہائی میں دنیا بھر میں غیرقانونی منشیات کے استعمال میں اضافہ ہوا اور اسی عرصے میں مذہبی اجتماعات میں شرکاء کی تعداد میں اضافہ ہوا۔ اس سے نتیجہ کیا نکلتا ہے؟ اس سے اگر کوئی یہ نتیجہ نکالے کہ مذہبی اجتماع میں شرکت منشیات استعمال کرنے پر مائل کر دیتی ہے تو کیا یہ درست ہے؟ نہیں، اور یہ ایک عام مغالطہ ہے۔ تعلق کی ممکنہ وضاحت چار طریقے سے ہو سکتی ہیں۔
مذہبی محفل میں شرکت منشیات کے استعمال کی طرف مائل ہونے کا باعث بنتی ہے۔ منشیات کے استعمال کے رجحان میں اضافے کی وجہ مذہبی اجتماع میں شرکاء کی تعداد کا اضافہ ہے۔
منشیات کا استعمال کرنے والا پچھتاتا ہے اور اس سے بچنے اور چھوڑنے کے لئے مذہب کی طرف رجوع کرتا ہے۔ مذہبی اجتماعات میں اضافے کی وجہ منشیات میں اضافہ ہے۔
کوئی تیسرا فیکٹر ان دونوں کی وجہ ہے۔ مثال کے طور پر، زندگی میں سٹریس میں اضافہ ہوا ہے۔ اس وجہ سے کچھ لوگ مذہب کی طرف رجوع کرتے ہیں اور کچھ لوگ منشیات میں فرار ڈھونڈتے ہیں۔ تیسرا فیکٹر ان دونوں میں اضافے کا باعث ہے۔
یہ کوریلیشن اتفاقی ہے۔ دونوں آزاد ویری ایبل ہیں۔ یہ صرف اتفاق ہے کہ اس پیرئیڈ میں دونوں میں اضافہ دیکھنے میں آیا ہے۔
یعنی الف کی وجہ ب ہو سکتا ہے۔ ب کی وجہ الف ہو سکتا ہے۔ دونوں کی وجہ ج ہو سکتا ہے یا پھر کوئی وجہ نہیں ہو سکتی۔ ہمیں ابھی اضافی انفارمیشن ڈھونڈنی ہیں اور پھر تجزیے سے کسی نتیجے کی طرف بڑھا جا سکتا ہے۔
(یہ مغالطہ اعدادوشمار کی مدد سے میڈیا پر اقتصادیات، سیاست، بزنس، سماجیات پر بحث کرنے والے معزز ماہرین کا سب سے پسندیدہ ہے۔ فلاں چیز کیوں بہتر یا خراب ہو گئی؟ اپنے پسند کے نتیجے پر چھلانگ لگا لیں۔ اور یہ والے سچ بہت پسند کئے جاتے ہیں)۔
اس مغالطے کی شرح ڈیٹا مائننگ نے بہت بڑھا دی ہے کیونکہ ڈیٹا ہر طرح کے پیٹرن دکھا دیتا ہے۔ اس پر ایک دلچسپ ویب سائٹ ٹائلر وگن نے بنائی ہے، (لنک آخر میں) جس میں کئی طرح کے اتفاقی پیٹرن دیکھے جا سکتے ہیں۔ آپ دیکھ سکتے ہیں کہ امریکہ کی ٹیکنالوجی پر خرچ کرنے کا بہت ہی اچھا تعلق اس سے ہے کہ اس سال کتنے لوگ دم گھٹنے سے مرے۔ یا پھر اداکار نکولس کیج کی فلمیں جس سال زیادہ بنتی ہیں، اس سال سوئمنگ پول میں ڈوب جانے والوں کی تعداد زیادہ ہوتی ہے یا آرگینک فوڈ کی فروخت کا ریلیشن آٹزم کے کیسز سے ہے۔
۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔
اس مغالطے کو برعکس بھی استعمال کیا جاتا ہے۔ اگر دو مظاہر کے درمیان کوئی ربط ہے تو اس کا مطلب وجہ ہونا لازم نہیں لیکن ممکن ہو سکتا ہے اور صرف “تعلق کا مطلب وجہ نہیں” کہہ کر اسے ایک طرف نہیں پھینکا جا سکتا۔ اس کا مطلب یہ ہے کہ اگر تعلق plausible (قرینِ قیاس) ہے اس تعلق کو مزید باریک بینی سے دیکھنے کی ضرورت ہے۔
میڈیکل سائنس میں کلینیکل ٹرائلز کی وجہ اسی ربط کو سامنے لانا ہے۔
کاز تک پہنچنے کے کئی طریقے ہیں۔ جب یہ مشاہدہ ہوا کہ سگریٹ نوشی کا تعلق پھیپھڑے کے سرطان سے ہے تو تمباکو کی صنعت نے یہی دفاع استعمال کیا تھا کہ “تعلق کا مطلب وجہ نہیں”۔ ان کا موقف تھا کہ اس کی وجہ ماحولیاتی فیکٹر ہیں جیسا کہ بڑھتی ہوئی آلودگی۔ لیکن اگر ایسا ہوتا تو سرطان کے کیس بالعموم آبادی میں بڑھتے۔ سگریٹ نوش افراد میں اس اضافے کا مطلب یہ تھا کہ آلودگی اس کی وضاحت نہیں کرتی تھی۔
اگلا دفاع تھا کہ کوئی اور تیسرا فیکٹر ایکس ہے جو جس میں ہو، وہ پھیپھڑوں کے کینسر کا شکار بھی ہوتا ہے اور سگریٹ نوشی کی طرف مائل بھی ہوتا ہے۔ اب اس کا کیسے معلوم کیا جائے؟ “سگریٹ نوشی کینسر کا باعث” ہے کا مفروضہ یہ پیشگوئی کرے گا کہ سگریٹ چھوڑ دینے والے کے لئے کینسر کا رِسک کم ہو جانا چاہیے۔ بغیر فلٹر والے سگریٹ میں امکان فلٹر والے سگریٹ سے زیادہ ہونا چاہیے۔ طویل مدت اور کثرت سے سگریٹ نوشی کرنے والے میں امکان کبھی کبھار کی سگریٹ نوشی سے زیادہ ہونا چاہیے۔ اس طرح کے ڈیٹا کے تجزیے نے ہمیں صاف صاف بتا دیا کہ “سگریٹ نوشی کینسر کا باعث ہے”۔
۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔۔
ڈیٹا کے درمیان ربط کا معلوم کرنا اور اس کی وجہ ڈھونڈنا ۔۔ سائنسی طریقے کا ایک بڑا ہی اہم حصہ ہے۔ اس کے اپنے طریقے اور پروٹوکول ہیں۔ نہ ہی یہ آسان ہے اور نہ ہی یہ غلطی سے خالی۔ لیکن جب اس کو طریقے سے جانچا جائے تو پھر کسی بھی تُک بازی کے مقابلے میں بہتر نتائج دیتے ہیں۔
تحریر: وہارا امباکر
(جاری ہے)
اتفاقی کورریلیشن دیکھنے کے لئے
https://www.tylervigen.com/spurious-correlations