Bilim tarihinin en sık yapılan hatalarından biri, iki olayın birlikte değişmesini aralarında bir neden-sonuç ilişkisi olduğu biçiminde yorumlamaktır. “Dondurma satışları arttığında boğulma vakaları da artıyor” gözlemi buna klasik bir örnektir. İlk bakışta tuhaf bir bağlantı gibi görünen bu ilişkinin arka planında aslında gizli bir üçüncü değişken yatmaktadır: yaz mevsimi. Sıcak havalar hem dondurma tüketimini hem de denize, göle girme sıklığını artırır; dolayısıyla iki değişken arasındaki istatistiksel uyum gerçek bir nedensellikten değil, ortak bir kaynaktan beslenmektedir. İşte tam da bu noktada korelasyon ile nedensellik arasındaki fark, yalnızca akademik bir ayrıntı olmaktan çıkıp gündelik hayat kararlarını, bilim politikalarını ve toplumsal yargıları doğrudan etkileyen kritik bir mesele hâline gelir.
Korelasyon Nedir?
Korelasyon, iki değişkenin birlikte, belirli bir düzen içinde değişme eğilimidir. Bu değişim aynı yönde gerçekleşiyorsa —biri artarken diğeri de artıyorsa— pozitif korelasyondan söz edilir. Ters yönde gerçekleşiyorsa, yani biri artarken diğeri azalıyorsa, buna negatif korelasyon denir. İstatistikte bu ilişki genellikle -1 ile +1 arasında değişen Pearson korelasyon katsayısı (r) ile ölçülür. Değerin 1’e ya da -1’e yakın olması güçlü bir doğrusal ilişkiye, 0’a yakın olması ise ilişkinin zayıf ya da hiç olmadığına işaret eder.
Ancak korelasyon, doğası gereği yalnızca bir gözlemdir. İki değişkenin birlikte hareket ettiğini söyler; ama neden birlikte hareket ettikleri konusunda hiçbir şey ifade etmez. Bu matematiksel tarafsızlık hem gücünü hem de sınırlılığını oluşturur.
Nedensellik Nedir?
Nedensellik ise çok daha güçlü bir iddiayı barındırır: A değişkenindeki değişimin, B değişkenindeki değişimi doğrudan ürettiğini öne sürer. Felsefede ve bilimde nedenselliği kanıtlamak için üç temel koşul aranır: birliktelik (iki olayın birlikte gerçekleşmesi), zamansal sıralama (nedenin sonuçtan önce gelmesi) ve alternatif açıklamaların dışlanması (başka değişkenlerin etkisinin bertaraf edilmesi). Bu üç koşulun bir arada sağlanması, özellikle karmaşık sosyal ve biyolojik sistemlerde son derece güçtür.
Nedensellik ilişkisi kurabilmenin en güvenilir yolu rastgele kontrollü deneyler (RKD)dir. Katılımcıların rastgele iki gruba ayrıldığı bu deneylerde, bir gruba müdahale uygulanırken diğerine uygulanmaz ve fark ölçülür. Tıp araştırmalarında altın standart olarak kabul edilen bu yöntem, gözlemsel verilerin taşıdığı karıştırıcı etkileri büyük ölçüde ortadan kaldırır.
Yanıltıcı Korelasyonların Anatomisi
Korelasyonun neden bu kadar sık yanlış yorumlandığını anlamak için başlıca yanıltıcı mekanizmaları tanımak gerekir.
Gizli (Karıştırıcı) Değişkenler: Yukarıda verilen dondurma örneği bu kategoriye girer. Sosyoekonomik düzey, eğitim, coğrafi konum gibi değişkenler pek çok araştırmada gizli bir üçüncü faktör olarak devreye girer ve sahte ilişkilere zemin hazırlar. Örneğin ayakkabı numarası büyük olan çocukların matematik testi puanlarının daha yüksek olduğu bulunabilir; oysa bu ilişkinin arkasındaki gerçek değişken yaştır.
Tesadüfi Korelasyonlar: İstatistikçi Tyler Vigen’ın ünlü web sitesinde sergilediği “sahte korelasyonlar” bu konuda hem eğlenceli hem de uyarıcıdır: ABD’de havuzda boğulan insan sayısı ile Nicolas Cage’in o yıl oynadığı film sayısı arasında son derece yüksek bir korelasyon bulunmaktadır. Bu ilişkinin hiçbir nedensel açıklaması yoktur; yalnızca iki veri serisinin tesadüfen benzer dalgalanmalar göstermesinden ibarettir. Büyük veri setlerinde yeterince değişken incelendiğinde, anlamsız korelasyonlar neredeyse kaçınılmazdır.
Ters Nedensellik: Bazen korelasyon gerçektir ama yön tersine işlemektedir. Hastaların yoğun bakımda uzun süre kalmasının ölüm riskini artırdığı gözlemlenebilir; oysa nedensellik tam tersinedir — daha ağır hastalar daha uzun süre yoğun bakımda kaldığından ölüm riskleri zaten yüksektir. Bu tuzağa ters nedensellik hatası denir ve sağlık, ekonomi ve sosyal bilimlerde sıklıkla karşılaşılır.
Seçim Yanlılığı: Gözlemlenen örneklem, evreni temsil etmiyorsa korelasyon yanıltıcı görünebilir. II. Dünya Savaşı’nda geri dönen uçaklardaki kurşun deliklerinin yoğun olduğu bölgeler incelenmiş ve bu bölgelerin zırhlanması önerilmiştir. Ancak istatistikçi Abraham Wald, geri dönen uçakların değil dönemeyen uçakların incelenmesi gerektiğini fark etmiştir; dönemeyen uçaklar, kurşun deliklerinin az olduğu bölgelerden vurulmuştu. Bu, hayatta kalma yanlılığı adı verilen seçim yanlılığının en çarpıcı örneklerinden biridir.
Günlük Hayattan Örnekler
Bu kavramsal ayrımın soyut kalmadığını, aksine her gün maruz kaldığımız medya haberlerinde, politika kararlarında ve kişisel yargılarımızda somutlaştığını görmek önemlidir.
Eğitim ve Gelir: Eğitim seviyesi ile gelir düzeyi arasında güçlü bir pozitif korelasyon vardır. Ancak bu, eğitimin her koşulda geliri artırdığını kanıtlamaz. Ailenin sosyoekonomik konumu, bireysel ağlar, şans faktörü ve seçim yanlılığı bu ilişkiyi karmaşıklaştırır. Korelasyonu nedensellik olarak sunmak, hem politika önerilerini hem de bireysel kararları çarpıtabilir.
Sosyal Medya ve Ruh Sağlığı: Ergenler arasında sosyal medya kullanımının depresyon ile korelasyonu gösteren pek çok çalışma kamuoyunda büyük yankı uyandırmıştır. Ancak araştırmacılar iki kritik soruyu yanıtlamakta güçlük çekmektedir: Sosyal medya mı depresyona yol açıyor, yoksa depresif bireyler mi sosyal medyaya daha fazla yöneliyor? Ve bu ilişkide ailenin tutumu, akran baskısı, uyku düzeni gibi değişkenler ne kadar belirleyici?
İlaç Çalışmaları: Gözlemsel çalışmalar, Hormon Replasman Terapisi (HRT) kullanan kadınların kalp hastalığı riskinin daha düşük olduğunu göstermişti. Bu korelasyon uzun süre nedensellik olarak yorumlandı. Ancak daha sonra yapılan randomize kontrollü denemeler tablonun daha nüanslı olduğunu ortaya koydu; HRT kullanan kadınlar ortalama olarak daha yüksek sosyoekonomik düzeye sahipti ve bu durum sağlıklı yaşam alışkanlıklarını beraberinde getiriyordu. Gizli değişkenler, istatistiksel tabloyu tamamen değiştirmişti.
Nedenselliği Nasıl Kurarız?
Araştırmacıların nedensellik iddiasında bulunabilmesi için kullandıkları başlıca yöntemler şunlardır:
Randomize Kontrollü Deneyler (RKD): Katılımcıların rastgele gruplara atandığı bu deneylerde karıştırıcı değişkenler büyük ölçüde dengelenir. Etik ve pratik kısıtlamalar olmadığında en güçlü kanıt biçimini sunar.
Doğal Deneyler: Gerçek hayatta rastgele gibi davranan doğal değişimler —bir politikanın bölgeye göre farklı uygulanması, ani bir yasal düzenleme— nedensel çıkarım yapmayı kolaylaştırır. Nobel ödüllü ekonomist Joshua Angrist ve ekibinin geliştirdiği araçsal değişken yöntemi bu alanda önemli bir araçtır.
Granger Nedensellik Testi: Zaman serisi verilerinde, bir değişkenin geçmişinin diğerini tahmin edip etmediğini inceler. Ancak bu, gerçek bir nedensellik değil, istatistiksel bir öngörü ilişkisidir.
Bradford Hill Kriterleri: Epidemiyolojide nedensellik değerlendirmek için geliştirilen bu kriterler arasında ilişkinin gücü, tutarlılığı, özgüllüğü, zamansal sıralaması ve biyolojik makullüğü yer alır. Sigara-akciğer kanseri ilişkisinin kurulmasında bu kriterler belirleyici bir rol oynamıştır.
Medya ve Kamuoyu Algısı
Medya haberciliğinde korelasyon-nedensellik karışıklığı sistematik bir sorun hâline gelmiştir. “X, Y riskini yüzde 30 artırıyor” biçimindeki manşetler çoğunlukla gözlemsel bir korelasyonu nedensellik olarak sunar. Okuyucular için bu ayrımı fark etmek güçtür çünkü nedensellik izlenimi veren bir dil, istatistiksel bulguları çarpıcı kılmanın en kısa yoludur.
Eleştirel bir okuyucu olarak şu soruları sormak alışkanlık hâline getirilmelidir: Bu çalışma gözlemsel mi yoksa deneysel mi? Karıştırıcı değişkenler kontrol edilmiş mi? Örneklem kimi temsil ediyor? Sonuç başka çalışmalarda tekrarlanmış mı?
Yapay Zeka ve Büyük Veri Çağında Korelasyon
Büyük veri ve makine öğrenmesinin yükselişi, korelasyon-nedensellik tartışmasına yeni bir boyut eklemiştir. Tahmin odaklı modeller için korelasyon çoğu zaman yeterlidir; bir algoritmanın X’i tahmin etmesi için Y ile Z arasındaki nedensel mekanizmayı bilmesine gerek yoktur. Ancak politika kararları ve müdahale tasarımı söz konusu olduğunda, korelasyonla yetinmek tehlikeli sonuçlar doğurabilir. “Hangi müdahale işe yarar?” sorusu, temelde nedensel bir sorudur ve buna korelasyonla yanıt verilemez.
Bu farkındalık, son yıllarda nedensel çıkarım (causal inference) alanının hızla büyümesini sağlamıştır. Judea Pearl’ün geliştirdiği nedensel grafikler ve do-calculus yaklaşımı, gözlemsel verilerden nedensel çıkarım yapmanın matematiksel temellerini oluşturmaktadır.
Sık Sorulan Sorular
Korelasyon her zaman nedenselliği dışlar mı?
Hayır. Korelasyon, nedenselliği ne kanıtlar ne de dışlar. İki değişken arasında gerçek bir nedensel ilişki varsa korelasyon da gözlemlenir; ancak korelasyonun varlığı tek başına nedenselliğin kanıtı değildir. Nedenselliği desteklemek için ek kanıtlara, doğru yönteme ve kontrol değişkenlerine ihtiyaç vardır.
Korelasyon katsayısı yüksekse nedensellik daha mı olasıdır?
Hayır. Korelasyonun gücü, nedensellik olasılığını artırmaz. Yüksek korelasyon yalnızca iki değişkenin birlikte güçlü biçimde değiştiğini gösterir. Nicolas Cage filmleri ile havuz kazaları örneğinde olduğu gibi, anlamsız ilişkilerde de mükemmele yakın korelasyon katsayıları elde edilebilir.
Nedenselliği kanıtlamak neden bu kadar güçtür?
Çünkü gerçek hayatta değişkenler izole edilemez; her sistem karmaşık geri bildirim döngüleri, gizli faktörler ve tarihsel bağımlılıklar içerir. Bunun yanı sıra etik kısıtlamalar pek çok deneyin yapılmasını imkânsız kılar. Bu nedenle bilim, çoğunlukla “güçlü nedensel kanıt” ile “kanıtlanmış nedensellik” arasındaki geniş alanda faaliyet yürütmek zorundadır.
İleri Okuma ve Kaynaklar
- Pearl, J. & Mackenzie, D. — The Book of Why: The New Science of Cause and Effect (2018) — Nedensel çıkarım alanının öncüsü Judea Pearl’ün geniş kitleye yönelik kaleme aldığı, korelasyon-nedensellik ayrımını matematiksel temelde açıklayan kapsamlı eser.
- Vigen, T. — Spurious Correlations (2015) — Sahte korelasyonların ne kadar yanıltıcı olabileceğini eğlenceli ve düşündürücü örneklerle gözler önüne seren, hem akademik hem de genel okuyucu için uygun bir kaynak.
- Angrist, J. D. & Pischke, J. S. — Mostly Harmless Econometrics (2009) — Gözlemsel verilerden nedensel çıkarım yapmanın ekonometrik yöntemlerini sistematik biçimde ele alan, sosyal bilimciler için temel bir başvuru kaynağı.









