Bilimsel araştırmalar ne denli tutarlı
Hemen her gün, birbiriyle çelişkili yeni bilimsel iddialarla karşılaşıyoruz. Kesinliği kanıtlanamayacak tahminlere ne derece güvenebiliriz?
Bu soruyu yanıtlayabilmek için, Bayes Kuramı'na yeniden göz atmakta yarar var...
Kalp krizinden kaynaklanan ölümlerin oranını yarıya indiren yeni bir tedavinin bulunduğunu iddia eden tıbbi araştırmacılar; sanığın suçlu olup olmadığının belirlenmesinde DNA'ların kesinliğini savunan adli tıp uzmanları; hafta sonu havanın güzel olacağını söyleyen meteoroloji yetkilileri... Her gün, yeni bilimsel gelişmelere dayanan iddia ve karşı iddiaların bombardımanı altındayız.
Elbette bunların pek çoğu gerçeklikten uzak, peki hangileri? Bazıları oldukça makul iddialar olduğu halde, bazıları da boşlukta kaybolup gidecek gibi görünüyorlar. Yeni bir tedavinin ölüm oranlarını gerçekten yarıya indirmesi oldukça zor karşılaşılabilen bir durum. Dolayısıyla, bu tür iddialara kuşkuyla yaklaşılması yerinde olur. Öte yandan, hava durumu tahminlerinin giderek daha güvenilir hale geldiği de bir gerçek.
Bize makul gelseler bile kesinliği kanıtlanamayacak tahminlere ne derece güvenebiliriz? Bu tahminlerin kararlarımızı etkilemelerine izin vermemiz doğru mu? Giderek bilimsel bilgi ışığında kararlar vermenin dayatıldığı günümüzde, bu soruların önemi sürekli artıyor.
Karmaşayı aydınlatabilecek yol, aslında 200 yılı aşkın bir süredir biliniyor; ancak, son dönemlerde çelişkili fikirler arasında kaybolmuş durumda. Bu, eldeki verileri olasılıklara çeviren matematiksel bir reçete: Bayes Kuramı...
Kısa bakış...
Bir kuramın ya da varsayımın test edilmesi için veriye ihtiyacımız var. Ancak, her veri de eşit derecede ikna edici değil. Örneğin, bir ilaç hastaların yüzde 80'nini iyileştiriyorsa, tabii ki yüzde 60'lık bir iyileştirme oranına göre daha geçerli bir kanıtımız var demektir. Ancak bu ne kadar ikna edici? Yanıt, 200 yıl önce İngiliz din adamı ve matematikçi Thomas Bayes tarafından ortaya konan matematiksel yöntemde gizli. Bayes Kuramı olarak bilinen yöntem, yeni kanıtlar ışığında eldeki sonuçların güncellenmesini sağlıyor. Bunun için, yeni bulgular göz önüne alınmadan önce varsayımla ilgili inanış belirleniyor. Bu ön "inanış" henüz herhangi bir araştırma yapılmadığından, bir tahminden ancak birkaç adım ileri gidiyor. Bu, Bayes Kuramı'nın bilimdışı, öznel olarak yorumlanmasının ve 1980'lere kadar bilim dünyasının dışında bırakılmasının da sebebi. Ancak, önsel olasılığa ilişkin kuşkuların ve sorunların yeni istatistikçiler tarafından aşılmasıyla, Bayes Kuramı, karmaşık verilerden bir sonuç çıkarmanın en güvenilir yöntemi olarak kabul görmeye başladı.
Bayes Kuramı, yıllarca süren bilimsel tartışmanın ardından, eldeki verileri anlamlandırma konusunda yeniden en güvenilir yöntem olarak kabul görüyor. Bilim insanından jüri üyesine, şifre çözücüden tüketiciye dek, herkes bu yöntemden faydalanabiliyor.
1763'te Royal Society dergisinde, "Essay Towards Solving A Problem in the Doctrine of Chances" (Rastlantısallık Doktriniyle Problem Çözümü) başlıklı bir makale yayımlandı. Makalenin yazarı Thomas Bayes, o tarihten iki yıl önce ölmüş bir din adamıydı. Yazı, epeyce önemli bir bilimsel konuya açıklık getirmek amacındaydı: yeni elde edilen verilerin, bir kuramın doğruluğunun belirlenmesindeki etkisi.
Örneğin, bir futbol hakeminin tura gelme ihtimali yüksek hileli bir para kullandığından kuşkulandığınızı varsayın. Bunu belirlemek için, parayı 100 defa atıyorsunuz ve 59'unda tura geliyor. Bozuk para hilesiz olsaydı 50 civarında tura gelmesini beklerdiniz; dolayısıyla, kuşkularınızda haklı olduğunuza ilişkin elinizde yeterli veri olduğunu söyleyebilirsiniz. Ancak sorulması gereken bir soru var: Bu kanıtınız ne derece geçerli?
Paranın hilesiz olduğu varsayıldığında, bu kadar çok tura gelmesi olasılığı nedir? Bayes'in yaşadığı dönemde, matematikçiler pek de ilginç olmayan bu soruyu yanıtlayabiliyorlardı. Ancak konumuz bu değil, yapmak istediğimiz, "59 kez tura gelmesine rağmen para hilesiz olabilir mi?" sorusuna yanıt bulmak...
Bayes bu sorunun, Bayes Kuramı olarak bilinen bir formül kullanılarak yanıtlanabileceğini gösterdi. Formül, rastlantısal bir olayın gözleminden önce, öne sürülen varsayımlara ilişkin olasılıkların değerlendirilmesine dayanıyor.
Hayal kırıklığı...1922'de Bayes tarzı yöntemler, kalp krizi ölümlerini yüzde elli azaltan bir ilacın bulunduğu iddialarının yanlışlığını ortaya koydu.
Kuram, bir varsayımın geçerliliğinin iki etkene bağlı olduğunu söylüyor. Birincisi kanıtların güçlülüğünü ölçüyor. Yanı sıra benzer kanıtların, varsayımın doğru ve yanlış olması durumlarında elde edilip edilemediğini karşılaştırıyor. Bu karşılaştırma sonrasında bulunan benzerlik oranı büyüdükçe, kanıtların geçerliliğinin de arttığı sonucuna varılıyor.
İkinci etken ise, Bayes Kuramı'nı oldukça çelişkili bir hale getiriyor. Kanıtların toplanması öncesinde varsayımın doğruluk olasılığını tanımlayan ikinci etken, "önsel olasılık" şeklinde adlandırılıyor. Buna göre, durum oldukça tuhaflaşıyor, çünkü kanıtların toplanmasındaki tek amaç varsayımın doğruluğunun belirlenmesi. O halde, önsel olasılık hangi kanıtlara dayanarak belirlenmeli?
Bayes elde bir bulgu yokken, önsel olasılığın 0 ile 1 arasında herhangi bir değer alabileceğini iddia ederek, bu sorunla başa çıkmaya çalıştı. Ancak, ortaya çıkan matematiksel sorunları çözemedi. Belki de, bu yüzden elde ettiği sonuçlar ölümünden iki yıl sonrasına kadar yayımlanamadı. 1774'te Fransız matematikçi Pierre-Simon Laplace sorunu çözerek, Bayes Kuramı'nı çağdaş hale getirdi. Daha sonra, Paris'te erkek doğumlarının kızlardan daha fazla olduğu iddialarının araştırılmasında kullandı.
Her tür verinin analizinde kullanılabildiği için pek çok meslek grubu Bayes Kuramı'ndan yararlanıyor.
Laplace tarafından desteklenen Bayes Kuramı, 20. yüzyılın başlarına dek bilimsel bulguların değerlendirilmesinde standart yöntem olarak kullanıldı. Ancak daha sonra, önde gelen istatistikçiler tarafından sorgulanmaya başladı. Onların kuşkuları da önsel olasılık konusu etrafında gelişiyordu. Araştırmacılar, önsel olasılığı dikkate aldıklarında, aynı verilerle farklı sonuçlara ulaşabiliyorlardı. Örneğin, yeni ortaya atılan bir tıbbi tedavinin savunucuları da karşıtları da aynı verileri kullanarak kendi savlarını destekleyen sonuçlara ulaşabiliyorlardı.
Bu durum bilimsel bir karmaşa yarattı. 1920'lerde istatistikçiler, kuramların test edilmesinde önsel olasılık ihtiyacını ortadan kaldıran tamamen nesnel yöntemler geliştirmeye çalıştılar. Gerçekte bu yöntemler, sorunu hasır altı etmenin ötesine geçemedi, sadece bir nesnellik yanılsamasına yol açtı. Kimi istatistikçilerin bu durumu göz önüne serme çabalarına karşın, yeni frequentist (sıklıkçı) yöntem bilimsel bulguların değerlendirilmesinde belirleyici oldu.
1930 sonrasında Bayes yöntemi, öznel ve bilimdışı şeklinde damgalanarak kullanılmadı. Ancak, Alan Turing'in aralarında bulunduğu kimi inatçı yandaşları, Bayes'in bayrağını taşımaya devam ettiler. İkinci Dünya Savaşı'nda Alan Turing ve Jack Good, Bayes yöntemini kullanarak Nazilerin Enigma şifrelerini çözdüler. Böylece bilim insanlarının araştırmalarda kullanmayı reddettikleri Bayes Kuramı, savaşın kazanılmasına yardımcı oldu.
DNA verileri polis tahkikatları ve mahkûmiyetlerde devrim yarattı.
İkinci Dünya Savaşı sonrasında bilimsel araştırmaların hızla artmasıyla, tekrara dayalı (sıklıkçı) yöntemin kullanılması neredeyse zorunlu hale geldi. Yeni kuramlarla ilgili iddialar, ancak eldeki kanıtlar istatistiksel olarak anlamlı bulunursa ciddiye alınmaya başladı. Bunun için de, tekrara dayalı formüllerin kullanılması ve 20'de 1'in altında bir P değeri alıp almadıklarının kontrolü gerekli hale geldi.
Bilim insanları için P değeri, ellerindeki sonuçların rastlantı olmadığının göstergesiydi. P değeri küçüldükçe kanıtların geçerliliği artıyordu. Ancak, bilim dünyasının gözden kaçırdığı nokta, Bayes yöntemini kullanmaktan ısrarla kaçınan sıklıkçı istatistikçilerin, kuramların test edilmesinde tamamen nesnel bir yöntem bulmak konusundaki başarısızlıklarıydı. P değeri, bulguların gerçekten rastlantısal olduğunu varsayıyordu ve Bayes yönteminden daha nesnel değildi. Bilim dünyası ise, kuramların test edilmesinde P değerinin nesnel olduğunu düşünüyordu.
1960'lardan sonra bu kez istatistikçiler, bilim insanlarını P değerinin yanlış anlaşılmasının tehlikelerine karşı uyarmaya çalıştılar, ancak başarılı olamadılar. Çoğu bilim insanına göre P değeri nesnel ve kolay kullanılan bir ölçüydü. En önemlisi de, bütün bilimsel dergilerde, araştırmaların sonuçlarının yayınlanması için ölçüt P değeriydi.
Bir bozuk paranın hileli olduğundan kuşkulanıyorsanız, Bayes Kuramı bu olasılığı belirlemenizde yardımcı olabilir.
Bayes yöntemi, yıllarca görmezden gelindi. Ancak, 1980 sonrasında yeniden kullanımına yol açacak gelişmeler yaşandı. Öncelikle, bilgisayarların geniş kullanımı, herkesin Bayes yönteminin gerektirdiği karmaşık hesaplamaları yapabilmesine yardımcı oldu. Yanı sıra, bilim insanlarından süpermarket işletmecilerine dek herkes veri yağmuru altındaydı ve bu verilerin anlamlı hale gelmesi için yöntemlere ihtiyaç duyuluyordu. Bayes Kuramı, ancak bir önsezi olabilecek bilgilerin, somut çıkarımlar olarak değerlendirilebilmesini sağladı. Ayrıca, yeni veriler geldikçe çıkarımların güncellenebilmesi imkânı doğdu; ki bu, sıklıkçı yöntemin zorlandığı bir konuydu.
Örneğin, 1992 yılında İskoçya'da tıbbi araştırmacılar, kalp krizinden kaynaklanan ölüm oranını yüzde 50 azaltan bir ilacın keşfi ile gazete manşetlerinde yer aldılar. Aslında bu, sadece sıklıkçı yöntemin gösterdiği sonuçtu. Pek çok uzman, etkileyici olan bu başarı oranına kuşkuyla yaklaştı. Araştırmanın yayımlanmasından kısa bir süre sonra, iki tıbbi istatistikçi, David Spiegelhalter ve Stuart Pocock, Bayes Kuramı'nı, İskoçların bulduğu sonuçlarla, daha önce yapılmış araştırma sonuçlarını bir araya getirmek için kullandılar.
Ulaştıkları nokta, ilacın gerçek etkisinin iddia edilenin ancak yarısı olduğu şeklindeydi. Peki kim haklıydı? Sekiz yıl sonra, ABD'li araştırmacılar aynı tedavi ile ilgili pek çok araştırmanın tüm bulgularını yeniden gözden geçirdiler ve Spiegelhalter ile Pocock'un araştırmasını haklı çıkardılar.Böylece Bayes yöntemi, doktorları tedavinin mucize olmadığı konusunda uyardı.
1990'lı yıllarda Bayes Kuramı yeni bir alanda manşetlere taşındı: hukuk... Değişik kaynaklardan gelen bulguları bir araya getirme özelliği sayesinde davalarda kullanılır hale geldi. Avukatlar, Bayes Kuramı uzmanlarının görüşlerinden faydalanmaya başladılar.
1950'ler Bayes tarzı yöntemler gözden düştü. Dergi editörleri, nesnel ölçümler talep etmeye başladılar (P değeri gibi).
DNA kanıtlarına dayanan davaların çoğunda, sanığın DNA yapısı ile olay yerinde bulunan kanıtlardan elde edilen DNA örneklerinin benzerliği suçun ispatı niteliğindeydi. 1980'li yılların sonlarında, DNA'lar arasındaki rastlantısal benzerliğin ancak milyonda bir görülebileceğine inanılıyordu. Ancak, bazı adli tıp uzmanları bu küçük olasılığın, sanığın masumiyetini de ifade edebileceğini söylediler.
Bayes Kuramı bunun yeterli olmadığını gösteriyor ve ancak, tüm kanıtlar göz önüne alındığında suçluluk hakkında fikir sahibi olunabileceğini ileri sürüyor. Bunun üzerine savunma avukatları, DNA yapıları benzerlik gösterse bile, en küçük kanıtın bile suçun kesinliğini ortadan kaldırabileceğini gösterdiler. 1990'lı yıllarda bu tür savunma yöntemlerine çok sık başvuruldu.
Bugün Bayes Kuramı'nın, bilim sahnesinde merkezi bir rol oynamaya başlayacağına ilişkin işaretlere rastlıyoruz. Son on yılda, Bayes yöntemini kullanan bilimsel makale sayısı yedi kat arttı. Araştırmacılar bu yöntemi, fizikten farmakolojiye kadar pek çok alandaki kuramların test edilmesinde kullanıyorlar.
Bayes Kuramı'nın gücü akademi dünyasının ötesinde de kabul görüyor. Büyük şirketler satış ve pazarlama verilerinden sonuç alırken Bayes Kuramı'na güveniyorlar. Çokuluslu şirketler, Bayes'ten esinlenen veri yönetimi yazılımını kullanıyorlar.
On yıllar süren sıkıntıdan sonra rahip Bayes'in matematiksel vaazının gücü nihayet tanınıyor... Ve gazete sayfalarında, televizyonlarda karşılaştığımız genellemelere dayalı bilimsel iddiaların doğruluğunu test etmek için bizlere ipuçları sunuyor.
FOCUS