karar verme süreçleri etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
karar verme süreçleri etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

8.03.2011

Olasılıksal Düşünme: İstatistik ve Psikoloji

  
Hasan G. Bahçekapılı'nın bu yazısı Bilim ve Ütopya Dergisi'nde Mart 2011'de yayınlandı. 

Önünüze şu sorunun geldiğini düşünün:

40 yaşın üstündeki kadınlarda göğüs kanseri görülme oranı yüzde 1’dir. Göğüs kanserini tespit etmekte yaygın olarak kullanılan bir test olan mamografi göğüs kanseri olmayan kadınlarda yüzde 10, göğüs kanseri olan kadınlarda yüzde 80 pozitif sonuç vermektedir. Söz konusu yaş grubuna giren ve testten pozitif sonuç alan bir kadının gerçekten göğüs kanseri olma olasılığı nedir?

Çok zor bir soru gibi görünmüyor ama terimlere aşina değilim diyorsanız biraz açalım. Pozitif sonuç demek testin üzerinde test yapılan kişide hastalığın var olduğunu söylemesi demek. Elbette hiçbir tıbbi test yüzde 100 güvenilir değil. Bir testin güvenilirliğini iki olasılık değerine bakarak ölçeriz. Birincisi testin duyarlılığı. Yani gerçekten hasta olan birine pozitif teşhis koyma olasılığı. Yukarıdaki soruda bu değer yüzde 80 olarak verilmiş. İkincisi testin yanlış pozitif teşhis koyma olasılığı. Yukarıdaki soruda bu değer yüzde 10 olarak verilmiş. Bu iki değer birbirinden bağımsızdır ve iyi bir testte bunlardan birincinin yüksek, ikincinin düşük olmasını bekleriz.
                                           
Şimdi soruyu tekrar düşünün: Bu testten pozitif teşhis alan birinin gerçekten hasta olma olasılığı nedir? Yüzde 70 veya üstünde bir değer olduğunu düşünüyorsanız son 30 yılda bu soruya maruz kalan doktorların büyük çoğunluğu gibi düşünüyorsunuz demektir (Casscells, Schoenberger, & Graboys, 1978; Eddy, 1982). Oysa gerçek değer yaklaşık yüzde 7.5. Yani testin sonucuna bakarak testi alan kişiye kanser teşhisi koyup tedaviye başlayan bir doktor vahim bir hata yapıyor demektir.

Sadece sıradan insanlar değil konunun uzmanı olan doktorlar bile nasıl oluyor da soruya gerçek değerin tam 10 kat üstünde bir cevap verebiliyorlar? Matematiksel açıdan baktığımızda yapılan hata hastalığın popülasyonda görülme sıklığı olan yüzde 1’i hesaba katmamak. Standart Bayes teoremini kullanarak soruya doğru cevap vermek mümkün. Fakat teoremin standart halini bu soruda kullanmak karmaşık hesaplar gerektiriyor. Herkesin bu tür hesaplamalara alışık olmasını bekleyemeyiz. Oysa sorudaki değerleri olasılık değeri olarak değil sıklık olarak düşünürsek çözüm çok daha basit hale gelebilir. Sorudaki verilerden hareketle şöyle düşünelim:

40 yaşın üstünde kadınlardan oluşan 1000 kişilik bir grubumuz var diyelim.
Bunların 10 tanesi göğüs kanseri, 990 tanesi sağlıklıdır (yüzde 1 değerinden hareketle).
10 kanserli kadına test yapıldığında 8 tanesi pozitif, 2 tanesi negatif teşhis alır (yüzde 80 değerinden hareketle).
990 sağlıklı kadına test yapıldığında 99 tanesi pozitif, 891 tanesi negatif teşhis alır (yüzde 10 değerinden hareketle).
Yani test bu gruptaki kadınların 8+99=107 tanesine pozitif teşhis koyar. Bunların sadece 8 tanesi gerçekten kanserdir.
Dolayısıyla testin pozitif teşhis koyduğu kadınların 8/107’si, yani yaklaşık yüzde 7.5’i gerçekten kanserdir.

Bu şekilde düşünüldüğünde soru hem anlaşılması hem de çözülmesi çok daha basit hale geliyor. İnsanlar bu şekilde düşünmeye teşvik edildiklerinde veya sorudaki değerler en baştan olasılık cinsinden değil sıklık cinsinden verildiğinde doğru cevap verenlerin oranı çok daha yüksek oluyor (Gigerenzer, 1996). Burada yaptığımız şey insanlara matematik öğretmek değil, onları doğal olarak düşünmeye alışık oldukları şekilde düşünmeye yönlendirmek. İnsanlar bu şekilde “Bayesçi düşünme”yi çok daha kolay öğrenebiliyorlar (Gigerenzer & Hoffrage, 2005).

Olasılıksal Düşünme Hataları

Son 40-50 yılda yapılan psikolojik araştırmalar hem sıradan insanların hem de uzman olması beklenen kişilerin hem laboratuvar testlerinde hem de gerçek hayat durumlarında en temel olasılık kurallarını ihlal ettiğini ve hatalı yargılarda bulunduğunu gösteriyor. Bu hataların en belli başlı olanlarıyla ilgili örnekler verelim.

Birleştirme hatası: İnsanlar “zeki, konuşkan, felsefe mezunu, ırkçılık ve nükleer silah karşıtı” olarak betimlenen bir kişinin “feminist ve veznedar” olma olasılığını “veznedar” olma olasılığından yüksek görüyorlar. Benzer şekilde aşırı kilolu ve sigara içen birinin 5 yıl içinde “kalp krizi geçirme ve ülser olma” olasılığını “ülser olma” olasılığından yüksek görüyorlar. Oysa olasılık kuralları gereği iki olayın birleşiminin olasılığı bu olaylardan tekinin olasılığından yüksek olamaz (Tversky & Kahneman, 1983).

Kumarbaz hatası: Birçok insan hilesiz bir para üst üste 5 kere atıldığında ve hepsi yazı geldiğinde 6. seferde tura gelme olasılığının artık daha yüksek olduğunu düşünüyor. Oysa yazı-tura atışları gibi bağımsız olaylarda daha önce ne olduğu bundan sonra ne olacağını etkilemez (Tversky & Kahneman, 1974).

“Sıcak el” hatası: Kumarbaz hatasının tersi olarak düşünülebilir: Üst üste gelen tekrarların anlamlı bir örüntü oluşturduğuna ve devam edeceğine yönelik inanç. Mesela insanların çoğu üst üste birkaç atışı sokan bir basketbol oyuncusunun o anda “elinin sıcak” olduğunu ve bir sonraki atışı sokma olasılığının her zamankinden yüksek olduğunu düşünüyor. Oysa gerçek oyuncuların atış istatistikleri üzerinde yapılan analizler, oyuncunun bir atışı sokmasının bir sonraki atışı sokma olasılığını etkilemediğini gösteriyor. Buradaki temel hata şu: İnsanlar eldeki gözlem verilerinde rastlantısallıktan en ufak bir sapma olduğunda bunun şansla açıklanamayacağını düşünüyorlar ve veride aslında var olmayan örüntüler fark ettiklerini zannediyorlar (Gilovich, Vallone, & Tversky, 1985).

Olasılık eşleştirme ve maksimize etme: Önünüzdeki ışık bazan yeşil bazan kırmızı yanıyor diyelim. Göründüğü kadarıyla kırmızı ve yeşillerin sırası herhangi bir örüntüye uymuyor. Fakat biraz gözledikçe denemelerin yüzde 70’inde kırmızı, yüzde 30’unda yeşil yandığını fark ediyorsunuz. Sizden 100 deneme boyunca mümkün olduğu kadar çok sayıda doğru tahmin yapmanız isteniyor. Tahminlerinizi kırmızı ve yeşil arasında nasıl dağıtırsınız? İnsanların büyük çoğunluğu her bir denemedeki rengi doğru tahmin edebilmek için denemelerin yüzde 70’inde kırmızı, yüzde 30’unda yeşil tahmininde bulunuyorlar. Oysa bu optimal olmayan bir strateji. Bu şekilde ortalama (70x0.70)+(30x0.30)=58 denemede doğru tahmin yaparsınız. 30 denemede tahmininizin yanlış çıkacağını kabul ederek sürekli kırmızı tahmininde bulunduğunuzda ise 70 denemede doğru tahmin yaparsınız. Yani tek tek her bir denemede doğru tahmin yapmanın mümkün olmadığını kabul etmek doğru tahmin oranını arttırıyor (Stanovich, 2010).

Klinik ve istatistiksel tahmin: Elimizde bir kişiyle ilgili çeşitli veriler (görüşme notları, test sonuçları, geçmiş hayat bilgileri, vs.) var diyelim. Bütün bu bilgileri bir araya getirip bir sonuca varmanın (mesela hastalık var-yok teşhisi koymanın veya okula kabul etme-etmeme kararı vermenin) en isabetli yolu nedir? Çoğu kişiye ve bu alandaki araştırma sonuçlarını bilmeyen birçok uzmana göre klinik/sezgisel yöntem. Yani bir uzmanın bütün o verilerden edindiği izlenimden çıkardığı tahmin. Oysa son 50 yılda yapılan araştırmalar bütün o verileri bir araya getiren lineer bir denklemden oluşan modelin uzmanlardan hemen hemen her zaman daha isabetli tahminler yaptığını gösteriyor. İstatistiksel/mekanik modele girilen hangi verinin ne kadar önemli olduğu bilgisinin tamamen uzmanın yargısına dayandığı durumda bile model uzmandan daha iyi teşhis/tahmin yapıyor. Buradaki farkı yaratan şey modelin tahmin yapma prosedürünü her vakada aynı şekilde tutarlı olarak kullanması, uzmanın ise gelen vakanın özelliğine göre isabet oranını arttırmak için prosedürde değişiklik yapması. Yani her vakayı özel sayıp her birinde ayrı bir ölçüt kullanmak isabet oranının düşmesine yol açıyor (Grove & Meehl, 1996; Swets ve ark., 2000).

Çözüm Yolları

Kesinlik içermeyen, dolayısıyla olasılıksal akıl yürütme gerektiren durumlarla günlük hayatın birçok alanında karşılaşıyoruz. Kişisel sağlıkla ilgili kararlar, mahkemelerde yargıyla ilgili kararlar ve ekonomik yatırımlarla ilgili kararlar belirsizliğin olduğu durumlarda doğru akıl yürütme gerektiriyor. İnsanların böyle durumlarda daha sağlıklı karar vermelerini sağlamak için ne yapabiliriz?

En temel çözüm elbette erken yaşta başlayan eğitim. Gigerenzer ve arkadaşlarına (2007) göre ilk istatistik dersini üniversitede almak demek çok geç kalmak demek. Olasılıksal düşünme ve istatistik eğitimi ilköğretimde başlamalı.

Özellikle sağlık hizmetlerinden yararlananların bu gibi konularda doğru düşünmeye başlamaları için atmaları gereken ilk adım “kesinlik yanılgısı”ndan kurtulmaları (Gigerenzer, 2002). Yani hiçbir test sonucunun, teşhisin ve tedavinin kesinlik içeremeyeceğinin farkına varmaları ve “Olasılığı ne?” diye sormaya başlamaları.

Bir başka adım olasılıkla ilgili bilgiyi kafa karıştırıcı olmayan bir şekilde aktarmak. Mesela doktor Prozac verdiği hastasına yan etki olarak cinsel sorun yaşama olasılığının yüzde 30 olduğunu söylüyor. Bu açık bir bilgi aktarımı değil çünkü verilen olasılık değerinin referans grubunun ne olduğu belli değil: Neyin yüzde 30’u? Hasta bu bilgiden hareketle cinsel deneyimlerinin yüzde 30’unda sorun yaşayacağını düşünüyor. Oysa doktorun kastettiği şey bu ilacı kullananların yüzde 30’unda cinsel sorun görüldüğü (Gigerenzer, 2002).

Önerilen bir tedavinin ne kadar etkili olduğuna hastanın karar verebilmesi için de tedavinin ölüm riskini ne kadar azalttığıyla ilgili bilginin açık bir şekilde aktarılması gerekir. Mesela doktor mamografi testine girmenin göğüs kanserinden ölme riskini yüzde 25 azalttığını söylüyor. Verilen değerin mutlak risk mi yoksa göreceli risk mi olduğunu bilmeden buradan bir sonuç çıkarmak mümkün değil. Doktorun söylemek istediği aslında şu: Mamografi testine girmeyen 1000 kadından 4’ü göğüs kanserinden ölürken mamografi testine giren 1000 kadından sadece 3’ü ölüyor. Yani doktor göreceli risk azalmasından bahsediyor. Oysa teste girmenin 1000 kadından 1 tanesinin kurtulmasını sağladığı söylense, yani bilgi mutlak risk azalması şeklinde aktarılsa, hasta bilgiyi daha kolay anlayıp tedaviyle ilgili daha bilinçli bir karar verebilecek (Gigerenzer ve ark., 2007).

Son olarak gereken adım da verilen olasılıksal bilgiyi kullanarak doğru sonuçlara varabilmek. Özellikle uzun yıllar boyunca olasılık ve istatistik eğitimi almamış insanlarda bunu sağlamanın en kolay yolu yapılması gereken hesabı basitleştirerek problemi ortaya koymak. Başta verilen örnekten de görülebileceği gibi psikolojik araştırmalar insanların şartlı olasılıklar cinsinden değil sıklıklar cinsinden düşünmeyi daha doğal ve basit bulduğunu gösteriyor. Bu konudaki en basit eğitim insanlara karşılaştıkları olasılık problemini nasıl sıklık problemi haline getireceklerini öğretmek olabilir.

Sonuç

Ne kadar kesin bilgiye sahip olmayı istesek de tamamen yok edilemez belirsizliklerle dolu bir dünyada yaşıyoruz. Dolayısıyla bu dünyayla baş edebilmek için belirsizliklerle, olasılıklarla ilgili doğru düşünmeyi öğrenmek gerekiyor. İşte bu yüzden yazının başlığında zikrettiğimiz iki şeye ihtiyacımız var. Bir tıp kurumunun başkanı bunu şu şekilde ifade ediyor (Gigerenzer, 2002, s. 94):

Çok az doktor bilimsel bir araştırmayı anlayabilecek ve değerlendirebilecek bir eğitim alıyor. Ben cerrah olmayı seçtim çünkü iki şeyden uzak durmak istiyordum: istatistik ve psikoloji. Şimdi anlıyorum ki ikisi de vazgeçilmez şeyler.


Kaynaklar
  
Casscells, W., Schoenberger, A., & Graboys, T. (1978). Interpretation by physicians of clinical laboratory results. New England Journal of Medicine, 299, 999-1001.

Eddy, D. M. (1982). Probabilistic reasoning in clinical medicine: Problems and opportunities. D. Kahneman, P. Slovic, & A. Tversky (Ed.), Judgment under uncertainty: Heuristics and biases kitabında (s. 249-267). Cambridge: Cambridge University Press.

Gigerenzer, G. (1996). The psychology of good judgment: Frequency formats and simple algorithms. Medical Decision Making, 16, 273-280.

Gigerenzer, G. (2002). Calculated risks: How to know when numbers deceive you. New York: Simon & Schuster.

Gigerenzer, G., & Hoffrage, U. (1995). How to improve Bayesian reasoning without instruction: Frequency formats. Psychological Review, 102, 684–704.

Gigerenzer, G., Gaissmaier, W., Kurz-Milcke, E., Schwartz, L. M., & Woloshin, S. (2007). Helping doctors and patients make sense of health statistics. Psychological Science in the Public Interest, 8, 53-96.

Gilovich, T., Vallone, R., & Tversky, A. (1985). The hot hand in basketball: On the misperception of random sequences. Cognitive Psychology, 17, 295-314.

Grove, W. M., & Meehl, P. E. (1996). Comparative efficiency of informal (subjective, impressionistic) and formal (mechanical, algorithmic) prediction procedures: The clinical-statistical controversy. Psychology, Public Policy, and Law, 2, 293-323.

Hoffrage, U., & Gigerenzer, G. (1998). Using natural frequencies to improve diagnostic
            inferences. Academic Medicine, 73, 538–540.

Stanovich, K. E. (2010). How to think straight about psychology. New York: Pearson.

Swets, J. A., Dawes, R. M., & Monahan, J. (2000). Psychological science can improve diagnostic decisions. Psychological Science in the Public Interest, 1, 1-26.

Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185, 1124-1131.

Tversky, A., & Kahneman, D. (1983). Extensional vs. intuitive reasoning: The conjunction fallacy in probability judgment. Psychological Review, 90, 293–315.




23.09.2010

Cezalı Diktatör Oyunu ve Kadın-Erkek Farkları

 
Cezalı Diktatör oyununda (third party punishment game) görülen işbirliği davranışında kadın-erkek farkları üzerine bir makale.

The influence of cooperative environment and gender on economic decisions in a third party punishment game

Emel Kromer and Hasan G. Bahçekapili

Abstract
The influence of social context on men's and women's cooperative behaviour was investigated in a third party punishment game. The results of the analyses showed that, in general, people significantly deviated from rational norms since their decisions were not fit to maximization of their economic benefits. Female participants’ behaviour was more cooperative in terms of first offer rates than male participants when they were dictators. On the other hand, male participants were more willing to pay money to punish unfair allocations and to reward fair offers when they played the role of third party. Taken together these results imply that explaining the behaviour of people in economic exchange situations require going beyond classical definitions of rationality based on profit maximization and embracing social considerations to account for the influence of the situation and for gender differences.

Keywords: Cooperation; gender differences; third party punishment game


Tam metne ulaşmak için:



1.07.2010

Güvercinler İnsanlardan Daha mı Zeki?

 
Bu sorunun sorulmasına vesile olan ilginç bir araştırma (“Are birds smarter than mathematicians?”) birkaç ay önce Journal of Comparative Psychology’de yayınlandı:


Hayvanların belirsizlik içeren bazı özel problemlerde insanlardan daha rasyonel (olası kazancı maksimize eden) tercihler yaptığı biliniyor (Arkes & Ayton, 1999). Bu durumun sebebi olarak genellikle insanların problemin gerektirdiğinden daha karmaşık düşünmeleri, özel olarak da konuyla ilgili eski bilgilerini ve sosyal bağlamı gereksiz bir şekilde problemin çözümünde kullanmaya çalışmaları gösteriliyor (Stanovich, 2004). Dolayısıyla hayvanlar insanlardan daha zeki oldukları için değil, paradoksal bir şekilde daha az zeki oldukları için bu tür özel problemlerde insanlardan daha rasyonel davranabiliyorlar.

Herbranson ve Schroeder (2010) insan zekasını yeniden tartışmaya açan araştırmalarında güvercinlerin Monty Hall probleminde insanlara kıyasla nasıl bir performans göstereceğini bulmayı amaçlamışlar. Monty Hall problemi (içinde matematikçilerin de bulunduğu) birçok kişi tarafından kolayca çözülemeyen ve insanların kendilerine doğru çözüm gösterildikten sonra bile yanlış çözümde ısrar ettikleri bir olasılık problemi. (Monty Hall problemini hatırlamak isteyenler bu blogda daha önce yayınladığımız Kargalar, Keçiler ve Taksiler yazımıza bakabilirler.)

Araştırmadaki ilk deneyin prosedürü orijinal Monty Hall’un düzeneğine benzetilmeye çalışılmış. Orijinal Monty Hall’da bir yarışma ortamı, sunucunun stratejisi hakkında akıl yürütme imkanı ve soruya tek seferde cevap verebilme hakkı vardır. Burada ise düzenek güvercinlerin yapabileceği hale gelecek şekilde biraz değiştirilmiş. Deneyde 6 güvercin var ve deney klasik bir Skinner kutusunda geçiyor. Güvercinlerin önünde yemeği bulmak için gagalayabilecekleri 3 tane tuş var. Deney başladığında bu tuşlardan bir tanesi bir bilgisayar programı tarafından rastgele seçiliyor ve bu seçilen tuş gagalandığında ödül verecek olan tuş oluyor. İlk önce bu 3 tuş beyaz ışıkla ışıklandırılmış durumda. Güvercin bu 3 tuştan herhangi birini gagaladığında ışıklar bir süreliğine sönüyor ve bu sürede bilgisayar ödülün olmadığı tuşu (eğer güvercinin ilk gagaladığı tuşta ödül varsa kalan 2 tuştan herhangi birini) pasif hale getiriyor. Yani güvercin bu tuşu ne kadar gagalarsa gagalasın, bu tuş hiçbir şekilde tepki vermeyecek şekilde ayarlanıyor. Bu durum orijinal Monty Hall’da sunucunun ödül olmayan (arkasında keçi bulunan) herhangi bir kapıyı açmasına denk geliyor. Kalan 2 tuş (güvercinin ilk gagaladığı tuş ve diğer tuş) yeşil ışıkla ışıklandırılıyor. Buradan sonra güvercin ödülün bulunduğu tuşu gagalarsa ödül, yani yem veriliyor; diğer tuşu gagalarsa hiçbir şey verilmiyor. Bu prosedürde aslında bakılan şey şu: Güvercin kalan 2 tuştan birini gagalaması gerektiğinde yine ilk gagaladığını mı yoksa diğer tuşu mu seçecek? Yani bakılan şeyin orijinal Monty Hall’daki karşılığı, sunucu arkasında arabanın olmadığı kapıyı açtıktan sonra yarışmacının ilk seçtiği kapıda ısrar etmesi ya da diğer kapıya geçmeyi tercih etmesi durumu. Monty Hall’da olduğu gibi burada da optimal strateji ilk seçilende ısrar etmemek, tercih değiştirmek.


Veriler güvercinlerin 1. ve 30. günlerdeki denemelerin ortalama yüzde kaçında diğer tuşa geçtiklerine bakılarak inceleniyor. 1. gün 10 denemeyle başlıyor ve her geçen gün deneme sayısı arttırılarak 30. gün bu sayı 100’e ulaşıyor. Sonuçlar 1. gün güvercinlerin toplam denemelerin yaklaşık yüzde 36’sında diğer tuşu seçtiklerini (ki yüzde 50 gibi bir sonuç elde edilmediği için bu, güvercinlerin rastgele bir tuşu seçmedikleri anlamına geliyor), 30. gün denemelerinin ise yaklaşık yüzde 96’sında diğer tuşa geçtiklerini gösteriyor. Yani güvercinlerin 1 ay sonunda optimal stratejiye rahatlıkla ulaştığını görüyoruz.


İlk deneyde hayvanlar her bir tuşu gagaladıklarında ne sıklıkla ödül aldıklarını deneme-yanılma yöntemi ile görüyorlar ve bu yüzden de zaman içinde diğer tuşu seçmenin daha fazla ödül kazandırdığını öğrendikleri için sürekli diğer tuşu seçmeye başlıyorlar. Bu durum “30 gün boyunca devam eden deney sonucunda en avantajlı stratejinin hangisi olduğunu öğrenmek pek de zor olmasa gerek” fikrini akla getirebilir. Klasik Monty Hall probleminde insanların doğru tercih yapıp yapamadıklarını göstermek için tek bir hakkı bulunuyor. 30 gün boyunca tercih yapıp ne tür tercihlerin ne oranda kazanmaya yol açtığını görseler insanlar da optimal stratejiye ulaşamazlar mı?

Araştırmacıların bu soruya cevap vermek amacıyla yaptıkları bir diğer deney şaşırtıcı bir şekilde cevabın “hayır” olduğunu gösteriyor. Güvercinlerin test edildiği düzeneğin hemen hemen aynısıyla sınanan üniversite öğrencilerinin, 200 denemenin ardından bile stratejilerinde pek bir değişim/gelişim olmadığı görülüyor. Öğrencilerin ilk denemelerin yaklaşık yüzde 57’sinde, son denemelerin ise yüzde 66’sında diğer tuşu seçtiklerini görüyoruz.


Bu durumun açıklaması ne olabilir? İnsanlar güvercinlerden çok daha yavaş öğrendikleri için mi son denemelerde hala ancak yüzde 66 oranında diğer tuşu seçiyorlar? Burada bakılması gereken şey sadece optimal stratejiye ulaşılıp ulaşılmadığı değil, ilerleyen zaman içinde optimal olan stratejiyi bulmada gösterilen gelişim. Güvercinler optimal olmayan bir stratejiyle başlıyorlar ve sonuncu gün neredeyse denemelerin tamamında optimal stratejiyi kullanıyorlar. Yani önemli olan nokta 30 gün boyunca en iyi stratejiye doğru giden değişimleri ve en sonunda optimal olanda karar kılmış olmaları. İnsanlar ise ilk denemelerde seçimlerini iki seçenek arasında şans düzeyinden (istatistiksel anlamda) farksız olarak yapıyorlar ama yine de optimal olan stratejiye daha yakınlar (denemelerin yüzde 57’sinde diğerine geçmeyi seçiyorlar). Fakat en son denemelere baktığımızda katılımcıların seçimlerinin, ilk denemelerindekilerden çok da farklı olmadığını görüyoruz. İlk denemelerin yüzde 57’sinde, son denemelerin ise sadece yüzde 66’sında optimal stratejiyi kullanıyorlar ve bu iki değer arasında istatistiksel anlamda bir fark yok. Yani toplamda 200 deneme boyunca stratejilerini geliştirme ve değiştirme anlamında kat ettikleri yol, güvercinlerinkinden çok daha az.

Bu sonuçlar bize güvercinlerin insanlardan daha zeki olduğunu mu gösteriyor? Hayır. Araştırma güvercinlerin özel olarak bu problemde optimal stratejiyi insanlardan daha kolay bulduğunu gösteriyor. Fakat bu durum güvercinlerin insanlardan daha zeki olmasından kaynaklanmıyor. En makul açıklama, başta da söylediğimiz gibi, insanların bu tür yapay problemlerle karşılaştıklarında hemen eski bilgilerini, uygun olup olmadığına bakmadan, kalıp olarak yeni probleme taşımaları. Klasik Monty Hall’da iki tercihin olasılığının da yüzde 50 olması gerektiğinde ısrar etme, eski bilgilerin ve başka ortamlarda işe yarayan stratejilerin uygun olmadığı halde yeni ortama taşınmasının bir örneği. Güvercinler ise böyle bir problemi çözerken sadece deney sırasında deneme-yanılma sonucu elde ettikleri deneyimlerine başvuruyorlar ve deneyimlerinden öğrendikleri kadarıyla kazancı maksimize eden stratejiye bağlı kalıyorlar. Kısacası güvercinlerin başarısının sebebi problemin üzerinde gereğinden fazla “düşünmüyor” oluşları.

Bu yorum başka araştırma bulguları tarafından da destekleniyor. Mesela yetişkin insanlar olasılık problemlerinde daha önceden öğrendikleri soyut analizleri uygulamaya çalıştıkları için başarısız oluyorlarsa, formel matematik eğitimi almamış çocukların tıpkı güvercinler gibi bu tür problemlerde yetişkinlerden daha başarılı olmaları beklenebilir. Nitekim 8. sınıf öğrencilerinden üniversite öğrencilerine kadar uzanan yaş aralığına bakan bir araştırma, yaş küçüldükçe öğrencilerin Monty Hall’da optimal stratejiye daha çok yaklaştığını, diğer seçeneği seçmenin en avantajlı strateji olduğunu daha kolay fark ettiğini gösteriyor (DeNeys, 2006). Bir başka araştırma da dil yeteneğinden ve soyut düşünmeden sorumlu olduğu düşünülen sol beyin yarımküresi hasar görmüş insanların olasılık problemlerinde, sağlıklı insanlarla karşılaştırıldığında, daha yüksek oranda kazançlarını maksimize eden stratejiyi benimsediğini ortaya koyuyor (Wolford, Miller & Gazzaniga, 2000).

Bütün bu bulgular soyut düşünme yeteneğinin, yani deneyimin yanında eski bilgileri de hesaba katma yeteneğinin bazı durumlarda optimal çözüme ulaşmayı sağlamak yerine tam tersine bunu zorlaştırdığını gösteriyor. Fakat yetişkin, eğitimli ve beyni normal çalışan insanlar olarak soyut düşünmekten vazgeçmemiz elbette mümkün değil. Bu durumda yapılabilecek tek şey kendi kendimizi eğitmeye devam ederek daha iyi soyut düşünmeyi öğrenmek.

Kaynaklar

Arkes, H. R., & Ayton, P. (1999). The sunk cost and Concorde effects: Are humans less rational than lower animals? Psychological Bulletin, 125, 591–600.

DeNeys, W. (2006). Developmental trends in decision making: The case of the Monty Hall dilemma. In J. A. Ellsworth (Ed.), Psychology of decision making in education. Haupauge, NY: Nova Science Publishers.

Herbranson, W. T., & Schroeder, J. (2010). Are birds smarter than mathematicians? Pigeons (Columba livia) perform optimally on a version of the Monty Hall dilemma. Journal of Comparative Psychology, 124, 1-13.

Stanovich, K. E. (2004). The robot’s rebellion. Finding meaning in the age of Darwin. Chicago: The University of Chicago Press.

Wolford, G.L., Miller, M.B., & Gazzaniga, M.S. (2000). The left hemisphere’s role in hypothesis formation. Journal of Neuroscience, 20 (RC64), 1–4. 


6.05.2010

Adalet Duygusu Sonradan mı Ortaya Çıktı?



Yaklaşık 10.000 yıl önce insanlar sadece akrabalarının değil yabancıların da bulunduğu büyük topluluklar içinde yaşamaya başladı. Bu türden büyük topluluklar içinde yaşamak yabancılarla karşılıklı olarak sıkça yardımlaşmayı ve kar etmeye dayanan ilişkiler kurmayı da beraberinde getirdi. Son yıllarda ekonomik oyunlar kullanılarak yapılan araştırmalar insanların hiç tanımadıkları ve bir daha karşılaşmayacaklarını bildikleri kişilerle işbirliğine giriştiğini ve bu ilişki sırasında adil olmayan bir davranışla karşılaştıklarında kendilerine para kaybettirse bile bu davranışı cezalandırdığını göstermiştir (Fehr & Fischbacher, 2003). Bu durum insanların “adalet duygusu” (sense of fairness) gibi bir psikolojik mekanizmaya sahip olduğu fikrinin ortaya çıkmasına sebep oldu. Fakat adalet duygusunun insanlık tarihi içinde nasıl evrimleştiği konusu bilim dünyasında hala tartışılmaktadır. “Adalet duygusu, ilişkilerin sıkı sıkıya bağlı olduğu avcı-toplayıcı gruplarda yaşadığımız en eski günlerimizden kalma bir özelliğimiz mi yoksa toplumun evrimleşmesiyle ortaya çıkan nispeten yeni bir özellik mi?” sorusu da bu tartışmanın bir parçası.

Geçen ay Science dergisinde antropolog Joseph Henrich ve arkadaşlarının tam da bu soruya cevap vermeye çalışan yeni bir çalışması yayımlandı.


Çalışma adalet duygusunun evrimi ile iki önemli faktörün arasındaki bağlantıyı göstermeyi amaçlıyor. Grubun bu çalışmayı yaparkenki çıkış noktası, büyük gruplarda işbirliğinin ortaya çıkması ve devam ettirilebilmesi için gereken şeyin adil olmayı ve güven duygusunu geliştirmeyi sağlayacak normlar olduğu fikridir. Bu türden normların ortaya çıkmasıyla iki önemli faktörün toplum içinde yayılması arasında bağlantı olduğunu savunmaktadırlar: büyük gruplarda mal alış-verişinin yaygınlaşması ve küresel dinlerin yayılması.

Günümüzde yabancılarla yapılan alış-verişin yaygınlığı ve sıklığı herkes tarafından bilinen bir gerçek. Fakat insan olmayan primatlar ve küçük gruplarda yaşayanlarla yapılan çalışmalar, evrimsel tarih boyunca lokal gruplar dışında gerçekleştirilen alış-verişin güvensizlik ve sömürülme tehdidi korkusuyla yapıldığı fikrini vermektedir. Bu nedenle Henrich ve arkadaşlarının ilk hipotezi “mal alış-verişi normları”nın, akrabalık, karşılıklılık (reciprocity), statü gibi sosyal ilişkilerin yetersiz kaldığı durumlarda, karşılıklı kar sağlayan ilişkilerin devam ettirilebilmesini sağlamak adına ortaya çıkmış olabileceği ve bunun toplumsal evrimin bir parçası olarak evrimleşmiş olabileceği yönündedir. İkinci hipotez ise bazı dinsel kurumların, inançların ve davranışların, büyük ölçekli grupların oluşumunu ve yaygın mal alış-verişini sağlayan normlarla birlikte evrimleşmiş olabileceği fikridir. Bu fikirle uyumlu olarak, etnografik veriler ahlaki kurallar koyan dinlerin ortaya çıkışının toplulukların boyutları ve karmaşıklığının artmasıyla arttığını göstermektedir. Ayrıca bazı deneysel çalışmalar inançlı kişilere dinsel kavramların örtük olarak hatırlatılmasının bu kişilerde yabancılara karşı daha fazla adil olma eğilimini ortaya çıkarttığını göstermektedir.

Bu araştırma, görece büyük toplulukların mensubu olan Afrikalı çobanlar, Kolombiyalı balıkçılar ve Missouri’li gündelikçi işçilerin de içinde bulunduğu 15 farklı toplulukta yaşayan kişilerden oluşmaktadır. Katılımcıların adaletsizliği cezalandırmaya ne kadar eğilimli olduğunu test etmek amacıyla yola çıkılmış ve katılımcılara 3 farklı oyun oynatılmıştır. Birinci oyun katılımcının bir miktar parayı (burada o kişinin normal hayatında bir günde kazandığı miktarda parayı) hiç tanımadığı, görmediği ve bir daha da karşılaşmayacağı bir kişiyle bölüşeceği Diktatör oyunudur (Dictator Game). İkinci oyun katılımcının bir miktar parayı (yine anonim ve tek seferli olarak etkileşime geçtiği) karşısındaki oyuncuya teklif ettiği, fakat karşısındaki oyuncu bu teklifi reddederse iki tarafın da para kazanamayacağı Ültimatom oyunudur (Ultimatum Game). Üçüncü oyun ise yine katılımcının bir miktar parayı karşısındaki oyuncuya teklif ettiği fakat bu defa üçüncü bir kişinin bu teklifin adil olmadığını düşündüğü anda cebinden para ödeyerek bu teklifi cezalandıracağı ve bu nedenle teklif yapan oyuncunun para kaybedeceği Üçüncü Taraf oyunudur (Third Party Punishment Game). Ültimatom ve Üçüncü Taraf oyununda adil olmayanı reddeden/cezalandıran kişi aynı zamanda zararlı da çıkmaktadır, çünkü Ültimatom oyununda yapılan teklifi reddeden oyuncular hiç para alamayacak ve Üçüncü Taraf oyununda ceza veren üçüncü kişi cebinden para vererek karşısındakini cezalandıracaktır.

Bulgular görece büyük ve karmaşık topluluklarda yaşayanların, küçük topluluklarda yaşayanlara göre adil olmaya daha fazla özen gösterdiğini ve adil olmayanı cezalandırmaya daha fazla eğilimli olduğunu göstermekte. Oynanan üç ekonomik oyunda da büyük topluluklarda yaşayanların diğer katılımcılarla karşılaştırıldığında %25 ile %51 arasında değişen oranlarda daha fazla para teklifi yaptıkları ve küçük topluluklarda yaşayanların genel olarak haksızlığı cezalandırıp para kaybetmeye yanaşmadıkları görülmüş. Özel olarak ise mal alış-verişinin yaygın olduğu topluluklarda yaşayan kişilerin “adil olma” konusunda daha hassas olduğu saptanmıştır. Bir dünya dininin mensubu olmak ile adalet duygusu arasındaki ilişki oynanan üç oyunun hepsinde gözlemlenmemiş.

Araştırmayı yapan grubun ulaştığı sonuç şu: Grupların büyüklüğüne ve karmaşıklığına göre değişiklik gösteren sonuçlar bize adalet duygusunun ve adil olmayanı cezalandırma eğiliminin binlerce yıl önce ortaya çıkmış olamayacağını göstermektedir. Eğer öyle olsaydı, toplumlar arasında bu denli büyük farklılıklar gözlemlenmezdi. Bu durumda yabancılara karşı gösterdiğimiz adalet ve bize yabancılar tarafından uygulanan haksızlığın cezalandırılmasını destekleyen davranışımız, toplumların karmaşıklaşmasıyla evrimleşen diğer normlarla birlikte sonradan ortaya çıkmıştır. Yani insan türünün ortaya çıkışıyla birlikte ortaya çıkmış ve nesilden nesile bozulmadan aktarılmış bir özellik değildir adalet duygusu, bu araştırmacıların ulaştığı sonuca göre.

Diğer yandan araştırmanın sonuçlarının bu yönde değerlendirilmesinin ne derece doğru olduğunu sorgulayan kesim ise bu türden araştırmaların yorumunda daha temkinli olunması gerektiğinin altını çizmektedir. Örneğin Harvard Üniversitesi’ndeki evrimsel oyun teorisyenleri Martin Nowak ve David Rand küçük kabilelerde yaşayan insanlara kültürel bağlam dışında ve anonim olarak oynatılan ekonomik oyunların “yorumlanamaz” sonuçlar verebileceğini vurgulamaktadır. David Rand ekonomik oyunların “yapay” durumlar olduğunu, karmaşık ve büyük toplumlarda yaşayanların, özellikle üniversite öğrencilerinin, bu türden durumlara avcı-toplayıcılardan çok daha fazla aşina olduğunu ve avcı-toplayıcıların bu oyunları gerçekten anlayıp anlamadığını bile bilmenin imkansız olduğunu savunmaktadır. Bu nedenle üniversite öğrencileriyle yapılan araştırmaların sonuçlarıyla bu araştırmanın sonuçlarını kıyaslayıp bir sonuca ulaşmanın zor olduğunu görüşü de yaygındır. Daha ayrıntılı bilgiye şu link'ten ulaşabilirsiniz:


http://news.sciencemag.org/sciencenow/2010/03/playing-fair-came-late.html?etoc

Bu araştırma test etmeye çalıştığı durum ve bulguları açısından gerçekten ilginç bir araştırma. Fakat bulgulardan yola çıkarak ulaştıkları sonuç da bir o kadar tartışmalı çünkü kültürler arası hemen her araştırmanın karşılaşabileceği temel bir sorunla karşı karşıya. Bu araştırmadaki sorun şu: Küçük ve karmaşık olmayan toplumlarda yaşayan insanlar için adalet duygusu ve adil olmayanı cezalandırma eğilimini ölçebileceğimiz araç gerçekten bu ekonomik oyunlar mı? Ya da bu durumda bu türden ekonomik oyunları kullanmak ne kadar uygun ve işe yarar?  Bu oyunlarda ortaya konulan/kazanılacak/kaybedilecek şey “para” ya da parasal bir değer. Dünya üzerindeki birçok büyük ve karmaşık topluluk için paranın günlük hayatın çok önemli bir parçası olduğunu biliyoruz. Tam da bundan ötürü adalet normları daha çok parasal değerler üzerinden gerçekleşiyor/tartışılıyor/değerlendiriliyor olabilir. Belki bu nedenle paranın işin içine girdiği durumlarda (ya da parasal değerler işin içine girdiği için) büyük toplumlarda yaşayanlar daha hassaslar bu oyunlardaki norm ihlallerine/adaletsiz tekliflere. Ve belki de doğrudan “para” veya parasal olarak değerli olan şeyler bu küçük topluluklar için fazla bir şey ifade etmiyor olabilir. Ortaya konulan şey para değil de başka türden bir şey olsaydı, o zaman ne olacaktı? Kültürler arası yapılan çalışmalarda sonuçların farklı çıkıyor olmasının sebebi toplumların büyük-küçük, basit-karmaşık yapıda olması değil, kullanılan testin/ölçülen şeyin para ya da parasal bir değer üzerinden olması olabilir.

İnsan olmayan primatlarla yapılan çalışmalarda oynatılan oyunların yapısı orijinal halleri ile aynı olmasına rağmen kullanılan araç, yani ortaya konulan/kazanılacak/kaybedilecek olan şey, niteliği cinsinden bu oyunların öngördüğü şeyden (yani paradan) farklı. Örneğin muz. “Dünyanın farklı yerlerinde, farklı değerlerle yaşayan ve “para” kavramıyla içli dışlı olmayan insanlardaki “adalet duygusu”nu, onların daha fazla maruz kaldığı ve toplumsal değerleriyle daha uyumlu olan araçlarla ölçmek daha uygun olmaz mı?” sorusu ise bu tartışmada akla gelen ilk sorulardan biri. Bu soru sorulduktan sonra yapılacak ilk şey “para” dışında ne tür bir değerin üzerinden bu oyunların oynatılması gerektiğini bulmak. Fakat bu da kültürlerin kendilerine has özelliklerinin araştırılmasına ya da daha önceden bununla ilgili elimizde olan verilere başvurmamıza gerek olduğunu göstermektedir. O değer bulunduktan sonra tartışmanın sağlam deneysel çalışmalar ve ampirik veriler üzerinden devam ettirilmesi daha yararlı olacaktır. Çünkü sosyal ilişkiler ve sosyal kararlar işin içine girdiğinde yukarıdaki araştırmanın ulaştığı türden bir sonuca ulaşmak da, küçük toplumlarda yaşayan insanların bu oyunları anlayıp anlamadığını bilmenin imkansızlığını öne sürmek de adalet duygusunun kökenini tam olarak anlamamızda bize yardımcı olamayacaktır.

Fehr, E., & Fischbacher, U. (2003). The nature of altruism. Nature, 425, 785-.791.

Henrich, J. et al. (2010). Markets, religion, community size, and the evolution of fairness and punishment. Science, 327, 1480-1484.


1.12.2009

Kargalar, Keçiler ve Taksiler

  
20. yüzyıl felsefesinde bilginin nasıl temellendirileceği veya gerekçelendirileceği konusunda iki ana yaklaşımın var olduğu söylenebilir. Bunlardan birincisi bilgi edinme sürecini soyutlayıp normatif formel sistemlere indirgemeye çalışmıştır. Söz konusu normatif sistemler de genellikle mantık ve olasılık teorisi olmuştur. İkinci yaklaşım ise formel sistemlerden ziyade gerçek dünyada bilgi edinmeye çalışan gerçek insanları etkileyen psikolojik ve sosyal faktörlerin önemini vurgulamıştır. Mantıksal olguculuğun etkisi altında geçen 20. yüzyılın ilk yarısında birinci yaklaşım, Kuhn ve Quine’ın olguculuk eleştirisinden hareketle ortaya çıkan doğalcı ve relativist bilgi teorisinin etkisi altında geçen 20. yüzyılın ikinci yarısında ise ikinci yaklaşım daha popüler olmuştur. Bu ikinci yaklaşımın sonuçlarından biri bilgi felsefesiyle bilişsel psikolojinin yakınlaşması ve birbirini etkiler hale gelmesidir (Bishop & Trout, 2004).

Bu yazıda normatif sistemlerin bilgi edinme sürecinin anlaşılmasında önemsiz olduğunu iddia etmek gibi bir amacımız yok. Fakat normatif bir sistemden hareketle doğrudan cevap verilebilir gibi görünen bazı durumlarda bile psikolojik faktörleri hesaba katmadan tek bir doğru cevaba ulaşmanın mümkün olmadığını göstererek doğalcı yaklaşımın önemini vurgulamayı amaçlıyoruz. Burada psikolojik faktör derken özel olarak kastettiğimiz şey bilgiyi değerlendirecek ve ondan sonuç çıkaracak kişinin bilginin kendisine nasıl ulaştığıyla ilgili örtük veya açık varsayımları olacak. Bu varsayımları bilmeden normatif bir çözüme ulaşmanın mümkün olmadığını üç klasik mantık ve olasılık probleminden hareketle göstermeye çalışacağız.

1. Kargalar
Dünyayla ilgili genellemelerin nasıl doğrulanacağı mantıksal olgucuların bilim felsefesinde ilgilendikleri en temel konulardan biriydi. Mantıksal olgucuların bu konuda benimsedikleri genel strateji tümevarımdı: Tek tek gözlemlerden yola çıkarak genellemelere varmak ve genellemeleri doğrulamak için de tek tek gözlemlere başvurmak. Klasik örnek Hempel’in (1965) kargaları: Bütün kargalar siyahtır. Bu genellememizi (veya hipotezimizi) doğrulamak için kargalarla ilgili gözlemlere başvuruyoruz. Bu genellemenin doğru olduğunu gözlem sonuçlarına dayanarak ispat edemeyiz. Fakat gördüğümüz her yeni siyah karga bu genellemenin doğru olduğuna dair güvenimizi biraz daha arttırır.

Fakat şimdi bazı basit mantık kurallarını düşünelim. İki önerme birbiriyle mantıksal olarak eşdeğerse bunlardan birini doğrulayan her gözlem ötekini de doğrular, birini yanlışlayan her gözlem ötekini de yanlışlar. “Bütün kargalar siyahtır” önermesini “Bir şey karga ise siyahtır” şeklinde bir şartlı önerme olarak ifade edebiliriz. “P ise Q” şeklindeki bir şartlı önerme “Q-değil ise P-değil” şartlı önermesini gerektirdiği için  “Bir şey karga ise siyahtır” önermesi “Bir şey siyah değil ise karga değildir” önermesini gerektirir. Bu gerektirmenin tersi de doğru olduğu için bu iki şartlı önerme birbirine mantıksal olarak eşdeğerdir. Dolayısıyla birini doğrulayan bir gözlem ötekini de doğrular.

Bu basit mantıksal analiz bilim felsefecilerini neden ilgilendiriyor? Çünkü bu analiz tümevarımın reductio ad absurdum’u (saçmaya indirgeme) niteliğini taşıyor. Gözlemlediğimiz siyah kargaların “Bir şey karga ise siyahtır” önermesini desteklemesi gibi gözlemlediğimiz beyaz ayakkabılar ve sarı kanaryalar da “Bir şey siyah değilse karga değildir” önermesini destekler. Bu iki önerme mantıksal açıdan eşdeğer olduğuna göre gözlemlediğimiz her beyaz ayakkabı aynı zamanda “Bütün kargalar siyahtır” önermesine güvenimizi biraz daha arttırır. Yani ayakkabıları incelemek de ornitolojiye (kuşbilim) bir katkıdır.

Tümevarım ilkesinin karşılaştığı en çarpıcı zorluklardan biri olan bu örnek bilim felsefecilerini 40 yıldır meşgul etmeye devam ediyor. Örneği ilk ortaya atan mantıksal olgucu Hempel’in düşüncesine göre ortada aslında gerçek bir sorun yoktur. Mantık bunu gerektiriyorsa beyaz ayakkabıların “Bütün kargalar siyahtır” önermesini desteklediği kabul edilmelidir. Fakat bilim felsefecilerinin çoğunluğu burada sağduyularına güvenip ortada mantıksal bir sorun olduğunu düşünüyorlar. Bu sorunu giderme girişimlerinden bir tanesine kısaca bakalım.

Bu görüşe göre bir gözlem bilgisinin bir teorik önermeye destek sağlayıp sağlamaması bilginin içeriği kadar o bilginin bize nasıl ulaştığıyla, nasıl bir prosedürle o bilgiyi elde ettiğimizle ilişkilidir (Godfrey-Smith, 2003). “Bütün kargalar siyahtır” önermesini nasıl bir prosedürle test ettiğimizi düşünelim. Gördüğümüz her siyah karga bu önermeyi destekler mi? Siyah karga gözlemini nasıl yaptığımıza bağlı olarak destekleyebilir de desteklemeyebilir de. Eğer bir karga topluluğu içinden rasgele gözlemler yapıyorsak bunların siyah çıkması yukarıdaki önermeyi destekler. Fakat bir siyah nesneler topluluğu içinden rasgele gözlemler yapıyorsak bunların karga çıkması yukarıdaki önermeyi desteklemez. Her iki durumda da gözlemlediğimiz şeylerin siyah kargalar olmasına rağmen birinde önerme destekleniyor, diğerinde ise önermeyi test eden (doğrulama veya yanlışlama potansiyeli olan) bir gözlem yapmış olmuyoruz. Bunun neden böyle olduğunu daha açık görebilmek için önermemizi gene koşullu önerme şeklinde ifade edelim: “Bir şey karga ise siyahtır.” Bu önerme doğruysa gözlemlediğimiz kargaların siyah olması gerekir. Fakat gözlemlediğimiz siyah şeylerin karga olması gerekmez. Dolayısıyla gözlemlediğimiz karganın siyah çıkıp çıkmaması önermeyi test eden bir bilgiyken gözlemlediğimiz siyah şeyin karga çıkıp çıkmaması önermeyi test eden bir bilgi değildir.

Aynı akıl yürütmeyi beyaz ayakkabı örneği için de düşünebiliriz. Gözlemlediğimiz beyaz ayakkabılar “Bütün kargalar siyahtır” önermesini destekler mi? Hempel tümevarım ilkesi artı bazı mantık kuralları gereği buna evet cevabını verirken birçok kişi sağduyuya dayanarak hayır deme eğiliminde. Bahsettiğimiz görüşe göre ise destekleyip desteklememe gene o bilginin bize nasıl ulaştığına bağlıdır. Önermemizin eşdeğeri olan “Bir şey siyah değilse karga değildir” önermesini düşünelim. Bir siyah olmayan şeyler (mesela beyaz şeyler) topluluğu içinden rasgele gözlemler yapıyorsak ve bunlar karga çıkmıyorsa (mesela ayakkabı çıkıyorsa) bu gözlemler “Bütün kargalar siyahtır” önermesini destekler. Fakat bir karga olmayan şeyler (ayakkabılar) topluluğu içinden rasgele gözlemler yapıyorsak ve bunlar siyah değil de beyaz çıkıyorsa bu gözlemler önermemizi desteklemez, zira o önermeyi test edebilecek bir gözlem niteliği taşımaz. Gene her iki durumda da gözlemlenen şeyler aynı (beyaz ayakkabı) olmasına rağmen birinde önerme destekleniyor, diğerinde desteklenmiyor.

Beyaz ayakkabı gözlemi dediğimiz zaman normal şartlarda insanın aklına beyaz olduğu bilinen bir şeyin test sonucu ayakkabı olduğunun belirlenmesi gelmediği için beyaz ayakkabıların “Bütün kargalar siyahtır” önermesini destekleyebileceği fikri ilk bakışta hiç makul görünmüyor. Fakat o bilgiyi nasıl bir prosedürle elde ettiğimizi de hesaba katınca ilk bakışta makul görünmeyen şeyin bazı durumlarda mümkün olabileceği kabul edilebilir hale gelebilir. Psikoloji laboratuvarında yapılan deneyler de insanların bazı şartlar altında bunun gerçekten mümkün olabileceğini kabul ettiğini gösteriyor (McKenzie & Mikkelsen, 2000; psikolojideki akıl yürütme literatürüne aşina okuyucular buradaki analizin Wason kart seçme testine benzerliğini farkedeceklerdir; bak. Wason & Johnson-Laird, 1972).

2. Keçiler
İkinci örneğimiz klasik bir olasılık bilmecesi. 1960’larda ABD televizyonlarında yayınlanan bir yarışma programından esinlenen bir bilmece olduğu için programın sunucusuna atfen Monty Hall bilmecesi olarak biliniyor (Krauss & Wang, 2003; Nickerson, 1996). Yarışmada üç tane kapalı kapı var. Kapılardan birinin arkasında bir otomobil, diğer ikisinin arkasında birer keçi var. Yarışmacının amacı doğru kapıyı seçip otomobili kapmak. Kapılara A, B ve C kapıları diyelim. Yarışmacı önce rasgele bir kapı seçiyor. Farzedelim ki A kapısını seçti. Bunun üzerine sunucu geri kalan iki kapıdan birini açıyor ve kapının arkasında bir keçi olduğu ortaya çıkıyor. Farzedelim ki sunucu B kapısını açtı. Bu durumda açılmamış iki kapı var: A ve C kapıları. Sunucu yarışmacıya dönüp tercihini değiştirmek, yani C kapısına geçmek isteyip istemediğini soruyor. Bilmece de aslında bu soru: B’nin arkasında keçi olduğu ortaya çıktıktan sonra A kapısından C kapısına geçmek otomobili bulma olasılığını arttırır mı, azaltır mı, yoksa bir şey farketmez mi?

Burada birçok kişinin ilk eğilimi bir şey farketmez diye cevap vermek. Bu kişilerin arasında matematik profesörleri de var (Krauss & Wang, 2003). Buna göre başta otomobilin bulunma olasılığı her kapı için 1/3’tü. Bir kapı devreden çıktıktan sonra olasılığın geri kalan iki kapı arasında eşit olarak paylaşılması gerekir. Dolayısıyla B açıldıktan sonra A ve C kapılarının her birinin arkasında otomobil olma ihtimali ½’ye yükselir. Yani C’yi A’ya tercih etmek için bir sebep yoktur.

Fakat bu basit analiz bilmecenin içinde geçmeyen ama bilmecenin içeriği itibariyle farzedilmesi gereken önemli bir bilgiyi gözardı ediyor. O da şu: Sunucu otomobilin hangi kapının arkasında olduğunu biliyor ve hiçbir zaman o kapıyı açmıyor. Bunun neden bilmecenin çözümünde bir fark yarattığını görelim.

Otomobilin A kapısının arkasında olduğunu farzedelim. Bu durumda “tercihini değiştir” stratejisiyle oynayan bir yarışmacının ilk tercihine ve sunucunun açtığı kapıya göre hangi durumlarda otomobili bulup hangi durumlarda bulamayacağına bakalım:

1. Yarışmacı A kapısını seçer; sunucu diğer iki keçili kapıdan birini açar (diyelim ki B’yi); yarışmacı tercihini değiştirip C kapısına geçer; ve otomobili bulamaz.
2. Yarışmacı B kapısını seçer; sunucu A’nın arkasında otomobil olduğundan C kapısını açar; yarışmacı tercihini değiştirip A kapısına geçer; ve otomobili bulur.
3. Yarışmacı C kapısını seçer; sunucu A’nın arkasında otomobil olduğundan B kapısını açar; yarışmacı tercihini değiştirip A kapısına geçer; ve otomobili bulur.

Yani “tercihini değiştir” stratejisiyle oynayan bir yarışmacı oynadığı oyunların 2/3’ünde otomobili bulur. “Tercihini değiştirme” stratejisiyle oynayan bir yarışmacının otomobili bulma olasılığının 1/3 olduğu da benzer bir analizle gösterilebilir. Şu halde sunucunun keçili bir kapıyı açması diğer iki kapının otomobilli olma olasılığını ½’ye yükseltmiyor. Birini 2/3’e yükseltirken diğeri (yarışmacının ilk seçtiği kapı) 1/3’te kalıyor.

Bu klasik bilmecenin standart çözümü bu. Fakat bu standart çözümde belirgin hale getirilmemiş bir varsayımla geçiştirilen muğlak bir nokta var. O da sunucunun, yarışmacının ilk tercihi otomobilli kapı olduğunda geri kalan iki keçili kapıdan hangisini açacağına nasıl karar verdiği. Yukarıdaki çözümde meseleyi “iki kapıdan birini açar” diyerek geçiştirdik. Yani rasgele seçer demek istedik. Oysa bilmecenin sunuluşunda sunucunun böyle bir stratejiye sahip olduğu belirtilmiyor. Öyleyse sunucunun iki keçili kapıdan birini rasgele seçmemesi durumunda bunun bilmecenin çözümünde bir fark yaratıp yaratmayacağını görelim.

Otomobilin gene A kapısının arkasında olduğunu farzedelim. Sunucumuz da gene her zaman keçili bir kapıyı açıyor. Fakat yarışmacı ilk olarak A kapısını seçtiğinde sunucu B ve C kapılarından birini rasgele seçmek yerine her zaman B kapısını açıyor. Yarışmacı da sunucunun mümkünse A kapısını, olmazsa B kapısını, o da olmazsa C kapısını açma stratejisine sahip olduğunu biliyor. (Yarışmacı otomobilin A’da olduğunu bilmediği için sunucunun A’yı açmayacağını bilemez.) Bu durumda sunucunun, yarışmacının ilk tercihinden sonra C kapısını açması yarışmacıya otomobilin kesin olarak nerede olduğunu tesbit etme imkanı verir. Çünkü sunucu diğer iki kapıyı birinde otomobil olduğu, diğeri de yarışmacının tercihi olduğu için açmamıştır. C kapısı açıldığında tercihini değiştirmek yarışmacının otomobili bulma olasılığını 1’e çıkarır. A kapısı açıldığında ise tercihini değiştirip değiştirmemek yarışmacı için bir şey farkettirmez. Çünkü arkasında otomobil olmadığında sunucu her zaman A kapısını açacaktır ve otomobilli olmadığı da zaten açıldığında görüldüğü için bunu bilmek bir avantaj sağlamaz. Otomobilin B’de veya C’de olma olasılığı ½’dir.

Bu gene karar vermede sahip olunan bilgi yanında o bilgiye ulaşmayı sağlayan prosedürü de bilmenin önemine dair bir örnek.  Burada bilgi açılan kapının arkasından keçi çıkması, bilginin bize ulaşmasını sağlayan prosedür de sunucunun kapı açma stratejisi anlamına geliyor. Sunucunun stratejisini bilmezsek açılan kapının arkasından keçi çıkmasından hareketle ne sonuca varacağımızı, tercihimizi değiştirmenin avantajlı olup olmadığını bilemeyiz.
           
3. Taksiler
Son örneğimiz psikolojideki karar verme literatüründen. Tversky, Kahneman ve diğerlerinin katkılarıyla 1970’lerden beri gelişen bu literatürün vardığı ana sonuç insanların belirsizlik altında tercih yapma ve karar vermeyi gerektiren problemlerde kullanmaları gereken mantık ve olasılık kurallarını kullanmadıkları, onun yerine bazı kestirme yöntemler kullandıkları ve bu yüzden bu problemlerde sistematik hatalar yaptıkları (bak. Kahneman ve ark., 1982). Bu hatalar insanların rasyonel olup olmadığını sorgulamaya kadar gittiği için psikologların, felsefecilerin, istatistikçilerin ve ekonomistlerin içinde olduğu bir camiada hararetli tartışmalara sebep olmaya devam ediyor (bak. Cohen, 1981; Gigerenzer, 1998; Shafir & LeBoeuf, 2002).

Bu literatürde en sık kullanılan problem türlerinden biri karar verirken gelen yeni bilginin yanında temel oran (base rate) bilgisini de hesaba katmayı gerektirenler (Bar-Hillel, 1980). Mavi-yeşil taksiler problemini ele alalım. Buna göre bir şehirdeki taksilerin %85’i mavi, %15’i yeşildir. Bir taksi gece yarısı bir yayaya çarpıp kaçmıştır ve gözü iyi görmeyen görgü tanığının ifadesine göre taksinin rengi yeşildir. Tanık loş ışıkta test edildiğinde maviyle yeşili başarıyla ayırt etme oranının %80 olduğu görülmüştür. Buna göre söz konusu taksinin gerçekten yeşil olma ihtimali nedir?

Bu sorunun Bayes teoremi kullanılarak basitçe bulunabilecek bir cevabı var. Daha önce verilen örneklere de uygulanabilir olması ve daha genel bir mesajı vermeye imkan tanıması nedeniyle bu teoremin çıkarılışını ve bu probleme uygulanışını adım adım görelim.

Bayes teoremi bize eski bilgilerin olasılığının yeni bilgiler ışığında nasıl değiştirileceğini söyler. Bilimsel pratiğe uyarlayacak olursak bir hipotezin (H) olasılığının bir gözlem sonucuna (G) göre nasıl değiştiğini söyler:
P(H|G) = P(G|H) x P(H) / P(G)                                                          (1)
P(H|G) gözlem sonucu ışığında hipotezin olasılığı, P(G|H) ise hipotez doğruysa böyle bir gözlem elde etme olasılığıdır. İlk bakışta hemen kavranamayan bu denklem aslında temel olasılık kurallarından kolayca çıkarılabilir. Olasılık teorisinin aksiyomlarından birine göre A ve B olaylarının beraberce meydana gelme olasılığı A’nın olasılığıyla A olduğunda B olma olasılığının çarpımına eşittir:
            P(A&B) = P(A) x P(B|A)                                                                   (2)
B ve A olaylarının beraberce meydana gelme olasılığı için de benzer bir denklem yazılabilir:
            P(B&A) = P(B) x P(A|B)                                                                   (3)
Fakat P(A&B) ile P(B&A) elbette ki birbirine eşittir. Bu durumda (2) ve (3) numaralı denklemlerin sağ tarafları da birbirine eşittir:
            P(A) x P(B|A) = P(B) x P(A|B)                                                          (4)
Burada P(A)’yı sağ tarafa geçirirsek (1) numaralı denklemde hipotez ve gözlem için yazdığımızın aynısını elde etmiş oluruz.
  
Şimdi taksi sorusuna Bayes denklemini uygulayalım. P(G)’yi şu şekilde hesaplayabiliriz:
            P(G) = [P(H) x P(G|H)] + [P(~H) x P(G|~H)]
Burada P(~H) hipotezin doğru olmama olasılığıdır. Yani hipotezin doğru olması ve gözlemin elde edilmesi olasılığı ile hipotezin doğru olmaması ve gözlemin elde edilmesi olasılığını ayrı ayrı topluyoruz. Taksi örneğinde gözlem tanığın taksinin rengine yeşil demesi, hipotez ise taksinin renginin gerçekten yeşil olmasıdır. Ortada bir gözlem olmadığında hipotezin doğru olma olasılığı yeşil taksilerin bütün taksilere oranı olan .15’tir. Taksi gerçekten yeşilse tanığın yeşil demesinin, yani yeni gelen bilginin olasılığı ise .80’dir. Bu durumda
            P(H|G) = .80 x .15 / [(.15 x .80) + (.85 x .20)] = .41
Yani görgü tanığının taksinin yeşil olduğunu söylemesine rağmen taksinin gerçekten yeşil olma olasılığı mavi olma olasılığından daha düşüktür.
  
Taksi sorusu sorulan herkesin Bayes teoremini bilmesi ve soruda doğru bir şekilde kullanması beklenemez. Fakat en azından şu beklenebilir: Ortada görgü tanığı olmadığında taksinin yeşil olma olasılığı .15’tir. Tanığın ifadesinden sonra bu olasılık artacaktır. Tanığın tek bir yeşil taksiyi doğru tanıma olasılığı ise .80’dir. Taksi mavi taksilerin çoğunlukta olduğu bir topluluk içinden rasgele seçildiğine göre bu olasılık düşecektir. Yani Bayes teoremini bilmeyen biri bile taksinin gerçekten yeşil olma olasılığının temel oran olan .15’in üstünde fakat .80’in altında olduğunu tahmin edebilir. Fakat yapılan deneyler birçok kişinin bu ve benzeri sorularda temel oranı tamamen ihmal edip .80 cevabını verme eğiliminde olduğunu gösteriyor. Bu hata temel oran hatası (base rate fallacy) adıyla karar verme literatüründe önemli bir yere sahip.

Fakat bu standart cevabı hata olarak nitelemeden önce sorudaki varsayımların yeterince açık olmaması yüzünden cevaplayanın bizim düşünmediğimiz bir varsayım yapıp yapmadığını göz önüne almak gerekir. Burada soruyu soranın yaptığı varsayım örneğin (bu durumda taksinin) rasgele seçildiğidir. Aksi halde Bayes teoremini kullanmak mümkün olmaz. Bu sorunun bazı versiyonlarında ise cevap verenin bu varsayımı yapmadığını, dolayısıyla da Bayesçi düşünmemesinin bir hata sayılamayacağını düşündürecek bulgular var. Mesela insanlara %85’i psikolog, %15’i mühendis olan bir topluluk içinden seçilen bir kişinin özellikleri okunduğunda bu özellikler mühendise yakınsa insanlar seçilen kişinin çok yüksek oranda mühendis olduğunu tahmin ediyorlar. Yani karar verirken topluluğun çoğunluğunun psikolog olduğuna dair temel oran bilgisini ihmal ediyorlar. Oysa insanlara kişinin seçiminin rasgele olduğu bilgisi çok net bir şekilde iletilirse, mesela insanlar bu kişinin özelliklerinin yazılı olduğu kağıdı kendileri bir kutunun içinden rasgele seçerlerse, çok daha yüksek oranda Bayesçi düşünmenin gerçekleştiği, temel oranın ihmal edilmediği görülüyor (Gigerenzer ve ark. 1988). Yani insanlar aslında bilginin kendilerine nasıl bir prosedürle geldiği konusuna duyarlılar. Deneyde aksi yönde düşünmelerini sağlayacak bir müdahale olmadığı sürece gelen bilginin rasgele seçilmiş olamayacağı, bunun deneyci tarafından özel olarak seçildiği varsayımını yapıyorlar ve bunu da temel oran bilgisini ihmal etmek için yeterli bir sebep olarak görüyorlar.

Temel oran hatasının tamamen bu şekilde açıklanmasının doğru olup olmadığıyla ilgili tartışmalar psikoloji literatüründe sürüyor (Barbey & Sloman, 2007; Koehler 1996; Krynski &; Tenenbaum, 2007). Fakat en azından bazı durumlarda bu açıklama doğruysa bile bu, rasyonel olmamakla suçlanan insanların aslında deneycinin niyetlerini de işin içine katan, bilginin kendilerine nasıl ulaştığına duyarlı olan adeta kurnazca bir rasyonelliğe sahip olduklarını gösteren bir örnek.

Sonuç
Görüldüğü gibi bilgi edinme sürecinin niteliği ve bu süreçle ilgili örtük varsayımlar gelen bilgiden hareketle ne sonuca varılması gerektiğini etkiliyor. Bu durumda bu varsayımlar sadece bilgi edinme süreciyle betimleyici düzeyde ilgilenen psikologları değil, bilgi edinmenin normatif yönüyle ilgilenen felsefecileri ve istatistikçileri de ilgilendiriyor. Mantığı ve olasılık teorisini sadece formel sistemler olarak gören yaklaşımın hala cazip tarafları olsa da, sıradan insanların bu tür problemlerle karşılaştığında formel sistem anlayışına uymayan cevaplarının altında yatan sebeplerin incelenmesi ve pratikte kullanılmaya uygun normatif modellerin bu incelemelerden hareketle geliştirilmesi bizce çok daha verimli ve heyecan verici bir yaklaşım.



Kaynaklar


Bar-Hillel, M. (1980). The base rate fallacy in probability judgments. Acta Psychologica, 44, 211-233. 


Barbey, A. K., & Sloman, S. A. (2007). Base-rate respect: From ecological rationality to dual processes. Behavioral and Brain Sciences, 30, 241-254.


Bishop, M. A., & Trout, J. D. (2004). Epistemology and the psychology of human judgment. New York: Oxford University Press.


Cohen, L. J. (1981). Can human irrationality be experimentally demonstrated? Behavioral and Brain Sciences, 4, 317-370.

Gigerenzer, G. (1998). Ecological intelligence: An adaptation for frequencies. In D. D. Cummins & C. Allen (Eds.), The evolution of mind (pp. 9-29). New York: Oxford University Press. 


Gigerenzer, G., Hell, W., & Blank, H. (1988). Presentation and content: The use of base rates as a continous variable. Journal of Experimental Psychology: Human Perception and Performance, 14, 513-525.


Godfrey-Smith, P. (2003). Theory and reality: An introduction to the philosophy of science. Chicago: University of Chicago Press.


Hempel, C. G. (1965). Aspects of scientific explanation and other essays in the philosophy of science. New York: Free Press.


Kahneman D., Slovic P., & Tversky, A. (1982). Judgment under uncertainty: Heuristic and biases. Cambridge, UK: Cambridge University Press.


Koehler, J. J. (1996). The base rate fallacy reconsidered: Descriptive, normative, and methodological challenges. Behavioral and Brain Sciences, 19, 1-53. 


Krauss, S., & Wang, X. T. (2003). The psychology of the Monty Hall problem: Discovering psychological mechanisms for solving a tenacious brain teaser. Journal of Experimental Psychology: General, 132, 3-22.


Krynski, T. R., & Tenenbaum, J. B. (2007). The role of causality in judgment under certainty. Journal of Experimental Psychology: General, 136, 430-450.


McKenzie, C. R. M., & Mikkelsen, L. A. (2000). The psychological side of Hempel’s paradox of confirmation. Psychonomic Bulletin & Review, 7, 360-366.


Nickerson, R. S. (1996). Ambiguities and unstated assumptions in probabilistic reasoning. Psychological Bulletin, 120, 410-433.


Shafir, E., & LeBoeuf, R.A.  (2002).  Rationality. Annual Review of Psychology, 53, 491-517.


Wason, P. C., & Johnson-Laird, P. N. (1972). Psychology of reasoning: Structure and content. Cambridge, MA: Harvard University Press.