1. GEREKSİZ OLANAKLAR.
Bu notun sonraki iki bölümü, standart karar teorisi araçlarını kullanarak "daha büyük olan tahmin" ve "iki zarf" problemlerini analiz etmektedir (2). Bu yaklaşım, her ne kadar açık olsa da, yeni gibi görünmektedir. Özellikle, iki zarf problemi için “daima geçiş” veya “asla geçiş yapma” prosedürlerinden açıkça üstün olan bir dizi karar prosedürünü tanımlar.
Bölüm 2 (standart) terminoloji, kavramlar ve gösterimi tanıtır. "Daha büyük sorun olan tahmin" için olası tüm karar prosedürlerini analiz eder. Bu materyale aşina olan okuyucular bu bölümü atlamak isteyebilir. Bölüm 3, iki zarf sorununa benzer bir analiz uygular. Bölüm 4, sonuçlar, kilit noktaları özetlemektedir.
Bu bulmacaların tüm yayınlanmış analizleri, doğanın olası durumlarını yöneten bir olasılık dağılımı olduğunu varsayar. Ancak bu varsayım, bulmaca ifadelerinin bir parçası değildir. Bu analizlerin ana fikri, bu (gereksiz) varsayımı bırakmanın, bu bulmacalardaki görünür paradoksların basit bir çözümüne yol açmasıdır.
2. “DAHA BÜYÜK OLAN GUESS” SORUNU.
Bir deneyci farklı gerçek sayılar söylenir ve x 2 kağıt iki slipleri üzerine yazılır. Rastgele seçilen bir fişteki numaraya bakar. Sadece bu tek gözlemden yola çıkarak, iki sayıdan daha küçük veya daha büyük olduğuna karar vermelidir.x1x2
Olasılıkla ilgili bu gibi basit ama açık uçlu sorunlar kafa karıştırıcı ve sezgisel olduğu için kötü şöhretlidir. Özellikle, olasılığın resme girmesinin en az üç farklı yolu vardır. Bunu açıklığa kavuşturmak için, resmi deneysel bir bakış açısını benimseyelim (2).
Bir kayıp işlevi belirterek başlayın . Amacımız, aşağıda tanımlanacak bir anlamda beklentisini en aza indirmek olacaktır. Deneyci doğru tahmin ettiğinde kaybı , aksi takdirde 0'a eşit yapmak iyi bir seçimdir . Bu kayıp fonksiyonunun beklentisi yanlış tahmin etme olasılığıdır. Genel olarak, yanlış tahminlere çeşitli cezalar vererek, bir kayıp fonksiyonu doğru tahmin etme amacını yakalar. Şüphesiz, bir kayıp fonksiyonunun benimsenmesi, x 1 ve x 2'de daha önce bir olasılık dağılımı varsaymak kadar keyfi 10x1x2ancak daha doğal ve temeldir. Karar vermekle karşı karşıya kaldığımızda, doğal olarak doğru ya da yanlış olmanın sonuçlarını düşünürüz. Her iki durumda da sonuç yoksa, neden ilgileniyorsunuz? (Akılcı) bir karar verdiğimizde dolaylı olarak potansiyel kayıp düşüncelerini üstleniriz ve bu nedenle açık bir kayıp değerlendirmesinden yararlanırken, kağıt fişleri üzerindeki olası değerleri tanımlamak için olasılık kullanımı gereksiz, yapay ve - olarak yararlı çözümler elde etmemizi engelleyebiliriz.
Karar teorisi gözlemsel sonuçları ve bunları analiz etmemizi modeller. Üç ek matematiksel nesne kullanır: bir örnek alan, bir dizi “doğa durumu” ve bir karar prosedürü.
Numune alanı olası tüm gözlemlerden oluşur; burada R (gerçek sayılar kümesi) ile tanımlanabilir. SR
Doğa durumları , deneysel sonucu yöneten olası olasılık dağılımlarıdır. (Bu, bir olayın “olasılığı” hakkında konuşabileceğimiz ilk anlamdır.) “Daha büyük olan tahmin” probleminde, bunlar, eşit olasılıklarla farklı gerçek x 1 ve x 2 değerlerinde değerler alan ayrı dağılımlardır. arasında 1Ωx1x2Her değerde 2 . Ω{ω=(x1,x2) ile parametrelendirilebilir∈R×R| x1>x2}.12Ω{ω=(x1,x2)∈R×R | x1>x2}.
Karar alan ikili dizi olası kararlar.Δ={smaller,larger}
Bu terimlerle, kayıp fonksiyonu üzerinde tanımlanan gerçek değerli bir fonksiyondur . Bize bir kararın gerçekliğe (ilk argüman) kıyasla ne kadar “kötü” olduğunu (ikinci argüman) anlatır.Ω×Δ
En genel karar prosedürü deneyi için uygun a, randomize bir: herhangi bir deneysel sonuç için değeri bir olasılık dağılımıdır Ô . Yani, x sonucunu gözlemlemeye karar verilmesi kesin olarak kesin değildir, daha ziyade δ ( x ) dağılımına göre rastgele seçilmelidir . (Bu, olasılığın dahil olabileceği ikinci yoldur.)δΔxδ(x)
sadece iki unsura sahip olduğunda , herhangi bir randomize prosedür, önceden belirlenmiş bir karara atama olasılığı ile tanımlanabilir, ki bu somut olarak “daha büyük” olacağız. Δ
Fiziksel bir değiştirici uygulayan bir ikili randomize prosedür: serbest dönüşlü işaretçi bir karar tekabül eden, üst alanında durdurmak için gelecek olasılıkla, ö olasılık ile sol alt durur, aksi halde, ve 1 - δ ( x ) . Dönücü tamamen δ ( x ) ∈ [ 0 , 1 ] değeri belirlenerek belirlenir .Δδ1−δ(x)δ(x)∈[0,1]
Dolayısıyla bir karar prosedürü bir fonksiyon olarak düşünülebilir
δ′:S→[0,1],
nerede
Prδ(x)(larger)=δ′(x) and Prδ(x)(smaller)=1−δ′(x).
Tersine, bu tür herhangi bir fonksiyon rastgele bir karar prosedürü belirler. Randomize kararlar özel durumda deterministik kararlar dahil burada aralığı ö ' yatmaktadır { 0 , 1 } .δ′δ′{0,1}
Bize diyelim maliyeti bir karar prosedür bir sonuç için x beklenen kaybı δ ( x ) . Beklenti olasılık dağılımı ile ilgili olan ö ( x ) bir karar alanı ile Ô . Niteliği her bir durumu w (ki, hatırlama, örnek alan bir binom olasılık dağılımıdır S ) bir prosedür beklenen maliyet belirler ö ; bu riski arasında ö için w , Risk δ ( ω )δxδ(x)δ(x)ΔωSδδωRiskδ(ω). Burada, doğa durumu ile ilgili beklenti alınır .ω
Karar prosedürleri risk fonksiyonları açısından karşılaştırılır. Doğa durumu gerçekten bilinmemektedir, zaman ve δ iki prosedürleri vardır ve Risk ε ( ω ) ≥ Risk δ ( ω ) herkes için w , daha sonra prosedür kullanılarak hiçbir anlamı yoktur £ değenni prosedürü nedeniyle, δ daha kötü asla ( ve bazı durumlarda daha iyi olabilir). Böyle bir prosedür, ε olan kabul edilemezεδRiskε(ω)≥Riskδ(ω)ωεδε; aksi takdirde kabul edilebilir. Genellikle birçok kabul edilebilir prosedür vardır. Bunlardan herhangi birini “iyi” olarak değerlendireceğiz, çünkü hiçbiri tutarlı bir şekilde başka bir prosedürle gerçekleştirilemez.
( (1) terminolojisinde “ C için karma bir strateji”) üzerinde önceden bir dağıtım yapılmadığını unutmayın . Bu, olasılığın sorunlu ayarın bir parçası olabileceği üçüncü yoldur. Bunu kullanmak, mevcut analizi (1) ve referanslarından daha genel hale getirirken, daha basittir.ΩC
Tablo 1 değerlendirir doğasının gerçek durum ile verilmektedir riski X 1 > x 2 olduğunu hatırlayın .ω=(x1,x2).x1>x2.
Tablo 1.
Decision:Outcomex1x2Probability1/21/2LargerProbabilityδ′(x1)δ′(x2)LargerLoss01SmallerProbability1−δ′(x1)1−δ′(x2)SmallerLoss10Cost1−δ′(x1)1−δ′(x2)
Risk ( x1, x2) : ( 1 - δ '( x1) + δ'( x2) ) / 2.
Bu anlamda “daha büyük olan tahmin” problemi
Hakkında hiçbirşey bilmediğin Verilen ve x 2 Ayrı oldukları, bir karar prosedürü bulabilirsiniz hariç Í riski olan [ 1 - δ ' ( max ( x 1 , x 2 ) ) + δ ' ( dk ( x 1 , x 2 ) ) ] / 2 mutlaka daha az olduğu 1x1x2δ[ 1 - δ'( maks. ( x1, x2) ) + δ'(min(x1,x2))]/2 ?12
Bu ifade, x > y olduğunda gerektirmeye eşdeğerdir . Bu nedenle, deneycinin karar prosedürünün kesin olarak artan bazı fonksiyonlarla belirlenmesi gereklidir ve yeterlidir δ ′ : S → [ 0 , 1 ] . Bu prosedür seti , 1'in tüm “karışık stratejileri Q ” nu içerir, ancak bundan daha büyüktür . Orada bir sürüδ′(x)>δ′(y)x>y.δ′:S→[0,1].Q rastgele herhangi bir prosedürden daha iyi olan rastgele karar prosedürleri!
3. “İKİ ZARF” SORUNU.
Bu basit analizin, daha önce tanımlanmayan iyi olanlar da dahil olmak üzere , “daha büyük tahmin” sorununa geniş bir çözüm seti ortaya koyması cesaret vericidir . Bakalım aynı yaklaşım önümüzdeki diğer sorun hakkında ne ortaya çıkarabilir, “iki zarf” problemi (ya da bazen de adlandırıldığı gibi “kutu problemi”). Bu, biri diğerinden iki kat daha fazla paraya sahip olduğu bilinen iki zarftan birini rastgele seçerek oynanan bir oyunla ilgilidir. Zarfı açtıktan ve x miktarını gözlemledikten sonra x İçinde para varsa, oyuncu parayı açılmamış zarfta tutmaya (“geçmek”) veya parayı açık zarfta tutmaya karar verir. Anahtarlama ve anahtarlama yapmamanın eşit derecede kabul edilebilir stratejiler olduğu düşünülebilir, çünkü oyuncu hangi zarfın daha büyük miktarda içerdiği konusunda aynı derecede belirsizdir. Bunun payoffs arasında “eşit muhtemel” alternatifleri sunuyor çünkü paradoks, yani anahtarlama üstün seçenek gibi görünüyor olduğunu ve x / 2 , içinde bekleyen değeri 5 x / 4 açılmış zarf içinde değerini aşıyor. Her iki stratejinin de deterministik ve sabit olduğunu unutmayın.2xx/2,5x/4
Bu durumda, resmen yazabiliriz
SΩΔ={x∈R | x>0},={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},and={Switch,Do not switch}.
Daha önce olduğu gibi, herhangi bir karar prosedürü , S'den [ 0 , 1 ] ' e bir fonksiyon olarak düşünülebilir , bu kez tekrar değiştirilememe olasılığı ile ilişkilendirilerek tekrar δ ′ ( x ) yazılabilir . Anahtarlama olasılığı elbette tamamlayıcı değer 1 - δ ′ ( x ) olmalıdır .δS[0,1],δ′(x)1–δ′(x).
Tablo 2'de gösterilen kayıp, oyunun getirisinin negatifidir. Doğanın gerçek durumunun , x sonucunun ( ω veya 2 ω olabilir ) ve sonuca bağlı olan kararın bir fonksiyonudur.ωxω2ω
Tablo 2.
Outcome(x)ω2ωLossSwitch−2ω−ωLossDo not switch−ω−2ωCost−ω[2(1−δ′(ω))+δ′(ω)]−ω[1−δ′(2ω)+2δ′(2ω)]
Kayıp fonksiyonunun gösterilmesine ek olarak, Tablo 2 ayrıca keyfi bir karar prosedürünün maliyetini de hesaplar . Oyun eşit olasılıkları ile iki sonuç ürettiği için 1δ ,ω doğanın gerçek durumuolduğunda risk 12ω
Riskδ(ω)=−ω[2(1−δ′(ω))+δ′(ω)]/2+−ω[1−δ′(2ω)+2δ′(2ω)]/2=(−ω/2)[3+δ′(2ω)−δ′(ω)].
Her zaman anahtarlama ( ) veya her zaman ayakta duran pat ( δ ′ ( x ) = 1 ) anlamına gelen sabit bir prosedür risk taşır - 3 ω / 2 . Kesinlikle artan herhangi bir işlev veya daha genel olarak, tüm pozitif gerçek x için δ ′ ( 2 x ) > δ ′ ( x ) olan [ 0 , 1 ] aralığında herhangi bir δ ′ işleviδ′(x)=0δ′(x)=1−3ω/2δ′[0,1]δ′(2x)>δ′(x) Bir prosedür tespit δ az kesinlikle her zaman bir risk fonksiyonuna sahip - 3 ω / 2 doğası gerçek durum ne olursa olsun, ve böylece her iki sabit prosedüre göre daha üstündür w ! Dolayısıyla, sabit prosedürler kabul edilemezçünkü doğanın durumuna bakılmaksızın bazen daha düşük ve asla daha yüksek riskli prosedürler vardır.x,δ−3ω/2ω
Bunu “daha büyük tahmin” probleminin önceki çözümü ile karşılaştırmak, ikisi arasındaki yakın bağlantıyı gösterir. Her iki durumda da, uygun şekilde seçilmiş bir randomize prosedür "bariz" sabit stratejilerden belirgin şekilde üstündür .
Bu randomize stratejilerin bazı önemli özellikleri vardır:
Rastgele stratejiler için kötü durumlar yoktur: zarftaki para miktarı nasıl seçilirse seçilsin, uzun vadede bu stratejiler sabit bir stratejiden daha kötü olmayacaktır.
Sınırlandırıcı değerleri ile randomize bir strateji ve 1 baskındır diğerlerinin herhangi biri: beklentisi ise ö zaman ( ω , 2 ω ) zarf içinde bir beklentisi aşan £ değerinin , daha sonra başka bir olası durumunu vardır ( r | , 2 η ) zarflarda ve ε beklentisi δ beklentisini aşıyor .01δ(ω,2ω)ε(η,2η)εδ
stratejiler içerir Özel durumlarda, Bayes stratejilerinin birçok eşdeğer stratejiler olarak. “ X , bir eşik T eşik değerinden düşükse ve aksi halde kal ” durumunda herhangi bir strateji, aksi takdirde x ≥ T , δ ( x ) = 0 olduğunda δ ( x ) = 1'e karşılık gelir .δxTδ(x)=1x≥T,δ(x)=0
Öyleyse, argümanda her zaman değişimin yanılgısı nedir? Alternatifler için herhangi bir olasılık dağılımı olduğu örtülü varsayımda yatmaktadır. Spesifik olarak, açılmış zarfta gözlemledikten sonra, geçiş için sezgisel argüman , doğanın temel halleri kümesinde tanımlanan olasılıklar olan koşullu olasılıklar Prob'a (açılmamış zarfta | x gözlendi) dayanmaktadır. Ancak bunlar verilerden hesaplanamaz. Karar-kuramsal çerçeve problemi çözmek için Ω üzerinde olasılık dağılımı gerektirmez ve problem de bir tane belirlemez.xxΩ
Bu sonuç, (1) ile elde edilen sonuçlardan ve referanslarından ince fakat önemli bir şekilde farklıdır. Diğer çözümlerin hepsi (ilgisiz olmasına rağmen) üzerinde önceden bir olasılık dağılımı olduğunu varsayar ve daha sonra esasen S üzerinde eşit olması gerektiğini gösterir . Bu da imkansız. Bununla birlikte, burada verilen iki zarf probleminin çözümleri, önceden verilen bazı dağıtımlar için en iyi karar prosedürleri olarak ortaya çıkmaz ve bu nedenle böyle bir analizle göz ardı edilir. Mevcut tedavide, daha önce bir olasılık dağılımının mevcut olup olmadığı önemli değildir. Bunu şu şekilde karakterize edebiliriz:ΩS.zarfların ne içerdiğinden emin olmama (önceki bir dağıtımda açıklandığı gibi) ile içeriklerinden tamamen habersiz olma (böylece daha önceki bir dağıtımın alakalı olmaması).
4. SONUÇLAR.
“Daha büyük olan tahmin” probleminde iyi bir prosedür, gözlemlenen değerin ikisinden daha büyük olduğuna rasgele karar vermek ve gözlemlenen değer arttıkça artan bir olasılıktır. Tek bir en iyi prosedür yoktur. “İki zarf” probleminde, gözlemlenen para miktarının tutmaya değer olduğuna (yani, ikisinden daha büyük olduğu), gözlenen değer arttıkça artan bir olasılıkla rastgele karar vermek iyi bir prosedürdür. Yine tek bir en iyi prosedür yoktur. Birçok oyuncu belirli bir böyle bir prosedür ve bağımsız olarak oynanan oyunlar kullanıldığı Her iki durumda da, , daha sonra (bakılmaksızın değerinin w ) bütün ilgili kendi karar prosedürleri daha büyük miktarlarda seçerek desteklerken çünkü onlar kaybedecek daha kazanacaktı.ωω
Her iki problemde de, sorunun doğasının bir parçası olmayan ek bir varsayım -ya da doğa durumları üzerinde önceden bir dağılım- yapılması, görünür bir paradoksun doğmasına neden olur. Her problemde belirtilenlere odaklanarak, bu varsayım tamamen önlenir (olması gerektiği gibi caziptir), paradoksların ortadan kalkmasına ve basit çözümlerin ortaya çıkmasına izin verir.
REFERANSLAR
(1) D.Samet, I.Samet ve D.Schmeidler, İki Zarflı Bulmacaların Arkasında Bir Gözlem. Amerikan Matematik Aylık 111 (Nisan 2004) 347-351.
(2) J. Kiefer, İstatistiksel Çıkarımlara Giriş. Springer-Verlag, New York, 1987.
sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X
, belirli bir X verildiğinde , f (X) 'un birinci zarfın daha büyük olma olasılığı olduğu olası X''lerle bütünleşme .