İki zarf sorunu yeniden ziyaret edildi


16

Bu sorunu düşünüyordum.

http://en.wikipedia.org/wiki/Two_envelopes_problem

Çözüme inanıyorum ve anladığımı düşünüyorum, ancak aşağıdaki yaklaşımı benimsersem tamamen kafam karıştı.

Sorun 1:

Size aşağıdaki oyunu sunacağım. Bana 10 dolar ödüyorsun ve adil bir para çevireceğim. Kafalar sana 5 dolar , kuyruklar sana 20 dolar veriyorum .

Beklenti 12,5 $ olduğundan her zaman oyunu oynayacaksınız.

Sorun 2:

Size 10 dolarlık bir zarf vereceğim , zarf açık ve kontrol edebilirsiniz. Sonra, sana başka bir zarf göstermek bu kez kapatıldı ve size: Bu zarf vardır ya $ 5 ya da eşit olasılıkla içinde 20 $. Takas etmek ister misin?

Sana bırakmak, bu tam sorunun 1 ile aynıdır hissetmek $ a 10 $ 5 ya da bir $ nedenle yeniden her zaman geçecektir, 20.

Sorun 3:

Yukarıdaki ile aynı şeyi yapıyorum ama zarfları kapatıyorum. Yani 10 dolar olduğunu bilmiyorsunuz ama bir miktar X var. Sanırım diğer zarfın çift ya da yarısı var. Şimdi aynı mantığı takip etmek istiyorsanız geçiş yapın. Bu zarf paradoksudur.

Zarfı kapattığımda ne değişti ??

DÜZENLE:

Bazıları, problem 3'ün zarf sorunu olmadığını ve her birinin oyunu nasıl gördüğünü analiz ederek neden böyle olduğunu düşündüğümü sunmaya çalışacağım. Ayrıca, oyun için daha iyi bir kurulum sağlar.

Sorun 3 için bazı açıklamalar sağlama:

Oyunu düzenleyen kişinin bakış açısından:

2 zarf tutuyorum. Birinde 10 dolar koydum ve oyuncuya verdim . Sonra ona söylüyorum, az önce verdiğim zarfın iki katı veya yarısı olan bir zarfım daha var. Geçiş yapmak ister misiniz? Daha sonra adil bir madeni para çevirmeye devam ediyorum ve Heads 5 $ koydum ve Tails 20 $ koydum . Ve ona zarf verin. Sonra ona sorarım. Bana verdiğiniz zarfta tuttuğunuz zarfın iki ya da yarısı var. Geçiş yapmak ister misiniz?

Oyuncunun bakış açısından:

Bana bir zarf veriliyor ve eşit olasılıkla iki katına ya da yarısına sahip başka bir zarf var. Geçiş yapmak ister miyim? Eminim var , bu yüzden 1Xbu yüzden geçiş yapmak istiyorum. Zarfı alıyorum ve aniden aynı durumla karşı karşıyayım. Diğer zarfın miktarının iki katı veya yarısı olduğu için tekrar geçiş yapmak istiyorum.12(12X+2X)>X


2
En azından benim için temel anlayış, sadece "Bende X var, dolayısıyla (1/2 * X + 2X) / 2> X" diyemem - toplam ortalama şans 50/50, ancak herhangi bir belirli X için , beklenen şanslar artık 50/50 değil; ve daha büyük X, diğer zarfta 2 * X olma şansı düşüktür (pozitif sonlu dağılımlar için); bu nedenle sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X, belirli bir X verildiğinde , f (X) 'un birinci zarfın daha büyük olma olasılığı olduğu olası X''lerle bütünleşme .
Peteris

1
Paradoksun ifadesinde, deneyci tarafından X miktarının seçildiğini ve deneycinin rastgele olarak veya X / 2'yi diğer zarfa koymaya karar verdiğini söyleyen hiçbir şey yoktur . Yarattığınız durumu iki zarf paradoksuyla karıştırmaya devam etmeniz, oyuncunun diğer zarfın X / 2 veya 2 X olduğuna dair 50/50 şansı olduğuna inanmasının neden yanlış olduğunu anlamamanız anlamına gelir . Gerçek iki zarf probleminde, 2 X'in diğer zarfta olma olasılığı 0 veya 1'dir.XX/2X/22X2X
jsk

Haklısın. Anlamadım :( bu yüzden soru. Belirttiğim problem 3 ile zarf paradoksu arasındaki farkı anlamaya çalışıyorum. Paradoksta X ve 2X ve tamamlanmış iki zarf olduğunu anlıyorum ama yapmıyorum ' t Birisine bir zarf vermekten ve sonra diğer miktarı koymaya karar vermek için bozuk para çevirmekten nasıl farklı olduğunu görün.
evan54

1
Bunun hilesi, veya 2 X sonuçlarının eşit derecede olası olduğu varsayımına dayanmaktadır . Eğer 2 X diğer zarfın içinde, daha sonra anahtarlama beklenen kazancı 2 X - X = X . Eğer X / 2 diğer zarf, daha sonra anahtarlama beklenen kazancı X / 2 - X = - X / 2 . Oyuncu bu durumlardan hangisinde olduğunu bilmiyor, ancak bu 50/50 şansı olduğuna inanması gerektiği anlamına gelmiyor. X/22X2X2XX=XX/2X/2X=X/2
jsk

1
Diyelim ki zarflarda ve 2 X var . X ile bitirirseniz, 2 X'in diğer zarfta olma olasılığı 1'dir ve X / 2'nin diğer zarfta olma olasılığı 0'dır. 2 X ile bitirirseniz, 2 ( 2 X ) = 4 X diğer zarfta 0 ve 2 X / 2 = X'in diğer zarfta olma olasılığı 1'dir.X2XX2XX/22X2(2X)=4X2X/2=X
jsk

Yanıtlar:


23

1. GEREKSİZ OLANAKLAR.

Bu notun sonraki iki bölümü, standart karar teorisi araçlarını kullanarak "daha büyük olan tahmin" ve "iki zarf" problemlerini analiz etmektedir (2). Bu yaklaşım, her ne kadar açık olsa da, yeni gibi görünmektedir. Özellikle, iki zarf problemi için “daima geçiş” veya “asla geçiş yapma” prosedürlerinden açıkça üstün olan bir dizi karar prosedürünü tanımlar.

Bölüm 2 (standart) terminoloji, kavramlar ve gösterimi tanıtır. "Daha büyük sorun olan tahmin" için olası tüm karar prosedürlerini analiz eder. Bu materyale aşina olan okuyucular bu bölümü atlamak isteyebilir. Bölüm 3, iki zarf sorununa benzer bir analiz uygular. Bölüm 4, sonuçlar, kilit noktaları özetlemektedir.

Bu bulmacaların tüm yayınlanmış analizleri, doğanın olası durumlarını yöneten bir olasılık dağılımı olduğunu varsayar. Ancak bu varsayım, bulmaca ifadelerinin bir parçası değildir. Bu analizlerin ana fikri, bu (gereksiz) varsayımı bırakmanın, bu bulmacalardaki görünür paradoksların basit bir çözümüne yol açmasıdır.

2. “DAHA BÜYÜK OLAN GUESS” SORUNU.

Bir deneyci farklı gerçek sayılar söylenir ve x 2 kağıt iki slipleri üzerine yazılır. Rastgele seçilen bir fişteki numaraya bakar. Sadece bu tek gözlemden yola çıkarak, iki sayıdan daha küçük veya daha büyük olduğuna karar vermelidir.x1x2

Olasılıkla ilgili bu gibi basit ama açık uçlu sorunlar kafa karıştırıcı ve sezgisel olduğu için kötü şöhretlidir. Özellikle, olasılığın resme girmesinin en az üç farklı yolu vardır. Bunu açıklığa kavuşturmak için, resmi deneysel bir bakış açısını benimseyelim (2).

Bir kayıp işlevi belirterek başlayın . Amacımız, aşağıda tanımlanacak bir anlamda beklentisini en aza indirmek olacaktır. Deneyci doğru tahmin ettiğinde kaybı , aksi takdirde 0'a eşit yapmak iyi bir seçimdir . Bu kayıp fonksiyonunun beklentisi yanlış tahmin etme olasılığıdır. Genel olarak, yanlış tahminlere çeşitli cezalar vererek, bir kayıp fonksiyonu doğru tahmin etme amacını yakalar. Şüphesiz, bir kayıp fonksiyonunun benimsenmesi, x 1 ve x 2'de daha önce bir olasılık dağılımı varsaymak kadar keyfi 10x1x2ancak daha doğal ve temeldir. Karar vermekle karşı karşıya kaldığımızda, doğal olarak doğru ya da yanlış olmanın sonuçlarını düşünürüz. Her iki durumda da sonuç yoksa, neden ilgileniyorsunuz? (Akılcı) bir karar verdiğimizde dolaylı olarak potansiyel kayıp düşüncelerini üstleniriz ve bu nedenle açık bir kayıp değerlendirmesinden yararlanırken, kağıt fişleri üzerindeki olası değerleri tanımlamak için olasılık kullanımı gereksiz, yapay ve - olarak yararlı çözümler elde etmemizi engelleyebiliriz.

Karar teorisi gözlemsel sonuçları ve bunları analiz etmemizi modeller. Üç ek matematiksel nesne kullanır: bir örnek alan, bir dizi “doğa durumu” ve bir karar prosedürü.

  • Numune alanı olası tüm gözlemlerden oluşur; burada R (gerçek sayılar kümesi) ile tanımlanabilir. SR

  • Doğa durumları , deneysel sonucu yöneten olası olasılık dağılımlarıdır. (Bu, bir olayın “olasılığı” hakkında konuşabileceğimiz ilk anlamdır.) “Daha büyük olan tahmin” probleminde, bunlar, eşit olasılıklarla farklı gerçek x 1 ve x 2 değerlerinde değerler alan ayrı dağılımlardır. arasında 1Ωx1x2Her değerde 2 . Ω{ω=(x1,x2) ile parametrelendirilebilirR×R| x1>x2}.12Ω{ω=(x1,x2)R×R | x1>x2}.

  • Karar alan ikili dizi olası kararlar.Δ={smaller,larger}

Bu terimlerle, kayıp fonksiyonu üzerinde tanımlanan gerçek değerli bir fonksiyondur . Bize bir kararın gerçekliğe (ilk argüman) kıyasla ne kadar “kötü” olduğunu (ikinci argüman) anlatır.Ω×Δ

En genel karar prosedürü deneyi için uygun a, randomize bir: herhangi bir deneysel sonuç için değeri bir olasılık dağılımıdır Ô . Yani, x sonucunu gözlemlemeye karar verilmesi kesin olarak kesin değildir, daha ziyade δ ( x ) dağılımına göre rastgele seçilmelidir . (Bu, olasılığın dahil olabileceği ikinci yoldur.)δΔxδ(x)

sadece iki unsura sahip olduğunda , herhangi bir randomize prosedür, önceden belirlenmiş bir karara atama olasılığı ile tanımlanabilir, ki bu somut olarak “daha ​​büyük” olacağız. Δ

topaç

Fiziksel bir değiştirici uygulayan bir ikili randomize prosedür: serbest dönüşlü işaretçi bir karar tekabül eden, üst alanında durdurmak için gelecek olasılıkla, ö olasılık ile sol alt durur, aksi halde, ve 1 - δ ( x ) . Dönücü tamamen δ ( x ) [ 0 , 1 ] değeri belirlenerek belirlenir .Δδ1δ(x)δ(x)[0,1]

Dolayısıyla bir karar prosedürü bir fonksiyon olarak düşünülebilir

δ:S[0,1],

nerede

Prδ(x)(larger)=δ(x)  and  Prδ(x)(smaller)=1δ(x).

Tersine, bu tür herhangi bir fonksiyon rastgele bir karar prosedürü belirler. Randomize kararlar özel durumda deterministik kararlar dahil burada aralığı ö ' yatmaktadır { 0 , 1 } .δδ{0,1}

Bize diyelim maliyeti bir karar prosedür bir sonuç için x beklenen kaybı δ ( x ) . Beklenti olasılık dağılımı ile ilgili olan ö ( x ) bir karar alanı ile Ô . Niteliği her bir durumu w (ki, hatırlama, örnek alan bir binom olasılık dağılımıdır S ) bir prosedür beklenen maliyet belirler ö ; bu riski arasında ö için w , Risk δ ( ω )δxδ(x)δ(x)ΔωSδδωRiskδ(ω). Burada, doğa durumu ile ilgili beklenti alınır .ω

Karar prosedürleri risk fonksiyonları açısından karşılaştırılır. Doğa durumu gerçekten bilinmemektedir, zaman ve δ iki prosedürleri vardır ve Risk ε ( ω ) Risk δ ( ω ) herkes için w , daha sonra prosedür kullanılarak hiçbir anlamı yoktur £ değenni prosedürü nedeniyle, δ daha kötü asla ( ve bazı durumlarda daha iyi olabilir). Böyle bir prosedür, ε olan kabul edilemezεδRiskε(ω)Riskδ(ω)ωεδε; aksi takdirde kabul edilebilir. Genellikle birçok kabul edilebilir prosedür vardır. Bunlardan herhangi birini “iyi” olarak değerlendireceğiz, çünkü hiçbiri tutarlı bir şekilde başka bir prosedürle gerçekleştirilemez.

( (1) terminolojisinde “ C için karma bir strateji”) üzerinde önceden bir dağıtım yapılmadığını unutmayın . Bu, olasılığın sorunlu ayarın bir parçası olabileceği üçüncü yoldur. Bunu kullanmak, mevcut analizi (1) ve referanslarından daha genel hale getirirken, daha basittir.ΩC

Tablo 1 değerlendirir doğasının gerçek durum ile verilmektedir riski X 1 > x 2 olduğunu hatırlayın .ω=(x1,x2).x1>x2.

Tablo 1.

Decision:LargerLargerSmallerSmallerOutcomeProbabilityProbabilityLossProbabilityLossCostx11/2δ(x1)01δ(x1)11δ(x1)x21/2δ(x2)11δ(x2)01δ(x2)

Risk(x1,x2): (1δ(x1)+δ(x2))/2.

Bu anlamda “daha ​​büyük olan tahmin” problemi

Hakkında hiçbirşey bilmediğin Verilen ve x 2 Ayrı oldukları, bir karar prosedürü bulabilirsiniz hariç Í riski olan [ 1 - δ ' ( max ( x 1 , x 2 ) ) + δ ' ( dk ( x 1 , x 2 ) ) ] / 2 mutlaka daha az olduğu 1x1x2δ[1δ(max(x1,x2))+δ(min(x1,x2))]/2 ?12

Bu ifade, x > y olduğunda gerektirmeye eşdeğerdir . Bu nedenle, deneycinin karar prosedürünün kesin olarak artan bazı fonksiyonlarla belirlenmesi gereklidir ve yeterlidir δ : S [ 0 , 1 ] . Bu prosedür seti , 1'in tüm “karışık stratejileri Q ” nu içerir, ancak bundan daha büyüktür . Orada bir sürüδ(x)>δ(y)x>y.δ:S[0,1].Q rastgele herhangi bir prosedürden daha iyi olan rastgele karar prosedürleri!

3. “İKİ ZARF” SORUNU.

Bu basit analizin, daha önce tanımlanmayan iyi olanlar da dahil olmak üzere , “daha ​​büyük tahmin” sorununa geniş bir çözüm seti ortaya koyması cesaret vericidir . Bakalım aynı yaklaşım önümüzdeki diğer sorun hakkında ne ortaya çıkarabilir, “iki zarf” problemi (ya da bazen de adlandırıldığı gibi “kutu problemi”). Bu, biri diğerinden iki kat daha fazla paraya sahip olduğu bilinen iki zarftan birini rastgele seçerek oynanan bir oyunla ilgilidir. Zarfı açtıktan ve x miktarını gözlemledikten sonra x İçinde para varsa, oyuncu parayı açılmamış zarfta tutmaya (“geçmek”) veya parayı açık zarfta tutmaya karar verir. Anahtarlama ve anahtarlama yapmamanın eşit derecede kabul edilebilir stratejiler olduğu düşünülebilir, çünkü oyuncu hangi zarfın daha büyük miktarda içerdiği konusunda aynı derecede belirsizdir. Bunun payoffs arasında “eşit muhtemel” alternatifleri sunuyor çünkü paradoks, yani anahtarlama üstün seçenek gibi görünüyor olduğunu ve x / 2 , içinde bekleyen değeri 5 x / 4 açılmış zarf içinde değerini aşıyor. Her iki stratejinin de deterministik ve sabit olduğunu unutmayın.2xx/2,5x/4

Bu durumda, resmen yazabiliriz

S={xR | x>0},Ω={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},andΔ={Switch,Do not switch}.

Daha önce olduğu gibi, herhangi bir karar prosedürü , S'den [ 0 , 1 ] ' e bir fonksiyon olarak düşünülebilir , bu kez tekrar değiştirilememe olasılığı ile ilişkilendirilerek tekrar δ ( x ) yazılabilir . Anahtarlama olasılığı elbette tamamlayıcı değer 1 - δ ( x ) olmalıdır .δS[0,1],δ(x)1δ(x).

Tablo 2'de gösterilen kayıp, oyunun getirisinin negatifidir. Doğanın gerçek durumunun , x sonucunun ( ω veya 2 ω olabilir ) ve sonuca bağlı olan kararın bir fonksiyonudur.ωxω2ω

Tablo 2.

LossLossOutcome(x)SwitchDo not switchCostω2ωωω[2(1δ(ω))+δ(ω)]2ωω2ωω[1δ(2ω)+2δ(2ω)]

Kayıp fonksiyonunun gösterilmesine ek olarak, Tablo 2 ayrıca keyfi bir karar prosedürünün maliyetini de hesaplar . Oyun eşit olasılıkları ile iki sonuç ürettiği için 1δ ,ω doğanın gerçek durumuolduğunda risk 12ω

Riskδ(ω)=ω[2(1δ(ω))+δ(ω)]/2+ω[1δ(2ω)+2δ(2ω)]/2=(ω/2)[3+δ(2ω)δ(ω)].

Her zaman anahtarlama ( ) veya her zaman ayakta duran pat ( δ ( x ) = 1 ) anlamına gelen sabit bir prosedür risk taşır - 3 ω / 2 . Kesinlikle artan herhangi bir işlev veya daha genel olarak, tüm pozitif gerçek x için δ ( 2 x ) > δ ( x ) olan [ 0 , 1 ] aralığında herhangi bir δ işleviδ(x)=0δ(x)=13ω/2δ[0,1]δ(2x)>δ(x) Bir prosedür tespit δ az kesinlikle her zaman bir risk fonksiyonuna sahip - 3 ω / 2 doğası gerçek durum ne olursa olsun, ve böylece her iki sabit prosedüre göre daha üstündür w ! Dolayısıyla, sabit prosedürler kabul edilemezçünkü doğanın durumuna bakılmaksızın bazen daha düşük ve asla daha yüksek riskli prosedürler vardır.x,δ3ω/2ω

strateji

Bunu “daha ​​büyük tahmin” probleminin önceki çözümü ile karşılaştırmak, ikisi arasındaki yakın bağlantıyı gösterir. Her iki durumda da, uygun şekilde seçilmiş bir randomize prosedür "bariz" sabit stratejilerden belirgin şekilde üstündür .

Bu randomize stratejilerin bazı önemli özellikleri vardır:

  • Rastgele stratejiler için kötü durumlar yoktur: zarftaki para miktarı nasıl seçilirse seçilsin, uzun vadede bu stratejiler sabit bir stratejiden daha kötü olmayacaktır.

  • Sınırlandırıcı değerleri ile randomize bir strateji ve 1 baskındır diğerlerinin herhangi biri: beklentisi ise ö zaman ( ω , 2 ω ) zarf içinde bir beklentisi aşan £ değerinin , daha sonra başka bir olası durumunu vardır ( r | , 2 η ) zarflarda ve ε beklentisi δ beklentisini aşıyor .01δ(ω,2ω)ε(η,2η)εδ

  • stratejiler içerir Özel durumlarda, Bayes stratejilerinin birçok eşdeğer stratejiler olarak. “ X , bir eşik T eşik değerinden düşükse ve aksi halde kal ” durumunda herhangi bir strateji, aksi takdirde x T , δ ( x ) = 0 olduğunda δ ( x ) = 1'e karşılık gelir .δxTδ(x)=1xT,δ(x)=0

Öyleyse, argümanda her zaman değişimin yanılgısı nedir? Alternatifler için herhangi bir olasılık dağılımı olduğu örtülü varsayımda yatmaktadır. Spesifik olarak, açılmış zarfta gözlemledikten sonra, geçiş için sezgisel argüman , doğanın temel halleri kümesinde tanımlanan olasılıklar olan koşullu olasılıklar Prob'a (açılmamış zarfta | x gözlendi) dayanmaktadır. Ancak bunlar verilerden hesaplanamaz. Karar-kuramsal çerçeve problemi çözmek için Ω üzerinde olasılık dağılımı gerektirmez ve problem de bir tane belirlemez.xxΩ

Bu sonuç, (1) ile elde edilen sonuçlardan ve referanslarından ince fakat önemli bir şekilde farklıdır. Diğer çözümlerin hepsi (ilgisiz olmasına rağmen) üzerinde önceden bir olasılık dağılımı olduğunu varsayar ve daha sonra esasen S üzerinde eşit olması gerektiğini gösterir . Bu da imkansız. Bununla birlikte, burada verilen iki zarf probleminin çözümleri, önceden verilen bazı dağıtımlar için en iyi karar prosedürleri olarak ortaya çıkmaz ve bu nedenle böyle bir analizle göz ardı edilir. Mevcut tedavide, daha önce bir olasılık dağılımının mevcut olup olmadığı önemli değildir. Bunu şu şekilde karakterize edebiliriz:ΩS.zarfların ne içerdiğinden emin olmama (önceki bir dağıtımda açıklandığı gibi) ile içeriklerinden tamamen habersiz olma (böylece daha önceki bir dağıtımın alakalı olmaması).

4. SONUÇLAR.

“Daha büyük olan tahmin” probleminde iyi bir prosedür, gözlemlenen değerin ikisinden daha büyük olduğuna rasgele karar vermek ve gözlemlenen değer arttıkça artan bir olasılıktır. Tek bir en iyi prosedür yoktur. “İki zarf” probleminde, gözlemlenen para miktarının tutmaya değer olduğuna (yani, ikisinden daha büyük olduğu), gözlenen değer arttıkça artan bir olasılıkla rastgele karar vermek iyi bir prosedürdür. Yine tek bir en iyi prosedür yoktur. Birçok oyuncu belirli bir böyle bir prosedür ve bağımsız olarak oynanan oyunlar kullanıldığı Her iki durumda da, , daha sonra (bakılmaksızın değerinin w ) bütün ilgili kendi karar prosedürleri daha büyük miktarlarda seçerek desteklerken çünkü onlar kaybedecek daha kazanacaktı.ωω

Her iki problemde de, sorunun doğasının bir parçası olmayan ek bir varsayım -ya da doğa durumları üzerinde önceden bir dağılım- yapılması, görünür bir paradoksun doğmasına neden olur. Her problemde belirtilenlere odaklanarak, bu varsayım tamamen önlenir (olması gerektiği gibi caziptir), paradoksların ortadan kalkmasına ve basit çözümlerin ortaya çıkmasına izin verir.

REFERANSLAR

(1) D.Samet, I.Samet ve D.Schmeidler, İki Zarflı Bulmacaların Arkasında Bir Gözlem. Amerikan Matematik Aylık 111 (Nisan 2004) 347-351.

(2) J. Kiefer, İstatistiksel Çıkarımlara Giriş. Springer-Verlag, New York, 1987.


8
Bu, on yıl önce yazdığım ancak hiç yayınlamadığım kısa bir makale. (AMM'nin yeni editörü matematiksel bir ilgi görmedi.) İki zarflı oyunu izleyici ile oynadığım, önemli miktarda gerçek para kullanarak konuştum.
whuber

1
Çok güzel yaz! Joe Blitzstein, Harvard Stat 110 dersindeki iki evelope sorunundan bahsetti.
Benjamin Lindqvist

@whuber Bu varyantı düşünün. Birinin diğerinin iki katı kadar iki para seçtiğini varsayalım. Sonra hangi miktarın hangi zarf içine gireceğine karar vermek için adil bir para çeviriyorum. Şimdi rastgele bir zarf seçiyorsunuz ve içindeki miktarı hayal edip adlandırıyorsunuz (bu adım şüpheli ise, zarfı açmayı ve gerçek miktara bakmayı düşünün - mantık gördüğünüz değer ne olursa olsun geçerlidir içeride , genel x ) ile uygulanmalıdır . Daha sonra diğer bir zarf içinde para beklenen değerini hesaplamak E = ( 1 / 2 ) ( x / 2 ) + ( 1xx ...E=(1/2)(x/2)+(1/2)(2x)=1.25x>x
Zubin Mukerjee

Sanırım bu muhakemede "doğa durumları üzerinde daha önce bir dağılım olduğunu varsaydığım" anlamıyorum. Öyle mi? Açıkçası akıl yürütme doğru olamaz, çünkü sadece ilk zarfı düşünerek diğer zarfa geçmeyi haklı gösteremem (çünkü bir kez geçiş yaptığımda aynı mantık ikinciye de uygulanacaktır).
Zubin Mukerjee

2
@Zubin Bu analizde temel (ama ilginç) bir hata var. Let iki zarf içinde küçük miktarda olabilir. Bir gözlem Verilen x , biliyorsunuz bu da θ = x veya θ = x / 2 ve her iki durumda da bu gözlem olasılığı olduğunu 1 / 2 . İlk durumda, miktar , Y için diğer zarfın içinde 2 x ve ikinci durumda bunun x / 2 , ancak geçerli atamak için beklenti için Yθxθ=xθ=x/21/2Y2xx/2Y için bir olasılık dağılımı olduğunu varsaymalısınız . Eşit olasılık eşit olasılığa eşit değildir. θ
whuber

7

Genel olarak iki zarf sorunuyla ilgili sorun, wikipedia'da sunulan sorunun , ilk seçim yapıldıktan sonra zarflardaki değerlerin boyutunun değişmesine izin vermesidir . Sorun yanlış formüle edilmiştir.

Ancak, sorunun gerçek dünya formülasyonu şudur: Eğer iki özdeş zarf var ve B , B = 2 A . Her iki zarfı da seçebilir ve daha sonra takas için teklif edebilirsiniz.ABB=2A

Durum 1: seçtiniz . Geçerseniz A dolar kazanırsınız .AA

Durum 2: seçtiniz . Eğer A dolarını değiştirirsen.BA

İki zarf paradoks kusur girdiği yer burasıdır. Eğer yarım değerini kaybetmeden veya para iki katına bakıyor olsa da, yine de özgün değerini bilmiyorsanız ve değeri A giderildi. Baktığınız şey + A veya - A , 2 A veya 1 değilAA+AA2A.12A

Her adımda veya B seçme olasılığının eşit olduğunu varsayarsak. ilk sunulan takastan sonra, sonuçlar şunlardan biri olabilir:AB

Durum 1: Seçildi , Takas Yok: Ödül AAA

Durum 2: Seçildi, B ile Değiştirildi : Ödül 2 AAB2A

Durum 3: Toplanan , Takas yok: Ödül 2 AB2A

Vaka 4: Çekilen için takas, A : Ödül ABAA

Sonuçta yarısı kadar ve 2 A'nın yarısı kadar olur . Bu, size kaç kez takas teklif edildiğine bakılmaksızın değişmez veya tek bir zarfta ne olduğunu bilmeye bağlı olarak değişmez.A2A


IMO, sorun ne olursa olsun A'yı kaybedemeyeceğinizi söylüyor. Bu nedenle, + A'ya karşı -A uygun olamaz. A veya 2A kazanırsınız.
Küçük Uzaylı

7

Soru hakkındaki yorumum

Sorun 3'teki ayarın aşağıdaki gibi olduğunu varsayıyorum: Organizatör önce miktarını seçer ve X'i ilk zarfa koyar . Ardından, organizatör adil bir para çevirir ve buna dayanarak ikinci zarfı 0,5 X veya 2 X koyar . Oyuncu tüm bunları biliyor , ancak X bilmiyorXX0.5X2XXne de madeni para çevirme sonucu. Organizatör oyuncuya ilk zarfı (kapalı) verir ve oyuncunun değiştirmek isteyip istemediğini sorar. Soru soran oyuncu 1. oyuncunun değiştirmek istediğini iddia eder, çünkü anahtarlama beklentiyi arttırır (doğru) ve 2. değişimden sonra aynı mantık simetrik olarak tutar ve oyuncu geri dönmek ister (yanlış). Ayrıca oyuncunun, üzerinde olasılık dağılımı koyan ve kazanılan beklenen para miktarını en üst düzeye çıkaran rasyonel, riskten bağımsız bir Bayesci ajan olduğunu varsayıyorum .X

Eğer oyuncu biz bozuk para çevirme prosedürünü bilmiyorsa, ilk etapta ikinci zarfın daha yüksek / düşük olması için olasılıkların 0,5 olduğunu iddia etmek için hiçbir neden olmayabilir.

Neden çelişki yok

Sorun 3 (cevabımda yorumlandığı gibi) zarf paradoksu değil. Let bir Bernoulli rastgele değişken P ( Z = 1 ) = 0.5 . Miktarını tanımlamak Y, böylece 2. zarf içinde , Z = 1 anlamına gelir , Y = 2 X ve Z = 0 anlamına gelir , Y = 0.5 X . Buradaki senaryoda, X madeni para çevirme sonucunu bilmeden seçilir ve bu nedenle Z ve X bağımsızdır;ZP(Z=1)=0.5YZ=1Y=2XZ=0Y=0.5XXZX . E ( Y ) = E ( E ( Y X ) ) = E ( 1,25 X ) = 1,25 E ( X ) Bu nedenle, eğer X> 0 ise (veya en az E ( X ) > 0 iseE(YX)=1.25X

E(Y)=E(E(YX))=E(1.25X)=1.25E(X)
E(X)>0), oyuncu zarf 2'ye geçmeyi tercih edecektir. Ancak, bana iyi bir anlaşma (zarf 1) ve daha iyi bir anlaşmaya (zarf 2) geçme fırsatı sunacak olursanız, paradoksal bir şey yoktur. daha iyi anlaşmaya geçmek için.

Paradoksu çağırmak için, durumu simetrik hale getirmelisiniz, böylece zarf 2'den zarf 1'e geçmek istediğimi iddia edebilirsiniz. Sadece bu paradoks olurdu: sonsuza kadar değişmeye devam etmek istiyorum. Soruda, durumun gerçekten simetrik olduğunu savunuyorsunuz, ancak herhangi bir gerekçe sunulmuyor. Durum simetrik değildir: ikinci zarf, madeni para çevirme işlevi olarak seçilen miktarı ve ilk zarftaki miktarı içerirken, ilk zarftaki tutar madeni para çevirme işlevi olarak seçilmez ve ikinci zarftaki miktar. Bu nedenle, ikinci zarftan geri dönme argümanı geçerli değildir.

Az sayıda olasılık içeren örnek

Diyelim ki (oyuncunun inancı şudur) veya X = 40 eşit olasılıklarla ve hesaplamaları duruma göre ele alalım . Bu durumda, olasılıkları ( X , Y ) olan { ( 10 , 5 ) , ( 10 , 20 ) , ( 40 , 20 ) , ( 40 , 80'i ) } , olasılık, her biri 1 / 4X=10X=40(X,Y){(10,5),(10,20),(40,20),(40,80)}1/4. İlk olarak, ilk zarfı tutarken oyuncunun muhakemesine bakarız.

  1. Zarfım içeriyorsa , ikinci zarf eşit olasılıklarla 5 veya 20 içerir , bu nedenle I kazanımını değiştirerek ortalama 0,5 × ( - 5 ) + 0,5 × 10 = 2,5 olur .105200.5×(5)+0.5×10=2.5
  2. Zarfım içeriyorsa , ikinci zarf eşit olasılıklı 20 veya 80 içerir , bu nedenle I kazanımını değiştirerek ortalama 0,5 × ( - 20 ) + 0,5 × ( 40 ) = 10 olur .4020800.5×(20)+0.5×(40)=10

Bunların ortalamasını alarak, beklenen anahtarlama kazancı , bu nedenle oynatıcı değişir. Şimdi, geri dönüşün benzer durum analizini yapalım:0.5×2.5+0.5×10=6.25

  1. Zarfım içeriyorsa , olasılık 1 olan eski zarf 10 içerir ve geçiş yaparak 5 kazanırım.5105
  2. Zarfım içeriyorsa , eski zarf eşit olasılıklı 10 veya 40 içerir ve değiştirerek 0,5 × ( - 10 ) + 0,5 × 20 = 5 kazanırım .2010400.5×(10)+0.5×20=5
  3. Zarfım içeriyorsa , olasılık 1 olan eski zarf 40 içerir ve değiştirerek 40 kaybederim .804040

Şimdi, geri dönerek kazanılan beklenen değer, yani olasılık ağırlıklı ortalama, . Bu nedenle, geri dönmek beklenen fayda kazancını tamamen iptal eder.0.25×5+0.5×5+0.25×(40)=6.25

Olasılıkların sürekliliğine sahip başka bir örnek

Önceki örneğime, üzerindeki dağılımı akıllıca seçtiğimi iddia ederek itiraz edebilirsiniz, böylece Y = 80 durumunda oyuncu kaybettiğini bilir. Şimdi bir durumu dikkate alalım X : sürekli sınırsız dağılımına sahip X ~ Exp ( 1 ) , Z, bağımsız olarak , X , daha önce ve Y bir fonksiyonu olarak , X ve Z , daha önce olduğu gibi. Geçiş beklenen kazanç X için Y yine E ( 0.25 x )XY=80XXExp(1)ZXYXZXY . Geri anahtarı için öncelikleBayes teoremini kullanarak P ( X = 0,5 Y Y = y ) koşullu olasılığını hesaplıyoruz: P ( X = 0,5 Y Y = y ) = P ( Z = 1 Y = y ) = p ( Y = y Z = 1 )E(0.25X)=0.25E(X)=0.25P(X=0.5YY=y) ve benzer şekildeP(X=2YY=y)=e - 2 y

P(X=0.5YY=y)=P(Z=1Y=y)=p(Y=yZ=1)P(Z=1)p(Y=y)=p(2X=y)P(Z=1)p(Y=y)=0.25e0.5yp(Y=y)
, bu nedenle, ilk zarfa geri dönmenin beklenen beklenen kazancı E(X-YY=y)=-0.125ye - 0.5 y +ye - 2 yP(X=2YY=y)=e2yp(Y=y) ve üzerinde bir beklenti alarakY, olur bu e(X-Y)= ∞ iken 0 -, 0.125yE - 0,5 y +ye - 2 y
E(XYY=y)=0.125ye0.5y+ye2yp(Y=y),
Y ilk anahtarın beklenen kazancını iptal eder.
E(XY)=00.125ye0.5y+ye2yp(Y=y)p(Y=y)dy=0.25,

Genel çözüm

X,Z,YXZP(Z=1)=0.5ZXY=2XZ=10.5XY,Z2n,2n+1P(2n<=min(X,Y)<2n+1)n

Paradoksun olasılıkların 0,5 olması gerekmediği başka bir versiyonu olduğunu unutmayın, ancak bu zarftaki miktara bağlı olarak başka bir zarf beklentisi her zaman daha yüksektir. Bu tür bir koşulu karşılayan olasılık dağılımları vardır (örneğin, zarflardaki miktarların bağımsız yarı Cauchy olmasına izin verin), ancak Wikipedia makalesinin açıkladığı gibi sonsuz ortalama gerektirir. Bu kısmın sorunuzla ilgisiz olduğunu düşünüyorum, ancak bütünlük için bundan bahsetmek istedim.


Sorumun neden zarf paradoksuna benzediğini açıklamaya çalışarak düzenledim ve sonsuza kadar geçmek isteyeceksiniz.
evan54

@ evan54 Cevabımı ayar problemi 3 hakkındaki yorumumu, durumun neden simetrik olmadığı, örnekler vb. hakkında daha fazla açıklama içerecek şekilde yeniden yazdım
Juho Kokkala

Sanırım onu ​​almaya yakınım. Ben bir sikke flip ve zarf 2 bir kez elinizde miktarının yarısı / iki içerir olduğunu düşünüyorum temelde zarf paradoks durumunda ANCAK orada var şekilde size geçiş daha iyi olduğunu garanti eder. bu mantıklı mı?
evan54

ayrıca, eğer yaparsa, daha resmi hale getirmenin bir yolu var mı? Ben daha üzerinde düşünmek olabilir ..
evan54

1
@ evan54 Emin değilim. Paradoksun bütün mesele, bunun geçişe hiçbir avantajı olmayan bir durum olmasıdır. Bu nedenle, en azından başlangıçta geçiş yapmanın avantajlı olmasına neden olan sorunun kurulumunda değiştirdiğiniz her şey, bu nedenle iki zarf paradoksunun kurulumuna eşdeğer olmamalıdır. Kurulumunuzda yalnızca ilk kez geçiş yapmanın mantıklı olduğunu unutmayın. İlk kez değiştirdikten sonra geri dönerek kaybetmeyi beklersiniz. Geri dönmeniz gerektiğini savunmaya çalışırsanız paradokstaki kusurlu mantık devreye girer.
jsk

4

Sorun 1: Anlaşıldı, oyunu oyna. Burada anahtar 5'e 20 kazanmanın gerçek olasılıklarını biliyorsunuz, çünkü sonuç adil bir madalyonun tersine çevriliyor.

Sorun 2: Sorun, sorun 1 ile aynıdır, çünkü diğer zarfta 5 veya 20 olması olasılığının eşit olduğu söylenir.

X/22XXX


Sorun 3'ü biraz farklı yorumladığımızı görüyorum. OP'nin 2. problemin 0.5 / 0.5 olasılıkları olması için problem 3'teki ayarı özel olarak oluşturduğunu varsaydım. Bu, uygunsuz dağılımlar olmadan açıkça mümkündür, ancak daha sonra ikinci zarftaki miktar göz önüne alındığında, zarf 1 için olasılıklar eşit değildir.
Juho Kokkala

X/22X

evet bu benim düşüncemdi, problem 3'te X / 2 ve 2X arasında eşit olasılık var. Yani 3 zarf tutun ona 10 vermek ve daha sonra ona karar verirseniz 20 veya 5 (kapalı) vermek olmadığını görmek için bir bozuk para çevirin
evan54

1
@ evan54 - bana hangi zarfı vermeyi seçtikten sonra rastgele çevirirseniz , sorun 1'e eşdeğerdir; her iki para miktarını seçerseniz ve sonra bana hangi zarfı verdiğinizi rastgele çevirirseniz, yukarıda açıklanan durum budur; bunlar farklı durumlar.
Peteris

1
@ evan54 - en iyi oyuncunun kararı bu zarfları nasıl yaptığınıza bağlıdır. Oyuncuya bunu nasıl yaptığınızı söylemezseniz (sadece bu 50/50 cümle), o zaman en uygun strateji, oyuncunun bunu bir şekilde yapma olasılığınıza göre varsayımlarına bağlıdır - hazırladığınız ilk zarf daha az değerlidir hazırladığınız ikinci zarftan daha fazla; eğer oldukça karıştırılmışlarsa (ve açılmamışlarsa), oyuncunun ne seçtiği önemli değildir; eğer oyuncu ilk başta ona ilk zarfı verdiğini düşünüyorsa (>% 50), o zaman oyuncu değişmeli ve ona uymalıdır.
Peteris

1

Bu benim sahip olduğum potansiyel bir açıklama. Bence yanlış ama emin değilim. Oy vermek ve yorum yapmak için göndereceğim. Umarım birisi daha iyi bir açıklama sunar.

Dolayısıyla, sorun 2 ve sorun 3 arasında değişen tek şey, tuttuğunuz zarfın içindeki miktarın rastgele hale gelmesidir. Para yerine orada bir fatura olabilir bu yüzden negatif olmasına izin verirseniz o zaman mükemmel mantıklı. Zarfı açtığınızda elde ettiğiniz ek bilgiler, fatura veya para olup olmadığı, dolayısıyla bir durumda geçiş yapmayı önemsediğinizdir.

Ancak tasarının bir olasılık olmadığı söylendiğinde sorun devam ediyor. (elbette yalan söyleme olasılıkları mı veriyorsunuz?)


Negatif miktarlar olasılığını ortaya koymak ilginç bir gözlemdir, ancak sorunuzdaki sorunu çözmek için gerekli değildir. Cevabımı gör.
Juho Kokkala

Zarftaki miktarın rastgele olduğunu varsaymak gerekli değildir: bilinmediği yeterlidir . Rastlantısallığı varsaymak, problemde verilmeyen bilgileri - ne kadar az da olsa - ekler!
whuber

1
X/22X

1

Problem 2A: 100 not kartı opak bir kavanozda. " $ Her kartın bir yüzünde yazılır 10"; karşı tarafta " 5 $ " veya " 20 $ " yazılıdır. Bir kart seçip sadece bir tarafa bakıyorsunuz. Daha sonra bir tarafı (açığa çıkan veya gizli) seçersiniz ve o taraftaki miktarı kazanırsınız.

onlykarttaki daha yüksek veya daha düşük değeri ortaya çıkarmak için eşit şansınız olduğu gerçeği - hala doğruydu. Her tür karttan kaç tane olduğunu bilmeniz gerekir.

Problem 3A: Aynı kavanoz kullanılıyor, ancak bu sefer kartların hepsinin üzerinde farklı ve bilinmeyen değerler var. Aynı olan tek şey, her kartta bir tarafın diğerinin değerinin iki katı olmasıdır.

different

Ne Problem 2 ve Problem 3 arasında değiştiğini, sen diyerek bu iki olasılıklarının Problem 2 aynı yapılmış olmasıdır "Bu zarf ya sahiptir $ 5 ya $ eşit olasılıkla İçinde 20". Bilinmeyen değerlerle, bu Sorun 3'te doğru olamaz.


0

genel bakış

İnanıyorum ki, bu sorunu çözdüğünüz yol tamamen doğru. "Coin Flip" senaryosunu, zarf seçilmeden önce paranın zarfa eklendiği durumdan ayırmanız gerekir

Bu senaryoları ayırt etmemek, birçok insanın kafa karışıklığının kökeninde yatar.

Sorun 1

Paranızı ikiye katlayıp yarıya mı indirmeye karar vermek için bozuk para çeviriyorsanız, daima oyunu oynayın. Çift ya da hiçbir şey yerine, çift ya da biraz kaybedersiniz.

Sorun 2

Bu, madeni para çevirme senaryosu ile tamamen aynıdır. Tek fark, zarfı alan kişinin size ilk zarfı vermeden önce çevrilmiş olmasıdır. Not Bir Zarf Seçmediniz !!!! Size bir zarf verilmiş ve daha sonra geçiş yapma seçeneği verilmiştir. Bu, sorun 3'e göre daha küçük ama önemli bir farktır.

Sorun 3

Bu, iki zarf sorununun klasik düzeneğidir. Burada iki zarf arasında seçim yapabilirsiniz. Gerçekleştirilmesi gereken en önemli noktalar

  • Herhangi bir zarfta olabilen maksimum para miktarı vardır. Oyunu çalıştıran kişinin sınırlı kaynakları ya da sınırlı miktarda yatırımı olduğu için
  • M zarfında olabilecek maksimum parayı çağırırsanız, 0 ile M arasında herhangi bir sayı alma olasılığınız düşüktür. 0 ile M arasında rasgele bir miktar para alırsanız, ilk zarfın yarısına koyulur ve ikincisi için (ya da çift, matematik hala çalışır) Bir zarf açarsanız, M / 2'den daha az M / 2'den daha az bir şey görme olasılığınız 3 kat daha fazladır. (Bunun nedeni, her iki zarfın yarısının M / 2'den daha az olmasıdır ve diğer yarısı da 1 zarfın olacaktır)
  • Eşit dağılım olmadığından, ikiye katladığınız zamanın% 50'si, ikiye böldüğünüz zamanın% 50'si geçerli değildir
  • Gerçek olasılıkları hesapladığınızda, ilk zarfın beklenen değeri M / 2'dir ve ikinci zarfın EV'si, anahtarlamalı veya anahtarsızdır, M / 2'dir.

İlginç bir şekilde, zarftaki maksimum paranın ne olabileceğine dair bir tahmin yapabilirseniz veya oyunu birden çok kez oynayabiliyorsanız, M / 2'den daha az bir zarf açtığınızda geçiş yaparak faydalanabilirsiniz. Bu iki zarf problemini burada simüle ettim ve bu dış bilgiye sahipseniz, ortalama olarak 1.25 yapabileceğiniz gibi, her zaman anahtarlama veya asla anahtarlama yapamayacağınızı fark ettim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.