Blackwell'in bahsi


12

Blackwell'in Futility dolaplarındaki bahis paradoksunu okudum . Özet: ve üzere iki zarf . Zarflar rastgele miktarda para içerir, ancak para hakkındaki dağılım hakkında hiçbir şey bilmezsiniz. Birini , orada ne kadar para olduğunu kontrol edersiniz ( ) ve seçmeniz gerekir: veya ?E y x E x E yExEyxExEy

Boşluk Dolabı, Leonard Wapner adlı bir matematikçiye atıfta bulunur: “Beklenmedik bir şekilde, kendinize doğru olma şansından bile daha iyi bir şans vermek için diğer zarfı açmadan kısa bir süre yapabileceğiniz bir şey var.”

Benim için yanlış gibi görünen fikir şu şekildedir: rastgele bir sayı . Eğer , . Eğer , seçim .d < x E x d > x E ydd<xExd>xEy

Wapner: “Eğer d x ile y arasındaysa, tahmininizin (d ile gösterildiği gibi) doğru olduğu garanti edilir. Bunun olasılıkla gerçekleştiğini varsayın p. D hem x hem de y'den küçükse, tahmininiz yalnızca seçtiğiniz x sayısı ikisinden büyük olduğunda doğrudur. Bunun yüzde 50 şansı var. Benzer şekilde, d her iki sayıdan da büyükse, tahmininiz yalnızca seçtiğiniz sayı ikisinden küçükse doğru olacaktır. Bu yüzde 50 olasılıkla da oluyor. ”

Olasılığı varsa olan , sıfırdan büyük olup, bu yöntem, ortalama bir başarı . Bu, ilişkisiz rastgele bir değişken gözlemleyerek bize ek bilgi verdiği anlamına gelir.[ x , y ] 1d[x,y]12+p2

Bence bunların hepsi yanlış ve problem rastgele bir tam sayı seçerken yatıyor. Bu ne demek? Herhangi bir tamsayı gibi mi? Bu durumda, olasılık o arasında durmaktadır ve sıfır, çünkü her iki ve sınırlı.d x y x ypdxyxy

Paranın maksimal miktarına bir sınırı olduğunu söylerseniz, demek , ya da en azından biz den d seçin ardından reçete seçmenin önemsiz tavsiye aşağı kaynar eğer ve ise seçimi .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Burada bir şey mi özlüyorum?

DÜZENLE

Tamam, şimdi görünen paradoksun nereden geldiğini görmeye başlıyorum. İlgisiz bir rastgele değişkenin ek bilgi sağlayabilmesi imkansız görünüyordu.

Ancak, bilinçli bir d dağılımı seçmemiz gerektiğini unutmayın . Örneğin, tek bir şekilde dağılımı için sınırları seçin veya Poissionian dağılımının vb Açıkçası, fıstık oynamaktadır halinde, ve dağılımını tercih d olmak üniform dolar, . Bu son olasılık, her şeyden önce zarflarda ne olabileceğine dair kararımıza bağlı olacaktır.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

Diğer bir deyişle, teknik işe yararsa, paranın zarflara ne kadar dağıldığını bilmediğimiz varsayımı (zarflar için para miktarının nasıl seçildiği) ihlal edilir. Ancak, zarflarda ne olduğunu gerçekten bilmiyorsak, en kötü senaryoda, uygulayarak hiçbir şeyi kaybetmeyiz.

DÜZENLEME 2

Başka bir düşünce. verildiğinde , çizimi için , sürekli negatif olmayan bir dağılım seçelim . Bunu yapma iznimiz var, doğru muyum? Talimatlara uygun şekilde ilerliyoruz - , zarfı tutarız , ise zarfı değiştiririz. Akıl yürütme değişmez, dağılımı nasıl seçtiğimize bağlı olarak (veya yanılıyor muyum?) Olabilir .d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Ancak, dağıtımı nasıl seçtiğimiz göz önüne alındığında, şu anda yaptığımız şey bir bozuk para atışına eşdeğerdir. Bozuk para atarız ve kafalarsa, zarfları değiştiririz, kuyruksa, tuttuğumuz zarfın üzerine yapışırız. Nerede yanılıyorum?

DÜZENLEME 3 :

Tamam, şimdi anladım. Biz olasılık fonksiyonunu dayandırırsanız üzerine (örneğin, örnek aralığında bir düzgün dağılımından , olasılık bağımsız değildir .x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( doğru karar | d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Yani, ( olasılığı ile ), tahmin her zamanki gibi doğrudur. Eğer daha düşük, ancak sayı, ve bir , daha şansı daha yüksek daha düşük olması daha yüksek olmaktan çok uyuşmayan karar doğru bastırılmakta, böylece. Aynı mantık iki sayıdan daha yüksek olduğunda da geçerlidir .p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Bu, bağımsız olarak çizme sürecini seçmemiz gerektiği anlamına gelir . Başka bir deyişle, ve çizildiği dağılım parametreleri hakkında bir tahmin yapmalıyız ; en kötüsü hala rastgele tahmin etmemizdir, ama en iyisi tahminimizin doğru olması - ve sonra bir avantajımız var. Bunun "x ve y," en az 1 $ , en fazla 10 $ olacağını tahmin etmekten daha iyi olması gerekir , bu yüzden , biz tutarız, eğer değilse, değiştiririz "Ben henüz görmek.x x Y x > 5dxxyx>5

Ben Wapner'a kitabındaki sorununun açılan bilim formülasyonu (saptırmak edildi : Bir Matematiksel Kristal Ball İlginç Beklenmeyen Beklentiler hangi devletler)

"Herhangi bir şekilde rastgele bir pozitif tamsayı seçin" (Wapner geometrik bir dağılım önerir - ilk kafalar gelene kadar paraları savurmak, ise işlemi tekrarlamak ) " daha yüksek tahmin ederse ve tahmin ederse (...) Zamanın yüzde 50'sinden fazlasını doğru tahmin edersiniz, çünkü zamanın yüzde 50'sinden fazlasını doğru bir şekilde gösterir! "d > x d < x dd=xd>xd<xd



2
Bu, iki zarf probleminden oldukça farklıdır: (1) iki zarf problemine geçiş için verilen argüman yanlıştır, argümandaki kusur Bayesian eklenerek görülebilir (2) argüman Wapner tarafından Blackwell'in bahsi için verilen doğru.
Matthew Gunn

Zarf içinde para miktarları sayı kümesinin keyfi elemanları ise S, işe Wapner'a stratejisi için yeterli ve gerekli koşul seçtiğiniz sayının CDF'nin içindir kesinlikle S. artan edilecek
eski durumuna Monica

Tamam, hala bir şey eksikim - lütfen EDIT 2'ye bakın, ama bana sadece bir para atabiliriz gibi görünüyor ve akıl yürütmeye göre hala çalışmalı. Nerede yanılıyorum?
Ocak

Yanıtlar:


8

Bu daha çok iki zarf sorunu olarak bilinir . En yaygın olarak miktarlar ve olarak verilir, ancak durum böyle olmak zorunda değildir.A2A

Bazı noktalar:

  1. Sen olamaz homojen * rasgele bir tamsayı seçer, ancak alıntı parçası tek tip olması gerektirecek görünmüyor. Bir dağılım seçin - herhangi bir sonlu değeri aşma olasılığı olduğu sürece, argüman için ne olduğu önemli değildir.

  2. Belirtilen karar kuralı ile tamsayısını seçmek mantıklı olmaz , çünkü para ayrıktır, bu da sıfır olmayan bir şans ve bu dava için listelenen hiçbir şey olmadığı anlamına gelir . (Veya alternatif olarak, eşit olduklarında ne yapılacağını belirtmek için kuralı değiştirmek için)d d=x

  3. Bunu bir kenara bırakırsak, negatif olmayan sürekli dağılımdan seçebilirsiniz - o zaman eşitlik konusunda endişelenmemize gerek kalmaz.d

* (ne de tekdüze rastgele negatif olmayan bir tamsayı ne de düzgün rastgele pozitif bir tamsayı seçemezsiniz)


Paranın maksimal miktarına bir sınırı olduğunu söylerseniz, demek , ya da en azından biz seçin dan ardından reçete seçmenin önemsiz tavsiye aşağı kaynar eğer ve ise seçimiMd1...MEyx<M/2Exx>M/2

seçildiği rasgele dağılımın kapsadığı ortaya çıkarsa, bu işe yaramalıdır (size 50-50'den daha iyi verin); dağıtım yarıya sıkışmış olsaydı yapmazdı.xM/2

Ancak, bu oyunun ilk sunulduğu versiyonları, zarfın (muhtemelen) oyundan gelirinizi en aza indirmeye çalışan biri tarafından sunulmasıdır. Diğer zarfa geçiş yapıp yapmayacağınıza karar vermek için dağıtım kullanma stratejisi yine de bu durumda çalışır.


Tamam, puanlar (1-3) alındı. Yani, böyle bir rasgele olmayan negatif, sürekli dağılımını seçmek iznim o , doğru mu? Ama sonra karar esasen bozuk paraya dayanıyor ... yanlış mıyım? dP(d<x)=P(d>x)
Ocak

Hiç gerekmez . İki miktar arasında sıfır alma olasılığına ihtiyacınız var. P(d<x)=P(d>x)
Glen_b -Manica Monica

Evet, ama ben am izin için yoğunluk fonksiyonunu tanımlamak ı istedikleri gibi, hakkı? Bunu tartışmayı saçma bir sonuca götürmek için yapıyorum. d
Ocak

stratejinizi x'in bir fonksiyonu haline getirerek, d x ile y arasındayken kendinize doğru seçimi yapma avantajı sağlamazsınız - oyunu kazanmanın yolunu tanımlıyorsunuz. Verdiğiniz bağlantı böyle bir stratejinin işe yarayacağını iddia ederse yanlış olur
Glen_b -Restate Monica

Wapner'in akıl yürütmesinde, bir fonksiyonu olarak türetmek için kullanılan olasılık fonksiyonunu tanımlamamı sağlayan nedir? olduğu sürece , mantığı hala çalışmalıdır, yanılıyor muyum? içeren sürekli, negatif olmayan bir dağıtım kullanırsam (örneğin üzerinde eşit dağılım , o zaman bunun böyle olduğu garanti edilir ve .dxP(d(x,y))>0x(1,2x)d(x,y)
Ocak

7

Wapner'in argümanı doğru!

Bazı yorumlar:

  • , ön beklentide en kötü yararsızsa, zarfları değiştirdiğimiz açıklanan kesme stratejisini takiben . İyi bir seçimi ile oldukça yararlı olabilir.x<dd
  • Önceden bir Bayesian eklerseniz (yani paranın zarflara ilk dağıtılmasıyla ilgili inançlar eklerseniz), önceki inançlarınız göz önüne alındığında nin en iyi değerini çözebilirsiniz .d
  • Belirli durumlarda (örneğin, ne kadar çok gözlemlerseniz, büyük zarfı alma olasılığınız o kadar yüksekse), bir kesme stratejisi bile en uygunudur.
  • Daha genel bir Bayesian ortamında, birçok öncelik için basit bir kesme stratejisinden daha iyisini yapabilirsiniz.

İlişkili ancak farklı bir sorun:

Birkaç @Glen_b ve @whuber söylediğim gibi olarak bilinen ilgili bilmece var İki Zarf Problem bir bâtıl argüman üzerinde önceki inançlarını bir Bayes yaklaşımı alıp ekleyerek görülebilir hep anahtarlama zarf ve argüman kusur için verilir iki zarfın içeriği.

Yine de bir anlamda, burada tarif edilen bulmaca oldukça farklıdır. Wapner'in argümanı doğru!


1
Tamam, şimdi paradoksun nereden geldiğini görüyorum. Veya spesifik olarak, ek bilgilerin sisteme aktığı yer. Bilinçli dağılımını seçerek d , biz, az ya da çok, her iki zarf içinde para miktarları olması gereken yerde hakkındaki önsel bilgilerini kullanırlar. En kötü senaryo, bilgimiz işe yaramaz, ancak yöntem, kullanıldığında dezavantajlı olmayacağımızı garanti eder.
Ocak

Biraz düşündükten sonra hala
Ocak

Senaryo (A) Küçük zarfın , büyük zarfın düşünün . = 15'i seçelim . . Karar kuralı sizi% 100 doğru seçime götürür! 1020dP(x<d)=P(x>d)
Matthew Gunn

Şimdi bazı Senaryo (B) 'yi inceleyelim. Küçük zarfın 1'den 9'a kadar tek bir dolar (örneğin, 1 veya 3 veya 5 veya 7 veya 9) ve büyük zarfın 1 dolar daha fazla olduğunu düşünün. Seçim ve . Yine de, karar kuralı varsa repick kadar yararlı değil! veya ise doğru karara ve ise yanlış karara yol açar . Olası çiftlerin (1,2), (3, 4), (5, 6), (7, 8) (9, 10) olduğunu hatırlayın. tuhaf miktarda para. P ( x < d ) = P ( x > d ) < 5.5 x = 1 , 3 , 5 , 6 , 8 , 10 x = 2 , 4 , 7 , 9d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
Matthew Gunn

ve dağılımını bilmiyoruz , bu yüzden onu önereceğiniz şekilde seçemeyiz. Zarfı açtıktan sonra biliyoruz , ancak rastgele 1 ila 9 arasında bir sayı seçildiğine dair hiçbir fikrimiz yok ve bu nedenle yi 5.5 olarak seçemeyiz. Yukarıdaki @ Glen_b tarafından belirtildiği gibi, negatif olmayan, sürekli bir dağılımdan seçilmelidir. Y x d dxyxdd
Ocak

0

Bundan çok etkilenmiştim ve onunla Excel'de oynama pragmatik yaklaşımını benimsedim.

1-100 aralığında x, y ve d için üç rastgele sayı ürettim. Sonra d ve x ile x ve y arasındaki karşılaştırmayı yaptım ve sonuca doğru ya da yanlış baktım.

Bunu 500 kez yaptım ve birkaç kez tekrarladım ve tahmin edildiği gibi düzenli olarak 500'ün 330'unda doğru cevabı aldım.

Daha sonra d aralığını 1-10000'e çıkardım ve doğru cevap 500 koşu için yaklaşık 260'a düştü.

Yani evet, d seçimi beklenen x ve y değerlerine bağlıdır.

BoB


0

Bence p + (1-p) / 2 denkleminin Wapner genişlemesi ile görünen paradoks, (1-p) / 2> 0 olduğunu varsayar. D'nin birçok aralığı için bu değer 0'dır.

Örneğin: açık zarftaki değer üzerinde merkezlenen simetrik bir dağılımdan seçilen d, yanlış 1/2 ve doğru 1/2 olasılığı verir.

Asimetrik olarak seçilen herhangi bir dağılım, seçimi yanlış yönde 1/2 kez saptırmış gibi görünür.

D için bu denklemin geçerli olacağı şekilde bir aralık ve dağılım seçmenin bir yolu var mı?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.