rakamları istatistiksel olarak rasgele mi?


33

Diziyi izlediğinizi varsayalım:

7, 9, 0, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 2, 8. ..

Bunun gerçekten rastgele olup olmadığını belirlemek için hangi istatistiksel testleri uygularsınız? Bilginize bunlar π ninci basamağıdır . Bu nedenle, dig rakamları istatistiksel olarak rasgele mi? Sabiti ile ilgili bu demek bir şey mi tt ?nπππ

görüntü tanımını buraya girin




10
Bu ilginç ve çıldırtıcı bir soru. Ölçü-teorik olasılık konusunda ilk dersi alan herhangi bir öğrenci, "neredeyse hepsinin" gerçek sayılarının normal olduğunu kolayca kanıtlayabilir . Ancak çok az sayıda açık örnek bilinmektedir ve (bilmediğim) bildiğim kadarıyla, konu “ünlü” akılcı matematiksel sabitlerin hiçbiri için çözülmedi.
kardinal

4
@ Cardinal adlı kullanıcının yorumu ile (katı) bağlantıda: Normal sayı

6
Grafik nedir Garip aralıklı ve tümü% 10'un üzerindeki değerlere sahip on çubuk var!
xan

Yanıtlar:



5

Sorularınızın sadece ilkini cevaplayarak: "Bu [sıralamanın] gerçekten rastgele olup olmadığını belirlemek için hangi testleri uygularsınız ?"

Bunu bir zaman serisi olarak ele almaya ve otomatik korelasyonları kontrol etmeye ne dersiniz? İşte bazı R kodu. İlk önce bazı test verileri (ilk 1000 basamak):

digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))

Her basamağın sayılarını kontrol edin:

> table(digits)
digits
  0   1   2   3   4   5   6   7   8   9 
 93 116 103 102  93  97  94  95 101 106 

Sonra bir zaman serisine çevirin ve Box-Pierce testini çalıştırın:

d=as.ts( digits )
Box.test(d)

bu bana söyler:

X-squared = 1.2449, df = 1, p-value = 0.2645

Genellikle, otomatik korelasyon olduğunu söylemek için p değerinin 0,05'in altında olmasını istersiniz.

acf(d)Otomatik korelasyonları görmek için koş . Buraya donuk bir tablo olduğu için bir resim eklemedim, ancak en büyük gecikmelerin 11 ve 22'de olması meraklı. Ancak acf(d,lag.max=40), gecikme = 33'te zirvenin olmadığını ve sadece tesadüf olduğunu göstermek için koşun !


PS Gerçek rastgele sayılar üzerinde aynı testleri yaparak bu 1000 basamak pi'nin ne kadar iyi olduğunu karşılaştırabiliriz.

probs=sapply(1:100,function(n){
    digits=floor(runif(1000)*10)
    bt=Box.test(ts(digits))
    bt$p.value
    })

Bu, 1000 rastgele basamak oluşturur, testi yapar ve bunu 100 kez tekrarlar.

> summary(probs)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900 
> sd(probs)
[1] 0.2904346

Bu yüzden, sonucumuz rahatça ilk standart sapma içinde oldu ve pi rastgele bir ördek gibi atladı. ( set.seed(1)Bu kesin sayıları çoğaltmak istiyorsanız kullandım .)


0

Bu garip bir soru. Sayılar rastgele değil.

π

,1212121212...

πππ2222+1ππ


π

π

2
Bu cevabı gerçekten takip etmiyorum. Evet, pi sabittir, ancak rakam dizisi hala bir dizi rasgele sayı gibi davranabilir. 0.1212'nin rastgele bir tanımı nasıl tanımladığını anlamıyorum. Yorumunuzda belirttiğiniz gibi, pi'nin bazı rasgele rakam dizileri içerip içermediği, rakamlarının rasgele doğası üzerinde çok az etkiye sahiptir. Peki neden buna odaklanın?
Nükleer Wang,

π

@AdamO Bu tahminde ancak önceden tanımladığınız sayının pi olduğunu bildiğiniz takdirde, aldatma gibi gözüktüğünü yapabilirsiniz. 3.141592'deki haneler, bir sonraki hanenin 6 olduğunu göstermez; Bunu bilmenin tek yolu, özellikle pi'yi tanımlamamızdır. Pi'yi N haneye kadar hesaplamadıysanız, N rakamının belirli bir sayı olmasını beklemeniz için hiçbir neden yoktur. Rasgele bir sayı dizisi diye bir şey olmadığını ima ediyor gibisiniz, çünkü bir kez yazdığınızda, sabit.
Nükleer Wang,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.