İstatistikte ben üstlenmesi gerektiğini için ortalama veya doğal logaritma ?


18

İstatistikleri inceliyorum ve genellikle içeren formüller ile karşılaşıyorum logve bunu standart anlamı log, yani temel 10 olarak yorumlamalıysam veya istatistiklerde sembolün log genellikle doğal log olduğu varsayılırsa her zaman kafam karışır ln.

Özellikle örnek olarak Good-Turing Frekans Tahminini inceliyorum , ama sorum daha genel bir soru.


2
"Birçok uygulama için, olabilirlik fonksiyonunun, günlük olabilirlik denilen doğal logaritması ile çalışmak daha uygundur." en.wikipedia.org/wiki/Likelihood_function#Log-likelihood İstatistiklerde genellikle olabilirlik fonksiyonu ile çalışırız, genellikle bu lndikkate alınır. Ancak, ikisi birbiriyle ilişkilidir: log(x) = ln(x) / ln(10) = ln(x) / 2.303ve ln- olasılık fonksiyonu log10- olasılık fonksiyonu ile aynı noktada ekstremuma ulaşır .
John_West

5
Birkaç özel uygulama alanında, söz konusu olduğunda, temel 10 amaçlanmıştır, ancak Aksakal'ın belirttiği gibi, aksi takdirde matematikte kullanılan bir konudur - süssüz bir doğal log anlamına gelir. loglog
Glen_b

2
@John_West'in dediği gibi ve bir ölçeklendirme faktörü ile aynıdır. Yani bunlar sadece başka bir birimde ölçtüğünüz gibi ln(x)loga(x)

1
@Aksakal; söylediğiniz şey, birimin önemli olduğunu söylemeye geliyor (yukarıdaki yorumuma bakın), kabul ediyorum. Ayrıca tabanı açıkça belirtmek için yazdım . Bununla birlikte, istatistiklerde maksimum olasılık gibi (bazı) uygulamalar için, bu ölçeklendirme faktörü saygısızdır. Ölçeklendirme faktörü eklendikten sonra maksimum değer değişmez. OP referansında (iyi turing ...) (veya ) karşı . Bu, ünitenin çizimin her iki ekseninde de değiştiği ve çizilen '' eğri '' nin değişmediği anlamına gelir. logalog(Nr)log(Zr)log(r)

1
Eğer bir makale yazmazsanız, log-olasılık olasılığını kullanırken bile ölçek (logaritmanın temeli) genellikle önemlidir. Örneğin, günlük olabilirlik oranı test istatistikleri kullanır, kritik değerleri kullanmak için diğer tabandan ayarlamanız gerekir. Yazılım yazıyorsanız, kağıtlardan vb. Günlük olabilirlik işlevlerini kullanırken tabanı doğru bir şekilde almak önemlidir. ln
Aksakal

Yanıtlar:


20

İstatistiklerde açık temel olmadan kabul edilebilir , çünkü temel 10 günlük istatistiklerde çok sık kullanılmaz. Bununla birlikte, diğer posterler, log 10 veya diğer bazların, istatistiklerin uygulandığı bazı diğer alanlarda, örneğin bilgi teorisinde ortak olabileceği bir nokta getirir . Yani, diğer alanlardaki kağıtları okuduğunuzda, bazen kafa karıştırıcı oluyor.log=lnlog10

Wikipedia'nın entropi sayfası , kullanımını karıştırmaya iyi bir örnektir . Aynı sayfada baz 2, e ve herhangi bir baz anlamına gelir . Bunun ne anlama geldiğini anlayabilirsiniz, ancak metni okumak gerekir. Bu, materyali sunmak için iyi bir yol değildir. Her formülde veya ln'de bazın açıkça gösterildiği Logaritma sayfası ile karşılaştırın . Şahsen ben bu gitmek için bir yol olduğunu düşünüyorum: işareti kullanıldığında her zaman tabanı gösterir . Bu , @Henry'nin işaret ettiği gibi , sembollü belirtilmemiş taban kullanımını tanımlamaması için ISO ile de uyumlu olacaktır .logelnloggünlük

Son olarak, ISO 31-11 standart reçete ve tabanı 2 ve 10 logaritma için işaretler. Her ikisi de bu günlerde nadiren kullanılıyor. Lisede kullandığımızı hatırlıyorum , ama bu başka bir yüzyılda başka bir dünyada oldu. İstatistiksel bağlamda kullanıldığından beri hiç görmedim. LaTeX'te etiketi bile yok .1 pound = 0.45 kglglg1 pound = 0.45 kg


1
Baz 2 logaritmaları bazı alanlarda da oldukça yaygındır. Süslenmemiş günlük nadiren taban 10'dur, ancak her zaman taban e değildir .
Nükleer Wang

Yararlı, ama "nadiren" çok güçlü olduğunu düşünüyorum. İnsanların temel 10 logaritmaları bildikleri veya en iyi bildiklerini bildikleri önemli alanlar vardır. Birçok grafiğin 10'luk güçleri kullanarak logaritmik ölçekler gösterdiğine dikkat edin. Doğal logaritmaları tercih eden biri bu tür ölçeklerin kodunu çözmekte zorluk çekmez, ancak varsayım 10
Nick Cox

@NickCox, OP özellikle "istatistik" i bir alan olarak belirtir ve istatistiklerde sıkça kullanılan temel 10 logaritmasını görmüyorum.
Aksakal

ISO 31-11 , günlük e için belirtiyor ve süssüz bir günlüğü tanımsız bırakıyorlnlogelog
Henry

1
@NickCox, dili yumuşattım, adil bir nokta getirdin
Aksakal

14

Değişir.

Bir değeri desibel'e dönüştürmek gibi birkaç bağlamın dışında, temel 10 logaritmaları denklemlerde oldukça nadirdir. Bununla birlikte, log ölçeği grafikleri genellikle taban-10'dur, ancak eksenlerdeki etiketlerden doğrulanması oldukça kolay olmalıdır.

Matematiksel bir bağlamda, süslenmemiş bir doğal kütük olması muhtemeldir (yani log e veya ln ). Öte yandan, bilgisayar bilimi genellikle base-2 logaritmalarını kullanır ( log 2 ) ve her zaman açıkça bu şekilde işaretlenmezler. İyi haber şu ki, bazlar arasında önemsiz bir şekilde dönüştürebilirsiniz ve "yanlış" tabanı kullanmak sadece cevabınızı sabit bir faktörle çözecektir.loglogelnlog2

Gale'nin 1995 tarihli "Gözyaşı Olmadan İyi Şekillendirme" belgesinde, metindeki logaritmalar aslında (bu, sayfa 5'de söylüyor), ancak ekteki R / S + kodu , aslında log e veya ln olan fonksiyonu kullanır. . @ Henry'nin aşağıda belirttiği gibi, bu pratik bir fark yaratmaz.log10loglogeln

Tahmin etmek zorunda kalsaydım, bazı sezgisel yöntemler:

  • 2, veya 10 kuvvetleri de mevcutsa, kütüklerin karşılık gelen tabana sahip olmaları muhtemeldir.e

  • (veya daha genel olarak kalkülüs içerir) entegrasyonundan kaynaklanıyorsa, muhtemelen doğal bir günlük olacaktır.1/x

  • Bir şeyi tekrar tekrar yarıya bölmekten kaynaklanıyorsa (ikili aramada olduğu gibi), muhtemelen . Daha genel olarak bir şey göre bölünebilir n yaklaşık log n zamanlarda.log2nlogn

  • Bilgi-teorik hesaplamalar , özellikle modern çalışmalarda kullanır . Ancak, emin olmak için birimleri kontrol edebilirsiniz: bitlerlog 2 , natsln ve yasaklarlog 10 .log2bitslog2natslnbanslog10

  • Bir fonksiyonun düştüğü veya yükseldiği noktayı bulma değerinin (sırasıyla% 37 ve% 63) bir doğal değer olduğunu gösterir.1e or 11e


5
+1. Küçük bir ipucu, eğer exponentials bulunursa, doğal logaritmanın 10 veya 2 güçleri ile daha muhtemel ve tersi olması durumunda, hangi taban kullanılıyorsa, belirsiz kalırsa, yazarların örnek hesaplamalarını yeniden oluşturmaya çalışın. exp()
Nick Cox

2
Gale'nin kağıdının 6. ve 7. sayfalarındaki grafikler bir günlük ölçeğinde orijinal birimleri gösterdiğinden ve hesaplamalar bir günlük-günlük ilişkisinin eğimine yöneliktir, yani ifade günlüğündeki ( N r ) = a + b günlüğü ( r ) karşılık gelir N r = bir r b , bu durumda herhangi bir değişiklik yaratanblog(Nr)=a+blog(r)Nr=Arb
Henry

2
başka bir örneği borsa verilerini platforma ederken, günlük fiyatı ekseni kullanırken her zaman taban 10'dur.base10
Marcus D

3

Sorunuzu cevaplamak için: hayır, logaritma için genel bir sabit gösterim kabul edemezsiniz.

Benzer bir soru geçtiğimiz günlerde SE.Math'de tartışıldı : Üç tip logaritma arasındaki fark nedir? matematiksel açıdan. Genellikle alışkanlıklara ( tıbbi araştırmalarda kullanım gibi görünüyor ) veya dile (örneğin Almanca, Rusça, Fransızca) bağlı farklı gösterimler vardır . Ne yazık ki, aynı gösterim bazen farklı tanımları temsil eder. Yukarıdaki SE.Math bağlantısından alıntı:log10

(neredeyse) notasyonu açık bir şekilde doğal logaritma log e x (latin: logarithmus naturalis) veya e tabanındaki logaritmayı belirtir . Gösterim günlüğü x , doğal logaritma için benimsenmiş gösterim olmalıdır ve matematikte de böyledir. Bununla birlikte, genellikle alana bağlı olarak "en doğal" olanı temsil eder: Bunu okulda 10 logaritma ( log 10 ) olarak öğrendim ve genellikle mühendislikte bu şekilde kullanılır (örneğin desibel tanımında)lnxlogexelogx10log10

Oldukça sık, eğer fiziksel birimlerin anlamı ile ilgilenmiyorsanız (desibel @Matt Krause gibi) veya belirli değişim oranları ile ilgilenmiyorsanız (biyoistatistikte, kat değişimi için orantı genellikle taban- 2 logaritma günlüğünü gösterir 2 ), büyük olasılıkla doğal logaritmanın ( log e ) kullanılması muhtemeldir . log2log2loge

Örneğin, güç veya Box-Cox dönüşümlerinde (varyans stabilizasyonu için), üssü olduğunda doğal logaritma bir sınır olarak görünür .0

İlk motivasyonunuza, İyi Dönen Frekans Tahminine geri dönersek, Türlerin Nüfus Frekansları ve Nüfus Parametrelerinin Tahmini , IJ Good, Biometrika, 1953. Burada farklı bağlamlarda logaritmalar kullandı: harmonik serilerin toplamı, entropi varyans stabilizasyonu (Bartlett ve Anscombe'dan bahsederek). Genellikle doğal logaritma olarak kullandığını görüyoruz ve makalede bağlamın gerektirdiği durumlarda log e veya log 10'u belirtiyor. Varyans stabilizasyonu veya temel entropi kestirimi için, sonuç doğrusal bir değişikliğe izin verdiği için logaritma üzerindeki bir faktör sonucu pek değiştirmez.loglogelog10


0

Gelen Akaike Bilgi Kriteri nokta e ve ln(L^) en yüksek olabilirlik ve L parametreleri sayısı toplamalı karşılaştırılan k : A I C = 2 ( k - ln ( L ) ) .L^k

AIC=2(kln(L)).

Dolayısıyla, AIC'deki logaritma için başka bir taban kullanırsanız, yanlış sonuç çıkarmanız ve yanlış modeli seçmeniz gerekebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.