«information-theory» etiketlenmiş sorular

İletişim için kullanılan ya da soyut anlamda tanımlanan bir kanalın bilgi taşıma kapasitesini belirlemek için kullanılan bir matematik / istatistik dalı. Entropi, bilgi teorisyenlerinin rastgele bir değişkeni tahmin etmede belirsizliği ölçebilecekleri önlemlerden biridir.

3
Bir modelin Akaike Bilgi Kriteri (AIC) puanı ne anlama geliyor?
Burada meslekten olmayan anlamlarda ne anlama geldiği hakkında bazı sorular gördüm, ancak bunlar burada amacım için çok meslekten olmayanlar. AIC puanının ne anlama geldiğini matematiksel olarak anlamaya çalışıyorum. Ancak aynı zamanda, daha önemli noktaları görmememi sağlayacak kesin bir kanıt istemiyorum. Mesela, eğer bu hesapsa, sonsuzluklardan mutlu olurdum ve bu olasılık …

2
Bhattacharyya mesafesi ile KL diverjansı arasındaki farklar
Aşağıdaki sorular için sezgisel bir açıklama arıyorum: İstatistik ve bilgi teorisinde, iki ayrı olasılık dağılımı arasındaki farkın ölçütleri olarak Bhattacharyya uzaklık ile KL ayrışması arasındaki fark nedir? Kesinlikle hiçbir ilişkileri yok mu ve iki olasılık dağılımı arasındaki mesafeyi tamamen farklı bir şekilde ölçtüler mi?

5
Bilgi kazanımı, karşılıklı bilgi ve ilgili önlemler
Andrew More bilgi kazancını şöyle tanımlar : IG(Y|X)=H(Y)−H(Y|X)IG(Y|X)=H(Y)−H(Y|X)IG(Y|X) = H(Y) - H(Y|X) burada olan koşullu entropi . Ancak, Wikipedia yukarıdaki miktar karşılıklı bilgileri çağırır .H(Y|X)H(Y|X)H(Y|X) Vikipedi, bilgi kazancını iki rastgele değişken arasındaki Kullback – Leibler ayrıntısı (aka bilgi ayrışması veya göreceli entropi) olarak tanımlar : DKL(P||Q)=H(P,Q)−H(P)DKL(P||Q)=H(P,Q)−H(P)D_{KL}(P||Q) = H(P,Q) - H(P) …

4
İki kovaryans matrisi arasındaki benzerlik veya mesafenin ölçülmesi
İki simetrik kovaryans matrisi arasında benzerlik veya mesafe ölçütleri var mı (ikisi de aynı boyutlara sahip)? Burada, iki olasılık dağılımının KL farklılığına veya matrislere uygulanmadıkları sürece vektörler arasındaki Öklid mesafesine analogları düşünüyorum. Bir kaç benzerlik ölçümü olacağını hayal ediyorum. İdeal olarak, iki kovaryans matrisinin aynı olduğu gibi boş hipotezi test …

3
Bilgi teorisi OLMADAN Kullback-Leibler ıraksama
Cross Validated'in trollenmesinden sonra hala, KL bilgi ayrıntısını bilgi teorisi dünyasının dışında anlamaya daha yakın olduğumu hissetmiyorum. Bilgi teorisi açıklamasını daha kolay anlayabilmeniz için Matematik kökenli biri olarak oldukça garip. Anlayışımı bir bilgi teorisi altyapısından özetlemek için: Sınırlı sayıda sonuç içeren rastgele bir değişkenimiz varsa, sonucu ortalama olarak en kısa …

3
Maksimum Entropi Dağılımının istatistiksel yorumu
Çeşitli ortamlarda birkaç dağıtımın kullanımını doğrulamak için maksimum entropi ilkesini kullandım; Bununla birlikte, henüz bilgi teorik olarak, maksimum entropinin yorumlanmasının aksine bir istatistik formüle edebildim. Başka bir deyişle, entropiyi en üst düzeye çıkarmak, dağılımın istatistiksel özellikleri hakkında ne anlama geliyor? Kimsenin karşısına geçip veya belki de maks. Bilgiye hitap etmeyen, …

2
GINI skoru ile log-olabilirlik oranı arasındaki ilişki nedir?
Sınıflandırma ve regresyon ağaçlarını inceliyorum ve ayrık konum için alınacak önlemlerden biri GINI puanı. Şimdi iki dağıtım arasında aynı verinin olabilirlik oranının günlüğü sıfır olduğunda en iyi bölünme konumunu belirlemeye alışkınım, yani üyelik olasılığının eşit olması muhtemel. Sezgim, GINI'nin matematiksel bir bilgi teorisinde iyi bir temele sahip olması gerektiğini (Shannon) …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
Doğrusal olmayan korelasyonları saptamak için MIC algoritması sezgisel olarak açıklanabilir mi?
Daha yakın zamanlarda iki makale okudum. Birincisi korelasyonun tarihiyle, ikincisi ise Maksimal Bilgi Katsayısı (MIC) adı verilen yeni yöntemle ilgilidir. Değişkenler arasındaki doğrusal olmayan korelasyonları tahmin etmek için MIC yöntemini anlama konusunda yardımınıza ihtiyacım var. Dahası, R'de kullanımıyla ilgili talimatlar yazarın web sitesinde ( İndirmeler altında ) bulunabilir: Umarım bu …

2
Ampirik entropi nedir?
Birlikte tipik kümelerin tanımında ("Bilgi Teorisinin Unsurları", ch. 7.6, s. 195), olarakampirik entropibir bölgesininNile tanıyan sekansp(xn)=Π n i = 1 p(xi). Bu terminolojiye daha önce hiç rastlamadım. Kitabın dizinine göre hiçbir yerde açıkça tanımlanmamıştır.−1nlogp(xn)−1nlog⁡p(xn)-\frac{1}{n} \log{p(x^n)}nnnp(xn)=∏ni=1p(xi)p(xn)=∏i=1np(xi)p(x^n) = \prod_{i=1}^{n}{p(x_i)} Benim sorum temelde: Neden ampirik entropi olduğunu burada p ( x )−∑xp^(x)log(p^(x))−∑xp^(x)log⁡(p^(x))-\sum_{x}{\hat p …


3
Kullback-Leibler diverjansının analizi
Aşağıdaki iki olasılık dağılımını ele alalım P Q 0.01 0.002 0.02 0.004 0.03 0.006 0.04 0.008 0.05 0.01 0.06 0.012 0.07 0.014 0.08 0.016 0.64 0.928 eşit olan Kullback-Leibler ıraksamasını , genel olarak bu sayı bana ne gösteriyor? Genel olarak, Kullback-Leibler ıraksaması bana, birinin olasılık dağılımının diğerinden ne kadar uzak …

1
KL sapması neden negatif değildir?
KL sapması neden negatif değildir? Bilgi teorisi açısından, bu kadar sezgisel bir anlayışa sahibim: Diyelim ki etiketlenmiş aynı elemanlardan oluşan iki ve topluluğu var . ve , sırasıyla ve topluluğu üzerinde farklı olasılık dağılımlarıdır .AAABBBxxxp(x)p(x)p(x)q(x)q(x)q(x)AAABBB Bilgi teorisi perspektifinden bakıldığında, , topluluğu için bir elemanını kaydetmek için gereken en az miktarda …

2
R'de AIC “elle” hesaplanıyor
R doğrusal bir regresyon AIC hesaplamak denedim, ancak AICböyle bir işlevi kullanmadan : lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Ancak, AICfarklı bir değer verir: AIC(lm_mtcars) [1] 190.7999 Biri bana neyi yanlış yaptığımı söyleyebilir mi?

1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.