«distance-functions» etiketlenmiş sorular

Mesafe işlevleri, bir kümenin üyeleri arasındaki veya nesneler arasındaki mesafe kavramını ölçmek için kullanılan işlevleri belirtir.


5
Kullanılacak en iyi mesafe ölçüsü
bağlam Karşılaştırmak istediğim iki veri setim var. Her iki kümedeki her veri elemanı 22 açı içeren bir vektördür (hepsi −π−π-\pi ve arasında ππ\pi). Açılar belirli bir insan poz konfigürasyonuyla ilgilidir, bu nedenle poz 22 eklem açısı ile tanımlanır. Nihayetinde yapmaya çalıştığım iki veri kümesinin "yakınlığını" belirlemektir. Bir setteki her poz …

1
Nitelikler nominal olduğunda bireyler için en uygun mesafe işlevi nedir?
Nominal (sıralanmamış kategorik) özellikler durumunda bireyler arasında hangi mesafe işlevinin kullanılacağını bilmiyorum. Bazı ders kitapları okuyordum ve Basit Eşleştirme işlevini önerdiler, ancak bazı kitaplar nominal değerleri ikili özelliklere değiştirip Jaccard Katsayısı kullanmam gerektiğini gösteriyor . Ancak, nominal özelliğin değerleri 2 değilse ne olur? bu özellikte üç veya dört değer varsa …

2
Kovaryans matrisi oluşturan değişkenler arasındaki mesafeler nelerdir?
Bir kovaryans matrisi var ve hiyerarşik kümeleme kullanarak (örneğin, bir kovaryans matrisi sıralamak için) değişkenleri kümelerine bölümlemek istiyorum .kn × nnxnn \times nkkk Değişkenler arasında tipik bir mesafe işlevi var mı (yani kare kovaryans matrisinin sütunları / satırları arasında)? Ya da daha fazlası varsa, konuyla ilgili iyi bir referans var …


1
Beyer ve ark. çalışma: “Yüksek Boyutlu Uzayda Mesafe Metriklerinin Şaşırtıcı Davranışı Üzerine” yanıltıcı mı?
Boyutsallığın lanetinden bahsederken bu sıklıkla belirtilir ve gider (göreceli kontrast adı verilen sağ formül) limd→ ∞var ( | | Xd| |kE[ | | Xd| |k]) =0,sonra: Dmaksimumkd- DminkdDminkd→ 0limd→∞var(||Xd||kE[||Xd||k])=0,sonra:Dmaksimumdk-DmindkDmindk→0 \lim_{d\rightarrow \infty} \text{var} \left(\frac{||X_d||_k}{E[||X_d||_k]} \right) = 0, \text{then}: \frac{D_{\max^{k}_{d}} - D_{\min^{k}_{d}}}{D_{\min^{k}_{d}}} \rightarrow 0 Teoremin sonucu, belirli bir sorgu noktasına olan maksimum …

3
PCA üzerinden Mahalanobis mesafesi
Benim bir n×pn×pn\times p matris, nerede ppp gen sayısı ve nnnhasta sayısıdır. Bu tür verilerle çalışan herkes şunu bilir:ppp her zamankinden daha büyük nnn. Özellik seçimini kullanarak aldımppp ancak daha makul bir sayıya ppp hala daha büyük nnn. Hastaların genetik profillerine dayanarak benzerliklerini hesaplamak istiyorum; Öklid mesafesini kullanabilirim, ancak Mahalanobis …

1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.