«distance-functions» etiketlenmiş sorular

Mesafe işlevleri, bir kümenin üyeleri arasındaki veya nesneler arasındaki mesafe kavramını ölçmek için kullanılan işlevleri belirtir.


6
Bir kümeleme yöntemi seçme
Benzer vakaları gruplandırmak için ayarlanmış bir veri üzerinde küme analizi kullanılırken, çok sayıda kümeleme yöntemi ve uzaklık ölçüsü arasından seçim yapılması gerekir. Bazen bir seçim diğerini etkileyebilir, ancak birçok olası yöntem kombinasyonu vardır. Çeşitli kümeleme algoritmaları / yöntemleri ve mesafe ölçütleri arasından nasıl seçim yapılacağı konusunda herhangi bir tavsiyesi olan …

6
Neden k-araçlar kümeleme algoritması sadece Öklid uzaklık metriğini kullanıyor?
Verimlilik veya işlevsellik açısından k-aracı algoritmasının örneğin uzaklık ölçüsü olarak kosinüs (dis) benzerliğini kullanmadığı, ancak sadece Öklid normunu kullanabileceği belirli bir amaç var mı? Genel olarak, K-aracı yöntemi Öklid'den başka mesafeler göz önüne alındığında veya kullanıldığında uygun olacak ve doğru olacak mı? [@ Ttnphns ilavesi. Soru iki katlıdır. "(Olmayan) Öklid …

3
Öklid mesafesinin normal dağılıma rastgele iki değişken arasındaki dağılımı nedir?
Kesin konumları bilinmeyen ancak bilinen parametrelere sahip normal dağılımlara göre dağıtılmış (örneğin ve iki nesne verildiğini varsayalım . Bunların her ikisinin de iki değişkenli normlar olduğunu varsayabiliriz; öyle ki, konumlar koordinatları üzerinde bir dağılımla tanımlanır (yani, ve , sırasıyla ve için beklenen koordinatlarını içeren vektörlerdir ). Ayrıca nesnelerin bağımsız olduğunu …



1
Farklı mesafeler ve yöntemler ile elde edilen hiyerarşik kümeleme dendrogramlarının karşılaştırılması
[İlk sıradaki "Hiyerarşik kümelenme ağaçları için benzerliğin ölçülmesi" başlığı daha sonra konuyu daha iyi yansıtacak şekilde @ tnphns tarafından değiştirildi] Hasta kayıtlarının bir veri çerçevesi üzerinde bir dizi hiyerarşik küme analizi yapıyorum (örneğin, http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) Ağacın son kümeleri / yapısı / görünümü üzerindeki etkilerini anlamak için farklı uzaklık ölçüleri, farklı …

5
İki değişkenli dağılım arasındaki “mesafenin” ölçülmesi
Kaynak aramayı kolaylaştırmak için ne yapmaya çalıştığımı tanımlamak için iyi bir terminoloji arıyorum. Yani, her biri iki ve X ile ilişkili iki A ve B noktası kümesine sahip olduğumu ve A ile B arasındaki "mesafeyi" ölçmek istediğimi - yani aynı dağılımdan örneklenmelerinin ne kadar muhtemel olduğunu varsayalım. (Dağılımların normal olduğunu …

2
İki dağılım arasındaki Hellinger mesafesinin tarafsız bir tahmincisi var mı?
Bir kişinin yoğunluğu olan bir dağılımdan dağıtıldığı bir , Hellinger mesafesinin yoğunluğu olan başka bir dağılıma yani tarafsız bir tahmincisi ( ' dayalı) olup olmadığını merak ediyorum. f X i f 0 H ( f , f 0 ) = { 1 - ∫ X √X1,…,XnX1,…,XnX_1,\ldots,X_nfffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 …

1
Ağırlıklı Öklid mesafesi ne zaman kullanılır ve kullanılacak ağırlıklar nasıl belirlenir?
Her verinin farklı ölçekten oluştuğu bir veri setim var . Her hesaplama için bir kıyaslama değerim var. Her verinin kıyaslama değerine ne kadar yakın olduğunu bilmek istiyorum.nnn Ağırlıklı Öklid Mesafesini şu şekilde kullanmayı düşündüm: dx , b= ( ∑ni = 1wben( xben- bben)2) )1 / 2dx,b=(Σben=1nwben(xben-bben)2))1/2\hspace{0.5in} d_{x,b}=\left( \sum_{i=1}^{n}w_i(x_i-b_i)^2)\right)^{1/2} nerede xbenxben\hspace{0.5in}x_i …

3
Manhattan mesafesini Ward'ın hiyerarşik kümelemede kümeler arası bağıyla kullanmak uygun mudur?
Zaman serisi verilerini analiz etmek için hiyerarşik kümeleme kullanıyorum. Kodum, aşağıdaki girdiler verildiğinde hiyerarşik kümeler oluşturan Mathematica işlevi kullanılarak uygulanır DirectAgglomerate[...]: bir mesafe matrisi D kümeler arası bağlantıyı belirlemek için kullanılan yöntemin adı. Manhattan mesafesini kullanarak D mesafe matrisini hesapladım: d(x,y)=∑i|xi−yi|d(x,y)=∑i|xi−yi|d(x,y) = \sum_i|x_i - y_i| burada ve zaman serilerimdeki veri …


3
Kümeleme için
Herkes kullanımı mu veya yerine kümeleme ilişkin metrikleri ? Aggarwal ve ark., Yüksek boyutlu uzayda mesafe ölçütlerinin şaşırtıcı davranışı üzerine (2001 yılında)L .5 L 2L1L1L_1L.5L.5L_.5L2L2L_2 L 2L1L1L_1 , yüksek boyutlu veri madenciliği uygulamaları için Öklid uzaklık metriği sürekli olarak daha fazla tercih edilir L2L2L_2 ve veya daha iyi olabileceğini iddia …

3
Öklid uzaklık puanı ve benzerliği
Sadece Kolektif İstihbarat (Toby Segaran tarafından) kitabıyla çalışıyorum ve Öklid uzaklık skoruyla karşılaştım. Kitapta yazar, iki öneri dizisi arasındaki benzerliğin nasıl hesaplanacağını gösterir (yani, .kişi × film ↦ puanı )kişixfilm↦Puan)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) İki kişilik Öklid mesafeyi hesaplar ve göre p1p1p_1p2p2p_2d( p1, p2) = ∑i ∈ öğe ( sp1- …

1
R - serbestlik derecesinde PROC Mixed ve lme / lmer arasındaki farklar
Not: önceki sorumun yasal nedenlerle silinmesi gerektiğinden, bu soru bir gönderidir. Fonksiyonlu SAS PROC MIXED karşılaştırarak birlikte lmegelen nlmeR paketin, bazı çok kafa farklılıklar tökezledi. Daha spesifik olarak, farklı testlerdeki özgürlük dereceleri ve arasında farklılık gösterir PROC MIXEDve lmenedenini merak ettim. Aşağıdaki veri kümesinden başlayın (R kodu aşağıda verilmiştir): ind: …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.