Güncelleme: Sorunun temel noktası, zaman karmaşıklığını elde etmek için depolama sırasına ihtiyaç duyulmasıdır.O(nlog(n))O(n)
Hayır, , tüm arasında öğesini seçmenin zaman karmaşıklığı için alt teorik sınırdır (bakınız (1)) mümkün .O(nlog(n))kthn(n−1)2|xi−xj|:1≤i<j≤n
alanı elde edebilirsiniz , ancak sadece zamanında tüm kombinasyonlarını saf bir şekilde kontrol ederek .O(1)xi−xjO(n2)
İyi haber şu ki , paketteki işlevde uygulanan ölçeklendirmenin ölçeklendiricisini (gelişmiş bir sürüm ve bazı zamanlama karşılaştırmaları için bkz. (2) ve (3)) kullanabilirsiniz
. Tek değişkenli tahmincisi iki aşamalı (yani yeniden ağırlıklı) bir ölçek tahmincisidir. Yüzde 95 Gauss verimliliği, yüzde 50 kırılma noktası ve zaman ve alanının karmaşıklığı vardır (ayrıca tekrarlanan kullanımda hesaplama maliyetlerinin yarısını tıraş ederek - kolayca çevrimiçi olarak yapılabilir) Bu seçeneği uygulamak için kodu kazmak zorunda kalacak , bunu yapmak oldukça basittir).ττ O ( n ) O ( 1 )scaleTau2()
R
robustbase
τO(n)O(1)R
- X + Y'deki seçim ve sıralamanın karmaşıklığı ve sıralı sütunlarla matrisler GN Frederickson ve DB Johnson, Bilgisayar ve Sistem Bilimleri Dergisi Cilt 24, Sayı 2, Nisan 1982, Sayfa 197-208.
- Yohai, V. ve Zamar, R. (1988). Etkili ölçeğin minimize edilmesi yoluyla yüksek kırılma noktası regresyon tahminleri. Amerikan İstatistik Derneği Dergisi 4040-413.
- Maronna, R. ve Zamar, R. (2002). Yüksek boyutlu veri kümeleri için sağlam konum ve dağılım tahminleri. Teknometri 44307–317
Düzenle Bunu kullanmak için
- Çalıştır
R
(ücretsiz ve indirilebilir burada )
- Paketi yazarak yükleyin:
install.packages("robustbase")
- Paketi yazarak yükleyin:
library("robustbase")
- Veri dosyanızı yükleyin ve işlevi çalıştırın:
mydatavector <- read.table("address to my file in text format", header=T)
scaleTau2(mydatavector)