«large-data» etiketlenmiş sorular

'Büyük veri', gözlem sayısının (veri noktaları) o kadar fazla olduğu, veri analistinin analizi düşündüğü veya yürütme biçiminde değişiklik yapılmasını gerektirdiği durumlar anlamına gelir. ('Yüksek boyutluluk' ile karıştırılmamalıdır.)

1
RMSE'ye dayalı bir doğruluk ölçüsü nasıl hesaplanır? Büyük veri kümem normal olarak dağıtılıyor mu?
Binlerce puanlık sırada birkaç veri setim var. Her veri kümesindeki değerler, uzayda bir koordinat anlamına gelen X, Y, Z'dir. Z değeri, koordinat çiftindeki (x, y) yükseklik farkını temsil eder. Tipik olarak CBS alanımda, yer-doğruluk noktası bir ölçüm noktasına (LiDAR veri noktası) çıkarılarak RMSE'de yükseklik hatasına referans verilir. Genellikle en az …

3
Çok büyük bir veri kümesinden önemli değişkenler nasıl hızlı bir şekilde seçilir?
Yaklaşık 2.000 ikili değişken / 200.000 satır içeren bir veri kümesi var ve tek bir ikili bağımlı değişken tahmin etmeye çalışıyorum. Bu aşamadaki ana amacım tahmin doğruluğu elde etmek değil, bu değişkenlerden hangisinin önemli yordayıcılar olduğunu tanımlamaktır. Son modelimdeki değişken sayısını yaklaşık 100'e düşürmek istiyorum. En önemli değişkenleri elde etmenin …

3
Yerden tasarruf sağlayan kümeleme
Gördüğüm çoğu kümeleme algoritması, daha büyük veri kümelerinde sorunlu hale gelen tüm noktalar arasında bire bir mesafeler oluşturmakla başlar. Bunu yapmayan var mı? Yoksa bir çeşit kısmi / yaklaşık / kademeli yaklaşımda mı? Hangi kümeleme algoritması / uygulaması O (n ^ 2) alanından daha az yer kaplıyor? Algoritmaların bir listesi …

1
Her MCMC yinelemesinde büyük bir veri kümesini alt örnekleyebilir miyim?
Sorun: Büyük bir veri kümesi üzerinde posterior çıkarmak için Gibbs örneklemesi yapmak istiyorum. Ne yazık ki, modelim çok basit değil ve bu nedenle örnekleme çok yavaş. Varyasyonel veya paralel yaklaşımları düşünürdüm, ama o zamana kadar gitmeden önce ... Soru: Her Gibbs yinelemesinde veri kümemden rastgele (değiştirerek) örnek olup olamayacağımı bilmek …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.