«dataset» etiketlenmiş sorular

Veri kümesi istekleri bu sitede konu dışıdır. Veri kümeleri oluşturma, işleme veya bakımını yapma ile ilgili sorular için bu etiketi kullanın.

2
Bir veritabanı için kalite güvencesi ve kalite kontrol (KG / KK) yönergeleri
Arka fon Birincil literatürden bir veri tabanına veri girişini denetliyorum . Veri girişi süreci hataya açıktır, özellikle kullanıcılar deneysel tasarımı yorumlamalı, grafik ve tablolardan veri çıkarmalı ve sonuçları standartlaştırılmış birimlere dönüştürmelidir. Veriler MySQL veritabanına bir web arayüzü üzerinden girilir. Şimdiye kadar> 20 değişken,> 100 tür ve> 500 alıntıdan 10 binden …

10
Sosyal ağ veri kümeleri
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. Sınıflandırma görevleri için tercihen arff formatında sosyal ağ veri kümelerini (twitter, friendfeed, facebook, lastfm, vb.) Arıyorum. UCI ve Google üzerinden yaptığım aramalar şu ana kadar başarılı olamadı …

2
95. persentilin hesaplanması: Normal dağılım, R Quantile ve Excel yaklaşımlarının karşılaştırılması
Aşağıdaki veri kümesinde 95. yüzdelik dilimi hesaplamaya çalışıyordum. Birkaç çevrimiçi referansla karşılaştım. Yaklaşım 1: Örnek verilere dayanarak İlki elde etmek söyler TOP 95 Percentseçmek sonra veri kümesinin ve MINya AVGçıkan setin. Aşağıdaki veri kümesi için bunu yapmak bana verir: AVG: 29162 MIN: 0 Yaklaşım 2: Normal Dağılım Var İkincisi ise …
17 r  dataset  quantiles  sql 

6
Büyük bir metin grubu nerede bulunur? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 6 yıl önce kapalı . İndirmek için büyük (> 1000) metin topluluğunu arıyorum. Tercihen dünya haberleriyle veya bir tür raporla . Sadece patentli bir tane …
16 dataset 

5
Eğitim verilerinin arttırılmasının genel sistem doğruluğu üzerinde nasıl bir etkisi vardır?
Birisi benim için olası örneklerle özetleyebilir mi, hangi durumlarda eğitim verilerinin arttırılması genel sistemi iyileştirir? Daha fazla eğitim verisi eklemenin, muhtemelen verilerin üzerine sığabileceğini ve test verileri üzerinde iyi doğruluk sağlayamayacağını ne zaman tespit ederiz? Bu çok spesifik olmayan bir sorudur, ancak belirli bir duruma özgü olarak cevaplamak istiyorsanız, lütfen …

4
İstatistiksel analizin belirli yönlerini gösteren iyi veri kümeleri nelerdir?
Bunun öznel olduğunu anlıyorum, ancak favori veri setlerimiz ve onları ilginç kıldığını düşündüğümüz hakkında konuşmanın güzel olacağını düşündüm. Orada zengin bir veri var ve tüm API'lerle (örneğin, Datamob ) klasik veri kümeleri (örneğin, R verileri ) ile birlikte, bunun çok ilginç tepkilere sahip olabileceğini düşünüyorum. Örneğin, "Boston Housing" veri kümesi …
16 dataset 

3
Veri artırımı ve tren-doğrulaması bölünmesi nasıl yapılır?
Makine öğrenimini kullanarak görüntü sınıflandırması yapıyorum. Bazı eğitim verilerim (resimlerim) olduğunu ve verileri eğitim ve doğrulama setlerine böldüğümü varsayalım. Ve ayrıca rastgele döndürmeler ve gürültü enjeksiyonu ile verileri (orijinallerinden yeni görüntüler üretmek) artırmak istiyorum. Güçlendirme çevrimdışı yapılır. Veri güçlendirmeyi yapmanın doğru yolu hangisidir? Önce verileri eğitim ve doğrulama kümelerine ayırın, …

5
Sadece eğitim veri kümesinde keşifsel veri analizi yapmak daha mı iyi?
Veri kümesinde keşifsel veri analizi (EDA) yapıyorum. Sonra bağımlı bir değişkeni tahmin etmek için bazı özellikleri seçeceğim. Soru şu: EDA'yı sadece eğitim veri setimde yapmalı mıyım? Ya da eğitim ve test veri setlerine birlikte katılmalı mıyım, sonra da ikisi üzerinde EDA mı yapmalı ve bu analize dayalı özellikleri mi seçmeliyim?

4
Ücretsiz kamu yararına veri barındırma? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 4 yıl önce kapalı . Http://data.barrycarter.info/ adresinde birçok istasyon için saatlik ve günlük sıcaklık raporlarım var İnsanları indirmeye teşvik ediyorum, ancak 6.6G'de çok fazla bant …
14 dataset 

6
Bir tanımlayıcıya göre gruplandırılmış bir veri çerçevesinin ilk satırını almanın hızlı yolları [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu , Çapraz Doğrulanmış için konuyla ilgili olacak şekilde güncelleyin . 2 yıl önce kapalı . Bazen, kişi başına birden fazla gözlem olduğunda yaş ve cinsiyet alırken, bir tanımlayıcı tarafından gruplandırılmış bir veri kümesinin …
14 r  dataset  aggregation  plyr 

2
K-kat çapraz doğrulaması eğitim / doğrulama / test setleri bağlamına nasıl uyuyor?
Benim asıl sorum, k / kat çapraz doğrulamanın eğitim / doğrulama / test setlerine sahip olma bağlamında nasıl uyduğunu anlamaya çalışmakla ilgilidir (eğer bu bağlamda uyuyorsa). Genellikle, insanlar verileri bir eğitim, validasyon ve test setine - örneğin Andrew Ng'in kursu başına 60/20/20 oranında) bölmekten söz ederler, böylece doğrulama seti model …

4
Klinik araştırmalar hakkında ham veriler nerede bulunur? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Konuyla ilgili olacak şekilde soruyu güncelleyin Çapraz doğrulanmış için. 2 yıl önce kapalı . Yüksek lisans öğrencilerimin yıl sonu sınavı için klinik araştırmalarla ilgili ham verileri kullanmak istiyorum. Bu veriler, denemeler tamamlandığı sürece herhangi …


4
İki popülasyonun örnekten ayrılması
İki grup veri tek bir veri kümesinden ayırmaya çalışıyorum. Popülasyonlardan birinin normal olarak dağıldığını ve numunenin en az yarısı kadar olduğunu varsayabilirim. İkincisinin değerleri, birincinin değerlerinden daha düşük veya daha yüksektir (dağılım bilinmemektedir). Ne yapmaya çalışıyorum normal dağıtılmış nüfusu diğerine kapsayacak üst ve alt sınırları bulmaktır. Benim varsayım bana başlangıç …

4
Verileri toplama ve analiz etmenin en iyi yolları
Kısa süre önce kendime öğretmeye başladım Makine Öğrenimi ve Veri Analizi Kendimi büyük veri kümeleri oluşturma ve sorgulama ihtiyacı üzerine bir tuğla duvara çarptım. Mesleki ve kişisel hayatımda topladığım verileri almak ve analiz etmek istiyorum, ancak aşağıdakileri yapmanın en iyi yolundan emin değilim: Bu verileri nasıl saklamalıyım? Excel? SQL? ?? …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.