Sınıfta örnekler vermek için minik (gerçek) veri setleri?


43

Giriş seviyesi bir sınıf öğretirken, tanıdığım öğretmenler öğrettikleri yöntemi örneklemek için bazı sayılar ve bir hikaye icat etme eğilimindedir.

Tercih edeceğim şey, gerçek rakamlarla gerçek bir hikaye anlatmak. Bununla birlikte, bu hikayelerin, el ile hesaplamaları mümkün kılan çok küçük bir veri kümesiyle ilgili olması gerekir.

Bu veri setleri için herhangi bir öneri çok memnuniyetle karşılanacaktır.

Küçük veri kümeleri için bazı örnek konular:

  • korelasyon / regresyon (temel)
  • ANOVA (1/2 yol)
  • z / t testleri - bir / iki eşleştirilmemiş / eşlenmemiş örnek
  • oranların karşılaştırılması - iki / çok yönlü tablolar

küçüğü tanımlayabilir misiniz? 'Manuel' hesaplama, hesap makinesinin kullanımını içerir mi?
David LeBauer

Merhaba David - hesap makinesi gayet iyi - ancak fikir çok fazla sayıya sahip olmamaktır (Hepsi tahtaya yazılması gerektiğinden)
Tal Galili

Yanıtlar:


26

Veri ve hikaye kütüphane bir "temel istatistik yöntemlerinin kullanımını gösteren veri dosyalarının ve hikayeler online kütüphane" dir.

Bu site ihtiyacınız olana sahip gibi gözüküyor ve belirli veri setleri için arama yapabilirsiniz.


Merhaba David - bağlandığınız site gerçekten harika - teşekkürler.
Tal Galili

Hizmet şu anda kullanılamıyor (Nisan 2016 itibariyle)
Felipe Almeida

@FelipeAlmeida Siteye yeni girdim; lütfen farklı bir bilgisayar / cihazda, tekrar kontrol edin
David LeBauer

@DavidLeBauer "tüm konuları listele" yi tıklayıp yöntemlerden birini seçmeyi denediniz mi? bkz burada bu bağlantıyı
Felipe Almeida

1
@FelipeAlmeida görüyorum. Sitenin sağlayıcısı ile konuştum '', yakında dasdes.datadesk.com adresinde yeni, daha modern ve daha iyi bir DASL arayın.'
David LeBauer

23

DJ Hand, F. Daly, AD Lunn, KJ McConway ve E. Ostrowski'nin "Küçük Veri Kümelerinin El Kitabı" adlı bir kitabı var. NCSU’daki İstatistik departmanı elektronik olarak bu kitaptaki veri setlerini buraya gönderdi .

Yukarıdaki web sitesi sadece verileri vermektedir; Sayıların ardındaki öyküyü, yani, veri kümesinin başlığından toplayabildiğinizin ötesindeki herhangi bir hikayeyi elde etmek için kitabı okumanız gerekir. Ama, bunlar küçük ve bunlar gerçek .


Bunlar sadece doğru beden. Kitabı google alimi üzerinde "Küçük Veri Kümeleri El Kitabı" nı arayarak görüntüleyebilirsiniz - kitabın bir kısmını google kitaplarında görebilirsiniz.
Felipe Almeida

Verilen bağlantı koptu. Lütfen linki güncelleyin. Thanks
MYaseen208

13

İki yönlü tablolar için, titanik yolcuların cinsiyetleri ve hayatta kalmalarına ilişkin verileri seviyorum:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

Bu verilerle, bağımsızlık için ki-kare testi ve bağıl oran ve oran oranı gibi birleşme ölçüsü gibi şeyler tartışılabilir. Örneğin, kadın yolcular, erkek yolculardan 4 kat daha fazla hayatta kalma ihtimaline sahipti. Aynı zamanda, erkek yolcular, kadın yolculardan ~ 2,5 kat daha fazla ölme ihtimalindeydi. Hayatta kalma / ölme için oran oranı her zaman 10'dur.


İyi fikir wolfgang, bunu düşünmedim.
Tal Galili

(Gönderi, diğer tüm cevaplar doğrultusunda topluluk wiki yaptı.)
Glen_b



4

Muhtemelen, açıkça belirtilmesi gerekmeyen açık bir cevap, ancak korelasyon ya da doğrusal regresyon için Anscombe'nın dörtlüsü mantıklı bir seçimdir. Her ne kadar gerçek verilerle gerçek bir hikaye olmasa da, kriterlerinize oldukça uygun bir örnek olduğunu düşünüyorum.


İyi örnek Andy - Bugün yeni bir şey öğrendim :)
Tal Galili


2

İstatistik Öğretimi için Kaynak Keşfi başlıklı güzel bir makale bu konuya ışık tuttu.


Kağıdın çoğunu okumayı yeni bitirdim (birkaç kısmı gözden geçirdim) - bu durumun iyi bir incelemesi. Bunun gelecekte nasıl gelişeceğini görmek ilginç olacak ...
Tal Galili

2
Anahtar noktaları buraya ekleyebilmeniz veya bir özet verebilmeniz mümkün mü? Bağlantı bir noktada öteye gidebilir ve okuyucunun, bağlantıyı tıklamak zorunda kalmadan daha fazla devam etmek isteyip istemediklerini bilmesine yardımcı olur.
gung - Reinstate Monica

1

https://tuvalabs.com

Uzun süredir aradığınızı bulduğunuza eminim, ama konuya rastlayan herhangi biri için - TuvaLabs, Sınıflar için veri setleri için iyi bir kaynaktır. Veri kümelerini, öykülerini, tanımlarını, küçük alıştırmaları ve görselleştirme yeteneklerini şifreler.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.