Kesikli veri ile sürekli veri arasındaki fark nedir?


62

Kesikli veri ile sürekli veri arasındaki fark nedir?


2
Önce Google’ı denedin mi? Benim için, o verir bu .
robin girard

İşte sorunuzu cevaplayan güzel bir video. youtube.com/watch?v=MIX3ZpzEOdM

2
Sadece dijital vs analog düşünün. Aynı şey - farklı isimler.
Pithikos

"Kesikli" ve "sürekli" veriler arasındaki farkın ne olduğunu gerçekten bilmiyorum. Bazı nedenlerden dolayı, giriş statüsü sınıfları, öğrencilerin bu iki şeyi ayırt etmek için kuralları ezberlemekten gerçekten hoşlanıyor gibi görünmektedir. Anlayabildiğim kadarıyla, farklılıklar verilerde değil, verileri modellemeyi nasıl seçtiğimiz konusundadır.
user795305

1
Bu Google’ın en iyi sonucuydu, @robingirard.
denson,

Yanıtlar:


58

Ayrık veriler yalnızca belirli değerleri alabilir. Potansiyel olarak bu değerlerin sonsuz bir sayısı olabilir, ancak her biri farklıdır ve aralarında gri alan yoktur. Kesikli veriler sayısal - elma sayıları olabilir - ancak kategorik de olabilir - kırmızı veya mavi veya erkek veya kadın veya iyi veya kötü.

Sürekli veriler tanımlanmış ayrı değerlerle sınırlı değildir, ancak sürekli aralıktaki herhangi bir değeri içerebilir. Herhangi iki sürekli veri değeri arasında sonsuz sayıda başka olabilir. Sürekli veri her zaman esasen sayısaldır.

Bazen bir türden düzgün olan nümerik verileri diğerininki gibi ele almak mantıklı olur. Örneğin, yükseklik gibi bir şey süreklidir, ancak çoğu zaman küçük farklılıkları çok fazla önemsemeyiz ve bunun yerine yükseklikleri birkaç ayrı bölmede gruplandırırız . Tersine, ekonomideki büyük miktardaki belirli bir birimin - pirinç taneleri veya termitler veya paralar - sayıyorsak - 2.000,006 ve 2.000,008'i önemli ölçüde farklı değerler olarak düşünmemeyi tercih edebiliriz; yaklaşık süreklilik.

Bazen sayısal verileri kategorik olarak ele almak da faydalı olabilir, örneğin: zayıf, normal, obez. Bu genellikle başka tür bir kazanma türüdür.

Kategorik verileri sürekli olarak değerlendirmek nadiren mantıklıdır.


@jeromy'nin, psikolojide en azından sorulara verilen cevaplar gibi kategorik değişkenlere itiraz ettiği gibi, @walktalky, çoğu zaman temel bir özelliğin temsili olarak kabul edilir, bu nedenle, kategorik verilerin bazen sürekli olduğu kabul edilir.
richiemorrisroe

@richiemorrisroe Biri, veri ile varsayılan özellik arasındaki farkı nitelendirebilir, ama elbette haklısın. Bu takip sorusuna cevap olarak çok ilginç bazı noktalar da yapıldı .
Walkytalky

bağlantı için teşekkürler, bu cevaplar gerçekten çok ilginç.
richiemorrisroe

> " Bu değerlerin sonsuz sayıda olabilir, ancak her biri farklıdır ve aralarında gri bir alan yoktur " - aslında her biri için farklı değerlere sahip ayrı bir dağılımın olması ve aynı zamanda her ikisi için mükemmel bir şekilde mümkün Seçtiğiniz farklı değerler, aralarında daima daha fazla değere sahiptir (bir anlamda 'gri alan'). Bunları pratikte sık sık ortaya çıkarmazlar, ancak gerçek olarak ortaya çıkmaları tamamen mükemmeldir; Gerçekten de kolayca ortaya çıkabilecek iki ayrı (eğer varsa) örnek düşünebilirim.
Glen_b

netleştirmek için, bir hisse senedi varlığı için 10 milyar sıra ohlc veriye sahip olsanız bile, yine de ayrık olarak kabul edilir miydi? ama sonra bir varlığın fiyatı 1'den sonsuza kadar bir şey olamaz, bu durumda nasıl düşünülür?
PirateApp

19

Veri her zaman ayrıktır. nBir değişken üzerindeki değerlerin bir örneği verildiğinde , değişkenin alabileceği maksimum belirgin değer sayısı eşittir n. Bu teklifi görün

Tüm gerçek örnek uzayları ayrıktır ve tüm gözlemlenebilir rastgele değişkenler ayrık dağılımlara sahiptir. Sürekli dağılım matematiksel işlem için uygun, ancak pratik olarak gözlemlenemeyen bir matematiksel yapıdır. EJG Pitman (1979, s. 1).

Bir değişken üzerindeki verilerin tipik olarak rastgele bir değişkenden alındığı varsayılır. Değişkenin aralıktaki herhangi iki farklı nokta arasında alabileceği sonsuz sayıda olası değer varsa, rasgele değişken bir aralıkta süreklidir. Örneğin, boy, ağırlık ve zaman tipik olarak sürekli olarak kabul edilir. Tabii ki, bu değişkenlerin herhangi bir ölçümü kesin olarak kesin ve bir anlamda ayrık olacaktır.

Sıralı (yani sıralı), sıralanmamış (yani nominal)
ve ikili ayrık değişkenleri ayırt etmek faydalıdır .

Bazı giriş ders kitapları sürekli bir değişkeni sayısal değişkenle karıştırır. Örneğin, bir bilgisayar oyunundaki bir puan, sayısal olmasına rağmen ayrıktır.

Bazı giriş ders kitapları bir oran değişkenini sürekli değişkenlerle karıştırır. Bir sayım değişkeni bir oran değişkenidir ancak sürekli değildir.

Gerçek uygulamada, bir değişken, yeterince büyük sayıda farklı değer alabildiğinde, sürekli olarak sürekli olarak ele alınır.

Referanslar

  • Pitman, EJG 1979. İstatistiksel çıkarım için bazı temel teoriler. Londra: Chapman ve Salon. Not: Teklifi, Murray Aitkin'in İstatistiksel Çıkarım: Entegre Bir Bayesian / Olabilirlik Yaklaşımı kitabının 2. Bölümünün girişinde buldum.

12
Bir olasılık da "matematiksel bir yapı" dır ve "doğrudan gözlemlenebilir" değildir. Bu, ihtimalin olmadığı anlamına mı geliyor? Genel olarak, bu ilginç yanıt veriler, değerlerle karakterize edilmesi gerektiğini bir savunulamaz öncül dayalı görünüyor yapmak bir matematiksel model etmenize olanak tanır değerleriyle ziyade var. İkincisi, eskisi değil, önemli bir özelliktir. Tüm bunlar sürekli / ayrık ayrımda önemli olanın veriler hakkında nasıl düşündüğümüz olduğunu (yani onları nasıl modellediğimizi) göstermektedir.
whuber

3
@ Whuber'in amacını gösteren zeki küçük bir masal var: Lord (1953), "Futbol sayılarının istatistiksel olarak ele alınması üzerine", Amerikalı Psikolog , 8 , s750-51.
Scortchi - Monica Yeniden

Scortchi, teşekkür ederim. Web sürümleri bir Google bilgin aramada kullanılabilir . Lord, 60 yıl önce, “ölçüm teorisinin” istatistiksel analizin ne derece etkilemesi (hatta kapsamını sınırlandırması) gerektiği konusunda tartışılan bir yanılgıyı ele alıyor. Demek istediğim, model yapıları ve gözlemler arasındaki ayrım konusunda farklı biriydi.
whuber

12

Sıcaklıklar süreklidir. 23 derece, 23.1 derece, 23.100004 derece olabilir.

Seks ayrıktır. Sadece erkek ya da kadın olabilirsin (yine de klasik düşüncede). 1, 2, vs. gibi bir sayıyla temsil edebileceğiniz bir şey

Aradaki fark, birçok istatistik ve veri madenciliği algoritmasının bir türünü kaldırabileceği, diğerini kaldıramadığı için önemlidir. Örneğin düzenli regresyonda, Y sürekli olmalıdır. Lojistik regresyonda Y ayrıktır.


5
Y

8

Ayrık veri yalnızca belirli değerleri alabilir.

Örnek: Bir sınıftaki öğrenci sayısı (yarım öğrenciniz olamaz).

Sürekli Veri , herhangi bir değer alabilen (bir aralık içinde) veridir

Örnekler:

  • Bir kişinin boyu: Sadece belirli sabit yüksekliklerde değil, herhangi bir değerde (insan yükseklikleri aralığında) olabilir,
  • Yarıştaki zaman: bir saniyenin kesirleriyle bile ölçebilirsin.
  • Bir köpeğin ağırlığı
  • Bir yaprağın uzunluğu,
  • Bir kişinin ağırlığı

2
Ayrıca cevabı nereye kopyaladığınızı da bize söyleyebilirsiniz: mathsisfun.com/data/data-discrete-continuous.html
philmcole

Güzel anlatılmış.
Arsman Ahmad,

0

Veri tabanı durumunda, verinin niteliği sürekli olsa bile, verileri her zaman ayrık olarak saklarız. Verinin doğasını neden vurgulamalıyım? Verileri analiz etmemize yardımcı olabilecek verilerin dağıtımını yapmalıyız. Verilerin niteliği sürekli ise, bunları sürekli analizle kullanmanızı öneririm.

Sürekli ve ayrık bir örnek alın: MP3. Dijital formatta saklanırsa, "ses" türü bile analojidir. Onu her zaman analojik bir şekilde analiz etmeliyiz.


0

Bir yandan, pratik açıdan Jeromy Anglim'in cevabına katılıyorum. Sonunda, çoğu zaman ayrık değişkenlerle uğraşıyoruz - teorik bakış açısına göre sürekli olsalar da - ve bunun örneğin sınıflandırma için gerçek bir etkisi var. Strobl'ın Rastgele Ormanların çoklu kesme noktalarına (daha yüksek doğrulukta fakat potansiyel olarak benzer nitelikte) değişkenlere karşı önyargılı olduğunu gösteren makalesini hatırlayın. Kişisel tecrübelerime göre, olasılıksal sinir ağları, değişkenler aynı tipte olmadıkça (yani sürekli) farklı doğruluklar sunarken bir önyargı da sunabilir. Öte yandan, teorik bir bakış açısıyla, klasik sınıflandırma (örneğin sürekli, ayrık, nominal vb.), IMHO, haktır. Buna göre, Quinlan'ın M5 algoritmasını tanımlayan makalesinin kaynak adının, 'regresör' olan harika bir seçim. Bu nedenle sürekli ve ayrıkların tanımı ve etkileri 'ortama' bağlı olarak ilgilidir.

refs:

Quinlan JR (1992). Sürekli sınıflarla öğrenme. In: AI'nın 5. Avustralya Ortak Konferansı. Sidney (Avustralya), 343-348.

Strobl C., Boulesteix A.-L., Zeileis A., ve Hothorn T. (2007). Rastgele ormandaki önyargı değişken önem ölçütleri: resimler, kaynaklar ve bir çözüm. BMC Biyoinformatik, 8, 25. doi: 10.1186 / 1471-2105-8-25


-1

Kesikli veriler özel değerler alırken, sürekli veriler ayrı değerlerle sınırlı değildir.

Kesikli veriler belirgindir ve aralarında gri alan yoktur; sürekli veriler ise sürekli veri değeri üzerinde herhangi bir değeri işgal eder.


-2

Ayrık veri Belirli değerleri alabilirler. Sayısaldırlar.


CV'ye Hoşgeldiniz! Yanıtladığınız için teşekkür ederiz, ancak lütfen önceki yanıtlara bakmak ve yararlı bir şey ekleyip eklemediğinizi dikkate almak için zaman ayırın.
Scortchi - Monica’yı yeniden kurun

-3

Kesikli veriler sadece tamsayı değerlerini alabilirken sürekli veri herhangi bir değeri alabilir. Örneğin, her yıl bir hastane tarafından tedavi edilen kanser hastalarının sayısı ayrıdır, ancak kilonuz süreklidir. Bazı veriler süreklidir, ancak yaşınız gibi ayrı bir şekilde ölçülür. Yaşınızı belirtildiği gibi bildirmek çok yaygındır, 31.


11
Veriler tamsayılarla sınırlandırılmadan ayrık olabilir. Veya bu konuda rakamlar. Bu her zaman mümkün olduğunu temsil tamsayılar ile ayrık verileri, ama bu veriler sadece bu tür değerler alabilir anlamına gelmez.
walkytalky

-4

Kesikli veriler peritik olarak sonlu değerlerden ve sürekli veriden ifinite değerlerinden bahsediyor…


2
Detaylandırmak ister misiniz?
chl.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.