“Zaman serisi analizi” ile “boyuna veri analizi” terimleri arasındaki farklar nelerdir?


17

Uzunlamasına verilerden bahsederken, aynı özne / çalışma biriminden zaman içinde tekrar tekrar toplanan verilere başvurabiliriz, bu nedenle aynı özne içindeki gözlemler için, yani özne içi benzerlik için korelasyonlar vardır.

Zaman serisi verileri hakkında konuşurken, bir süre boyunca toplanan verilere de atıfta bulunuyoruz ve yukarıda belirtilen uzunlamasına ayara çok benziyor.

Birinin bu iki terim arasında net bir açıklama yapıp yapamayacağını merak ediyorum, ilişki nedir ve farklar nelerdir?


1
Bu bir ankete dönüşebilir ... Her iki veri türü üzerinde de çalıştım ve önemli bir fark, uzunlamasına verilerin genellikle nedensel analizlerde, müdahalelerin veya tedavilerin etkisini anlamak için sıklıkla kullanıldığı, ancak zaman serilerinin sıklıkla kullanıldığı gibi görünüyor. içinde tahmin . Tabii ki, fark net değil (tahmin edilecek temel sürücüleri anlamanız gerekiyor ve IMO, iyi tahmin edemediğiniz sürece sürücüleri anlamadınız). Ancak zaman serilerinde sinyal algılaması yapan insanlar genellikle öngörmeyi pek umursamazlar, bu yüzden muhtemelen ayrımımı reddedeceklerdi.
Stephan Kolassa

Yorumlarınız için teşekkürler. Ama bence "nedensel" terimi burada uygun olmayabilir, "ilişki" terimi daha iyi olmalı mı? Veri analizinin amacı açısından, yorumlarınızın bana bir anlam ifade ettiğini düşünüyorum. Ancak uzunlamasına verileri tahmin yapmak için kullanamaz mıyız? Aynı zamanda bir tür zaman serisi verisi olduğu için.
2014'te

1
"Nedensel" ve "ilişkilendirme" ile ilgili bir noktanız var ve elbette boyuna veriler tahmin etmek için kullanılabilir - bu sadece iki kavramı sık sık görmüyorum. Tahminciler genellikle zaman serileri hakkında konuşurlar. Bunun dışında @ gung daha iyi koyamadım.
Stephan Kolassa

3
Bir olası tipik (tanımsal olan) farklar zaman serisi görmek ve model zaman olmasıdır bağımlı olarak tepki t - 1 durum; bu aktarım etkisidir. Boyuna zaman analizinde genellikle zamanı kalıcı , evrimsel arka plan faktörü olarak görürsünüz . tt-1
ttnphns

Yanıtlar:


19

Çok çeşitli veri analistlerinin üzerinde anlaştığı katı, resmi tanımlar olduğundan şüpheliyim.

Ancak genel olarak zaman serileri , çok uzun bir süre boyunca düzenli aralıklarla gözlemlenen tek bir çalışma birimini ifade eder. Prototip bir örnek, bir ülkenin onlarca yıl veya hatta yüz yıldan fazla yıllık GSYİH büyümesi olacaktır. Özel bir şirkette çalışan bir analist için, şirketin ömrü boyunca aylık satış gelirleri olabilir. Çok fazla gözlem olduğu için veriler, farklı dönemlerde mevsimsellik gibi şeyleri araştırarak ayrıntılı olarak analiz edilir (örneğin, aylık: insanların ödendikten hemen sonra bir ayın başında daha fazla satış; yıllık: Kasım ayında daha fazla satış ve Aralık ayı, insanlar Noel sezonu için alışveriş yaparken) ve muhtemelen rejim değişiyor. @StephanKolassa'nın belirttiği gibi, tahmin genellikle çok önemlidir.

Uzunlamasına tipik olarak çok sayıda çalışma ünitesinde daha az ölçüm anlamına gelir. Prototip bir örnek, başlangıçta (tedaviden önce) ve önümüzdeki 3 ay boyunca aylık olarak ölçülen yüzlerce hastanın olduğu bir ilaç denemesi olabilir. Bu örnekteki her birimin sadece 4 gözlemiyle, zaman serisi analistlerinin ilgilendiği özellik türlerini tespit etmeye çalışmak mümkün değildir. Diğer yandan, muhtemelen tedavi ve kontrol kollarına randomize edilen hastalar ile nedensellik bir kez çıkarılabilir bağımsız olmama sorunu giderildi. Bu da öne sürdüğü gibi, genellikle bağımsız olmama durumu, birincil ilgi özelliğinden ziyade neredeyse bir sıkıntı olarak görülmektedir.


9

Kabaca üç tür veri kümesi vardır:

  • kesit: aynı anda farklı konular; farklı konulara karşılık gelen birçok sütun içeren bir satır olarak düşünün;
  • zaman serileri: farklı zamanlarda aynı konu; farklı zaman noktalarına karşılık gelen satırları olan bir sütun olarak düşünün;
  • panel (boyuna): farklı zamanlarda birçok konu, farklı zamanlarda aynı konu ve aynı anda birçok konu var; satırların zaman noktaları ve sütunların konu olduğu bir tablo olarak düşünün.

2
Yorumlarınıza dayanarak, uzunlamasına veriler farklı konulardan toplanan çok sayıda zaman serisi verisi gibi görünüyor?
2014'te

1
Genel olarak, evet, her konu verilerini zaman serisi olarak görebilirsiniz. Yine de pratikte, uzunlamasına veriler genellikle her konu için çok az zaman noktasına sahiptir. Zaman noktalarına dalga derler . Örneğin, her hastanın aylık aralıklarla 4-5 gözlemi ve yıllar boyunca yüzlerce hastanın olduğu tıbbi bir çalışma olabilir. Bu şekilde panel veri setleri genellikle dengesizdir (çok seyrek bir tablo düşünün), bu nedenle uzunlamasına çalışmaların bununla başa çıkmak için kendi favori yöntemleri vardır.
Aksakal

Bu soru göz önüne alındığında faydalıdır, ancak bu başlıkların hiçbirine girmeyen başka birçok veri kümesi vardır. Bununla birlikte, soru ile ilgili görünmüyorlar ve olası her tür veri kümesini sınıflandırmaya çalışmak burada boş olacaktır. Örnekler: temel yapının konu x konu olduğu herhangi bir veri kümesi; iki boyutlu olmayan herhangi bir veri kümesi.
Nick Cox

@NickCox, doğru, ama ekonometri içindeyim ve bu üçü gelişmiş teorileri olan ve çoğunlukla alanımızda kullanılanlar
Aksakal

2
Hiç şüphe yok ki, ama sorudaki hiçbir şey dar bir ekonometrik bakış açısını zorunlu kılmamakta, hatta teşvik etmemekte ya da sizin spesifik bakış açınız açıkça ortaya konmamıştır.
Nick Cox

3

Bu iki terim OP'nin varsayım şekliyle ilgili olmayabilir - yani, bunların birbiriyle çelişen analiz biçimleri olduğunu düşünmüyorum.

Bunun yerine zaman serisi analizi, boylamsal bir çalışmada verileri analiz etmek için yararlı olabilecek bir dizi alt düzey teknik tanımlar.

Zaman serisi analizinde çalışmanın amacı, zamana bağlı bir sinyaldir.

Bu zamana bağlı sinyalleri analiz etme ve modelleme / tahmin etme tekniklerinin çoğu, bu sinyallerin çeşitli bileşenlere ayrıştırılabileceği öncülüne dayanmaktadır. En önemlileri:

  • halkalı bileşenler (örneğin, günlük, haftalık, aylık, mevsimsel); ve

  • akım

Başka bir deyişle, zaman serisi analizi, altta yatan bir sinyali çıkarmak için zamana bağlı bir sinyalin döngüsel doğasından yararlanmaya dayanır.


1

Boyuna Veriler Nedir?

Bazen panel verisi olarak da adlandırılan boyuna veriler, aynı örneği farklı noktalarda takip eder. Örnek, bireylerden, hanehalklarından, kuruluşlardan vb. Aksine, uzun vadeli veriler de sağlayan tekrarlanan kesitsel veriler, aynı anketi zaman içinde farklı örneklere verir.

Boyuna veriler, tekrarlanan kesit verilere göre bir takım avantajlara sahiptir. Uzunlamasına veriler zaman içinde örnek içi değişimin ölçülmesine izin verir, olayların süresinin ölçülmesini sağlar ve çeşitli olayların zamanlamasını kaydeder. Örneğin, işsizlik oranının uzun süre yüksek kaldığını varsayalım. Aynı birey grubunun tüm dönem boyunca işsiz kalıp kalmadığını veya farklı birey gruplarının zaman içinde işsizliğe gidip gelmediğini görmek için uzunlamasına veriler kullanılabilir.

Kaynak


0

Basitleştirmek için bireyler üzerinde bir çalışma yapacağım, ama aynı şey herhangi bir analiz birimi için de geçerlidir. Karmaşık değildir, zaman serisi, zaman içinde toplanan verilerdir, genellikle aynı ölçümü ayrı bir zaman aralıklarında eşdeğer bir popülasyondan ima eder - veya sürekli olarak toplanır, ancak zamanlanmış aralıklarla analiz edilir.
Boyuna veriler kapsam olarak çok daha geniştir. Eşdeğer popülasyonun yerini aynı popülasyon alır, böylece bireysel veriler zaman içinde eşleştirilebilir veya birleştirilebilir. Boyuna veriler, çalışmanın amacına bağlı olarak tekrarlanabilir ölçümler olabilir veya olmayabilir. Boyuna veriler zaman serisine benzediğinde aynı şeyi zaman içinde ölçtüğümüz zamandır. Büyük fark, bir zaman serisinde zaman içindeki ölçümdeki (veya gruba göre) genel değişikliği ölçebilmemizdir, uzunlamasına bir analizde ise aslında bireysel düzeyde değişim ölçümüne sahip olursunuz. Dolayısıyla, analiz için çok daha fazla potansiyeliniz var ve örnekleme söz konusu olduğunda değişim ölçümü hatasızdır, bu nedenle uzunlamasına bir çalışma daha kesin ve bilgilendirici olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.