Günlüğe kaydedilen değişkenler neden kullanılır?


12

Muhtemelen, bu çok temel bir soru ama bunun için sağlam bir cevap bulamıyorum. Umarım burada yapabilirim.

Şu anda kendi yüksek lisans tezime hazırlık olarak kağıtları okuyorum. Şu anda, tweetler ve borsa özellikleri arasındaki ilişkiyi araştıran bir makale okuyorum.

Hipotezlerinden birinde, "artan tweet hacminin ticaret hacmindeki artışla ilişkili olduğunu" ileri sürüyorlar.

Ben ilişkilendirmek için, ikili korelasyon içinde, onları beklenebilir tweetVolumeile tradingVolumeancak bunun yerine sürümleri günlüğe kullandıklarını bildirmektedir: LN(tweetVolume)ve LN(tradingVolume).

Tezim için bu makalenin bir kısmını çoğalttım. 6 ay boyunca yaklaşık 100 şirket için tweet topladım ( tweetVolume) ve aynı zaman dilimi için hisse senedi işlem hacmi. Eğer mutlak değişkenleri ilişkilendirirsem, buluyorum r=.282, p.000ama kaydedilen sürümleri kullandığımda buluyorum r=.488, p=.000.

Anlamıyorum neden araştırmacılar bazen kullanım onların değişkenlerin versiyonlarını açmış ve korelasyon çok yüksek bunu yaparsanız görünüyor neden. Nedeni nedir ve kaydedilen değişkenleri kullanmak neden uygun?

Yardımınız için çok minnettarım :-)


1
Sayfanın sağ alt kısmında İlgili konuları görürseniz, logaritma kullanımı birkaç kez daha önce ele alınmıştır. Özellikle bkz . Doğrusal regresyonda, gerçek değerler yerine bağımsız bir değişkenin günlüğünü kullanmak ne zaman uygundur? .
Andy W

Yanıtlar:


24

Günlüğe kaydedilen değişkenleri kullanma nedenleri iki kategoriye ayrılır: İstatistiksel ve maddi.

İstatistiksel olarak, değişkenleriniz sağa eğikse (yani üst uçta uzun bir kuyruğu varsa), korelasyon veya regresyon gibi bir ölçüm, bir veya her ikisinin üst ucunda bir veya birkaç vaka tarafından çok fazla etkilenebilir değişkenler (aykırı değerler, kaldıraç noktaları, etkili noktalar). Kaydın alınması, çarpıklığı azaltarak veya ortadan kaldırarak buna yardımcı olabilir.

Esasen, bazı kavramlar oranlar açısından farklılıklardan daha iyi düşünülmektedir. Tartıştığınız iki cilt ölçüsünü alın. Şimdi, iki şirket karşılaştırın: Biri NASDAQ üzerinde küçük bir şirket ticaret az kişi duymuş, diğeri bir mega şirket. Birincisi günde çok az tweet alacak. İkincisi çok alacak; ticaret hacmi için de benzer. Diyelim ki (sadece sayıları seçmek için) A şirketi genellikle günde 100 tweet alır ve ikincisi 100.000 alır.

A şirketinin tweetleri 100'den 500'e (400'lük bir fark, 5'lik bir oran) yükselirse, bu büyük bir haberdir - bir şeyler olmalı. Ancak B şirketi 100.000'den 100.400'e (400 fark, 1'e çok yakın bir oran) yükselirse kimse umursamaz. Kaba eşdeğer, 100.000'den 500.000'e çıkarsa olurdu.


Hızlı yanıtın için teşekkür ederim. Cevabınızdan iki soru daha geliyor. İlk olarak, bir nesne için 3 mülküm varsa (hisse senedi alım satım hacmi, iadeler ve oynaklık) ve bunlardan biri için kaydedilmiş sürümü almalı mıyım? A ve B şirketi tweetleri için söyledikleriniz, geri dönüşleri için de sayılabilir: A şirketi hisse senedi 1'den 1,50'ye yükselirse, geri dönüşler (% 50) 0,50'dir. B şirketinin benzer bir geri dönüş için 400'den 600'e (200) yükselmesi gerekiyor. Ve bundan kaynaklanıyorsa: getiri negatifse, LN (-0.50) açıkçası çalışmaz. Daha sonra -LN (0.50) almasına izin verilir mi?
Pr0no

Ayrıca, doğru anlarsam, kaydedilen değişkeni almak ücretsiz bir seçim değildir - skweness-charts (istatistiksel olarak) ile tartışılmalıdır? Ve aslında, bunu yapmak için gerçekten kanıt sağlayan günlük kaydı için daha mantıklı bir muhakeme mi? Başka bir deyişle, yukarıda kaydedilmiş sürümü almanız gereken eşyalar tanımlayan başparmak kuralları var mı veya bir yorum meselesi mi?
Pr0no

1
Bu durumda yüzdelerin günlüklerini almak istemezsiniz: Yüzdeyi almak, günlüğün yapacağı işlemi yapar. Yani, şeyleri oranlandırır. Kesinlikle bazı değişkenlerin günlüğünü alabilir, diğerlerini değil. Günlüğü almak, çarpıklık grafikleri gerektirmez, ancak genellikle günlüğe kaydedilmesi gereken değişkenler sağa eğiktir. Ama asıl şey maddedir . Günlüğü almak önemli bir şey ifade etmiyorsa, yapmayın. Bunun yerine, çarpık değişkenlerle çalışan istatistiksel yöntemleri kullanın. SUBSTANCE önce gelir.
Peter Flom - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.