Muhtemelen, bu çok temel bir soru ama bunun için sağlam bir cevap bulamıyorum. Umarım burada yapabilirim.
Şu anda kendi yüksek lisans tezime hazırlık olarak kağıtları okuyorum. Şu anda, tweetler ve borsa özellikleri arasındaki ilişkiyi araştıran bir makale okuyorum.
Hipotezlerinden birinde, "artan tweet hacminin ticaret hacmindeki artışla ilişkili olduğunu" ileri sürüyorlar.
Ben ilişkilendirmek için, ikili korelasyon içinde, onları beklenebilir tweetVolume
ile tradingVolume
ancak bunun yerine sürümleri günlüğe kullandıklarını bildirmektedir: LN(tweetVolume)
ve LN(tradingVolume)
.
Tezim için bu makalenin bir kısmını çoğalttım. 6 ay boyunca yaklaşık 100 şirket için tweet topladım ( tweetVolume
) ve aynı zaman dilimi için hisse senedi işlem hacmi. Eğer mutlak değişkenleri ilişkilendirirsem, buluyorum r=.282, p.000
ama kaydedilen sürümleri kullandığımda buluyorum r=.488, p=.000
.
Anlamıyorum neden araştırmacılar bazen kullanım onların değişkenlerin versiyonlarını açmış ve korelasyon çok yüksek bunu yaparsanız görünüyor neden. Nedeni nedir ve kaydedilen değişkenleri kullanmak neden uygun?
Yardımınız için çok minnettarım :-)