2 ¢ ekleyeyim, bir hedge fonu için iyi ve temiz veriler elde etmek benim işim, oldukça fazla veri feed'i ve geçmiş veri sağlayıcıları gördüm. Bu esas olarak ABD hisse senedi verileriyle ilgilidir.
Başlangıç olarak, paranız varsa Yahoo'dan veri indirmekle uğraşmayın, gün sonu verilerini doğrudan CSI verilerinden alın , burası Yahoo'nun EOD verilerini de AFAIK'i alır. Verileri istediğiniz biçime çıkarabileceğiniz bir API'ya sahiptirler. Veriler için yıllık abonelik birkaç 100 $ dolar olduğunu düşünüyorum.
Ücretsiz bir hizmetten veri indirmeyle ilgili temel sorun, sadece mevcut stokları almanızdır , buna Survivorship Bias denir ve birçok hisse senedine bakarsanız size yanlış sonuçlar verebilir, çünkü sadece bunu yapanları dahil edersiniz uzak ve listelenmemiş olanları değil.
IQFeed'e bakacağım bazı gün içi verilerle oynamak için, temel olarak gerçek zamanlı yayınlar için bir kıyafet olmasına rağmen, geçmiş verileri çıkarmak için çeşitli API'ler sağlarlar. Ancak burada birkaç seçenek var, bazı brokerler API'ları aracılığıyla geçmiş veri indirmeleri bile sağlıyor, bu yüzden sadece zehirinizi seçin.
AMA genellikle bu verilerin hepsi çok temiz değildir, gerçekten teste başladığınızda, belirli stokların eksik olduğunu veya iki farklı sembol olarak göründüğünü veya stok bölünmelerinin doğru bir şekilde hesaba katılmadığını vb. Görürsünüz. temettü verisine de ihtiyaç vardır ve böylece 100 farklı veri kaynağından veri yamalama vb. Bu yüzden bir "indirim" veri feed'i ile başlayacaktır, ancak daha kapsamlı backtestler çalıştırdığınızda ne yaptığınıza bağlı olarak sorunlarla karşılaşabilirsiniz. Sadece bakarsanız, S&P 500 stoklarının bu kadar da bir sorun olmayacağını ve "ucuz" gün içi beslemenin yapıldığını varsayalım.
Bulamayacağınız şey gün içi verileridir. Demek istediğim bazı örnekler bulabilirsiniz, eminim 5 yıllık bir MSFT kene verisi var, ama bu sizi çok ileri götürmeyecek.
Sonra, gerçek şeylere ihtiyacınız varsa (seviye II sipariş defteri, tüm borsalarda olduğu gibi tüm keneler) bir "uygun fiyatlı", ancak mükemmel bir seçenek Nanex . Aslında size terabayt veri içeren bir sürücü gönderecekler. Doğru hatırlıyorsam yıllık yaklaşık 3k-4K dolar. Ama bana güvenin, gün içinde iyi veri elde etmenin ne kadar zor olduğunu anladıktan sonra, bunun çok fazla para olduğunu düşünmezsiniz.
Sizi caydırmak değil, iyi veri elde etmek zor, o kadar zor ki, birçok hedge fonu ve banka güvenebilecekleri verileri almak için ayda yüz binlerce dolar harcıyor . Yine, bir yerden başlayıp oradan gidebilirsiniz ama biraz bağlamda görmek güzel.
Edit: Yukarıdaki cevap kendi deneyimlerime dayanmaktadır. Caltech'in mevcut veri feed'leri hakkındaki bu yazımı daha fazla bilgi verecektir ve özellikle QuantQuote'u önermektedir .