Finansal Hizmetler, Büyük Veri'nin büyük bir kullanıcısı ve yenilikçi. Bir örnek ipotek tahvil ticareti. Sorularınızı cevaplamak için:
Bu şirketlerin kullandığı veriler. Verilerin boyutu neydi?
- Geçtiğimiz yıllar boyunca verilen ipoteklerin uzun geçmişleri ve aylara göre ödemeler. (Milyarlarca satır)
- Uzun kredi geçmişleri. (Milyarlarca satır)
- Ev fiyat endeksleri. (Büyük değil)
Verileri işlemek için ne tür araçlar teknolojileri kullandılar?
Değişir. Bazıları Netezza veya Teradata gibi veritabanlarında oluşturulmuş şirket içi çözümler kullanır. Diğerleri verilere veri sağlayıcıları tarafından sağlanan sistemler aracılığıyla erişir. (Corelogic, Experian, vb.) Bazı bankalar KDB veya 1010data gibi sütunsal veritabanı teknolojileri kullanır.
Karşılaştıkları sorun neydi ve verileri nasıl elde ettikleri hakkında bilgi, sorunu çözmelerine yardımcı oldu.
Kilit konu, ipotek tahvillerinin (ipoteğe dayalı menkul kıymetler) ne zaman ön ödeme veya temerrüde düşeceğini belirlemektir. Bu özellikle devlet garantisinden yoksun olan tahviller için önemlidir. Ödeme geçmişlerini, kredi dosyalarını ve evin mevcut değerini anlayarak, bir temerrüt olasılığını tahmin etmek mümkündür. Bir faiz oranı modeli ve ön ödeme modeli eklemek de bir ön ödeme olasılığını tahmin etmeye yardımcı olur.
İhtiyaçlarına göre araç \ teknolojiyi nasıl seçtikleri.
Proje dahili BT tarafından yönlendiriliyorsa, genellikle Oracle, Teradata veya Netezza gibi büyük bir veritabanı satıcısından oluşur. Sorgular tarafından yönlendirilirse, doğrudan veri satıcısına veya 3. taraf "Hepsi içeri" sistemine gitme olasılığı daha yüksektir.
Verilerden ne tür bir kalıp tanımladıklarını ve verilerden ne tür kalıplar aradıklarını.
100 , 000 , 000 b e i n gw o r t h t h a t a m o u n t , o r a s l i t t l e a s