Medians, Modlar, Yüzdelikler ve OLAP


9

Yeni başlayan kafamı OLAP'ın etrafına sarmaya çalışıyorum ve birkaç sorum var.

  • Soru 1: OLAP küpü medyanları, modları, yüzdelikleri depolayabilir mi?
  • Soru 2: Kullanıcı tarafından yazılan bir MDX sorgusu satır düzeyinde verilerin bir özetini döndürebilir mi? (ör.% işlemler> 100 ABD doları). Yoksa küp tasarımcısı bunu küpe mi eklemeli?
  • Soru 3: Herhangi bir OLAP ürünü artık satır düzeyinde verilere erişmek için mekanizmalar sağlıyor mu? Hangi?

BT Departmanımız belirli bir MS Analsis Services ROLAP küpü ile ne tür sorunlar yaşadığımız hakkında geri bildirim arıyor. Arkasındaki ilişkisel veritabanına erişimimiz yok ve şu anda küpte önlem olarak bulunmayan hesaplamaları yapmamız gerekiyor.

Bakalım bu hakkım var mı?

  1. Bir küp sayımlar, ortalamalar, oranlar, standart sapmalar için istatistikler sağlayabilir.
  2. Belirli bir istatistik, küp tasarımcısı tarafından sağlanan bir önlemle sunulmadıysa, bunu elde etmek için bir MDX sorgusu yazabilir miyiz? Veya satır düzeyinde verilerden ön hesaplamak için küpü değiştirmeleri mi gerekiyor?
  3. Bir küp medyanlar, modlar veya yüzdelikler gibi istatistikler sağlayamaz, çünkü bu istatistikler düzgün bir şekilde toplanmaz.

Leland Wilson'ın Grafik Gramerini ve Veri Madenciliği ve OLAP bölümünde okudum , diyor

Bu [küp işlemleri] sayımlar, ortalamalar, oranlar ve standart sapmalar gibi istatistiklerle iyi çalışır. Alt sınıflar üzerindeki basit toplamalar, temel özet istatistikleri üretmek için doğrusal fonksiyonlarda birleştirilen toplamlar, kareler toplamları ve diğer terimler üzerinde çalışılarak hesaplanabilir.

Medyan, mod ve persentiller gibi istatistiklerle düzgün çalışmazlar çünkü bu istatistiklerin toplamı, toplamlarının istatistiki değildir. Örneğin, medyanların medyanı agreganın medyanı değildir.

Eklemeye devam ediyor:

Ancak son zamanlarda daha sofistike bir ROLAP modeli ortaya çıktı. Çeşitli teknolojilerle, istatistiksel algoritmalara ilişkisel model üzerinden ham verilere gerçek zamanlı olarak erişim sağlamak mümkündür. Bu yaklaşım, veri küpleri gibi yapıların sunduğu katı toplamalardan daha umut vericidir.

Bu mimarinin en zarif biçiminde, uygulamalar veri işleme yöntemleri hakkında bilgi vermek ve iade edilen bilgilere bağlı olarak uygun işlemleri yapmak için uzaktan bağlantılar talep edebilir. Bu formda, bileşen mimarisi dağıtılmış bilişimin gerçek vaadini gerçekleştirebilir: site, işletim sistemi veya dilden bağımsız tasarım ve yürütme.

Bu, 2005 yılı civarında yazılmıştır. Satır düzeyinde veri erişimine izin vermek için bu yöntemi kullanan ürünlerin farkında olan var mı?


1
Alıcı yok mu? Bir cevap almak için sorunun nasıl geliştirileceğine dair herhangi bir öneriniz var mı?
Tommy O'Dell

Yanıtlar:


5

Sorularınızı sırayla cevaplamak için:

  1. Küp, medyanları, modları (hatta ortalamaları) depolamaz, ancak bunları hesaplayan sorgular yazabilir ve bunları küpün içine hesaplanmış ölçümler olarak gömebilirsiniz. Bu tür bir hesaplamayı gömme yeteneği, OLAP teknolojisinin ana benzersiz satış noktalarından biridir.
  2. Tek tek satırları tanımlayabilen bir boyutunuz varsa (bu, olgu tablosundaki bir tanımlayıcıdan türetilen dejenere veya 'olgu' boyutu olabilir), tek tek satırlara dayalı bir sorgu yapabilirsiniz. Bununla birlikte, OLAP boyutlar ve toplamalar açısından çalışır, bu nedenle tek tek satırları tanımlayabilen bir boyuta (bir değerden oluşan bir toplamla) sahip olmanız gerekir.
  3. Herhangi bir OLAP aracı, (2) 'de açıklananları yapabilir, ayrıca genellikle küpün, içine deldiğiniz belirli bir dilimin altında yatan işlem verilerinin bir sınırını döndüreceği ' delme ' olarak bilinen bir mekanizmayı destekler .

Küp betiğinde doğrudan bulunmayan hesaplamalar yapmak isterseniz, geç, ağıtlanmış ProClarity gibi birçok OLAP aracı, özel MDX tabanlı hesaplamalar içeren sorguları formüle etmenize olanak tanır. Küp gerçek hesaplamaları yapmak için ihtiyacınız olan bilgiye sahip değilse, özel MDX hesaplamaları ihtiyacınız olan herhangi bir hesaplamayı destekleyebilmelidir.

OLAP sorguları geleneksel olarak toplamda istatistiksel sorgularla ilişkilendirilse de, ayrıntıya inmek için ayrıntıya izin veren bir boyutunuz varsa, modların çıkartılabileceği veya hesaplanabileceği medyanları, yüzdelikleri veya histogram sorgularını hesaplayacak sorguları formüle etmek kesinlikle mümkündür.

Örneğin, bunun sıralamalara dayalı bir pareto analizi sorgusu örneği vardır .

Birçok küp ürünü, verilerin kendisinde kalmayacakları, ancak altta yatan bir veritabanından sorgulanacakları karma veya ilişkisel OLAP modunda çalışabilir. Ayrıca, Business Objects, Report Builder veya Discoverer gibi saf ROLAP araçları, temel alınan bir veritabanından sorgulama yapabilir ve satır satır çalışabilir. Bununla birlikte, özel OLAP ürünlerinin karmaşıklığından yoksun olma eğilimindedirler ve kutudan çıkardığı istatistiksel analiz kabiliyeti konusunda fazla bir şeyleri yoktur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.