Fonksiyonel veri analizi ile yüksek boyutlu veri analizi arasındaki fark nedir


10

İstatistik literatüründe " fonksiyonel veriler " (yani eğriler olan veriler) ve paralel olarak " yüksek boyutlu veriler " (yani veriler yüksek boyutlu vektörler olduğunda) ile ilgili birçok referans vardır . Benim sorum iki veri türü arasındaki fark hakkında.

Vaka 1'de uygulanan uygulamalı istatistik metodolojileri hakkında konuşurken, vaka 2'den bir fonksiyonlar alanının sonlu boyutlu bir alt uzayına bir projeksiyon yoluyla metodolojilerin yeniden ifade edilmesi olarak anlaşılabilir, polinomlar, splinelar, dalgacık, Fourier, ... ve fonksiyonel problemi sonlu boyutlu vektörel bir probleme çevirecektir (uygulamalı matematikte her şey bir noktada sonlu olmaya başlar).

Sorum şu: fonksiyonel verilere uygulanan herhangi bir istatistiksel prosedürün (neredeyse doğrudan) yüksek boyutlu verilere de uygulanabileceğini ve yüksek boyutlu verilere tahsis edilen herhangi bir prosedürün (neredeyse doğrudan) fonksiyonel verilere uygulanabileceğini söyleyebilir miyiz?

Cevap hayırsa, açıklayabilir misiniz?

Simon Byrne'nin cevabı yardımıyla DÜZENLE / GÜNCELLEME:

  • seyreklik (S-seyrek varsayım, için top ve zayıf top ), yüksek boyutlu istatistiksel analizde yapısal bir varsayım olarak kullanılır.lplpp<1
  • "düzgünlük" fonksiyonel veri analizinde yapısal bir varsayım olarak kullanılır.

Öte yandan, ters Fourier dönüşümü ve ters dalgacık dönüşümü, spariteyi pürüzsüzlüğe dönüştürür ve pürüzsüzlük, dalgacık ve fourier dönüşümü ile spariteye dönüştürülür. Bu, Simon'un bahsettiği kritik farkı çok kritik değil mi?


1
Düzgünleştirme , işlevsel veri analizinin büyük bir parçasıdır ve uygun bir temel üzerine (örn. Fourier veya dalgacık) projeksiyon yapılarak vektör ortalama tahmin problemine dönüştürülebilir, ancak işlevsel veri analizinde, bu kadar kolay tercüme edilemez. Örneğin, değişkenlerden gelen işlevsel bir yanıtı tahmin etmekle ilgilenen işlevsel regresyonu ele alalım.
vqv

Yanıtlar:


12

Fonksiyonel Veriler genellikle farklı sorular içerir. Fonksiyonel Veri Analizi, Ramsey ve Silverman'ı okuyorum ve eğri kaydını, çözgü fonksiyonlarını ve eğrilerin türevlerini tahmin etmek için çok fazla zaman harcıyorlar. Bunlar, yüksek boyutlu verileri incelemekle ilgilenen kişiler tarafından sorulan sorulardan çok farklı sorular olma eğilimindedir.


Tamamen katılıyorum ! sorulan sorular farklı. Kayıt, işaretleme, türevlerin kestirimi fonksiyonel görünümden kaynaklanabilir. Bu beni ikna ediyor! yani fonksiyonel verilerle ilgili büyük bir anlaşma (istatistiksel literatürde olduğu gibi) sürekli bir kümede tanımlanmış olması değil, daha çok düzenli bir kümede dizine eklenmesidir?
robin girard

Sadece sıralı bir sette tanımlanmış değil. Aksi takdirde, zaman serisi analizini fonksiyonel veri analizinden nasıl ayırt edersiniz? Sorulan soruların türlerine bağlı olduğu için @ user549 ile hemfikirim. Verilerin yapısına özgüdürler.
vqv

15

Evet ve hayır. Teorik düzeyde, her iki durumda da benzer teknikler ve çerçeveler kullanılabilir (mükemmel bir örnek Gauss süreç gerilemesi).

Kritik fark, aşırı takmayı önlemek için kullanılan varsayımlardır (düzenlileştirme):

  • Fonksiyonel durumda, genellikle bir miktar pürüzsüzlük varsayımı vardır, başka bir deyişle, birbirine yakın olan değerler bazı sistematik yollarla benzer olmalıdır. Bu spline, lös, Gauss süreçleri vb. Tekniklerin kullanılmasına yol açar.

  • Yüksek boyutlu durumda, genellikle bir seyreklik varsayımı vardır: yani, boyutların sadece bir alt kümesi herhangi bir sinyale sahip olacaktır. Bu, bu boyutları tanımlamayı amaçlayan tekniklere yol açar (Kement, LARS, slab-spike öncelikleri vb.)

GÜNCELLEME:

Dalgacık / Fourier yöntemleri hakkında gerçekten düşünmedim, ancak evet, bu yöntemler için kullanılan eşik teknikleri, öngörülen alanda esnekliği hedefliyor. Tersine, bazı yüksek boyutlu teknikler, bir tür pürüzsüzlük varsayımı olan daha düşük boyutlu bir manifolda (örneğin ana bileşen analizi) bir projeksiyon varsaymaktadır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.