«data-transformation» etiketlenmiş sorular

Veri değerlerinin genellikle doğrusal olmayan matematiksel yeniden ifadesi. Veriler genellikle bir istatistiksel modelin varsayımlarını karşılamak veya bir analizin sonuçlarını daha yorumlanabilir hale getirmek için dönüştürülür.

5
R de geniş ve uzun formatlar arasında veri nasıl değiştirilir? [kapalı]
Verileri geniş formatta veya uzun formatta alabilirsiniz. Biçime bağlı olarak, kullanılabilir yöntemler farklı olduğundan, bu oldukça önemli bir şeydir. Çalışmak zorunda olduğunu biliyorummelt() ve cast()yeniden biçimlendirme paketinden ama alamadım bazı şeyler var gibi görünüyor. Birisi bana bunu nasıl yaptığınız hakkında kısa bir bilgi verebilir mi?


2
Negatif binom regresyon varsayımları nelerdir?
Büyük bir veri setiyle çalışıyorum (gizli, bu yüzden çok fazla paylaşamıyorum) ve sonuçta negatif bir binom regresyonunun gerekli olacağı sonucuna vardım. Daha önce hiç glm regresyonu yapmamıştım ve varsayımların ne olduğu hakkında net bir bilgi bulamıyorum. MLR için aynı mılar? Değişkenleri aynı şekilde dönüştürebilir miyim (Zaten doğal bir sayı olması …

3
Beyazlatma her zaman iyi midir?
Makine öğrenme algoritmaları için ortak bir ön işleme adımı verilerin beyazlatılmasıdır. Verileri birbirinden ayırdığı için modellemeyi basitleştirdiği için beyazlatma yapmak her zaman iyidir. Beyazlatma ne zaman önerilmemektedir? Not: Verilerin ilişkisizleştirilmesine atıfta bulunuyorum.

2
R de çoklu regresyon için değişkenleri dönüştürme
İçinde çoklu bir regresyon gerçekleştirmeye çalışıyorum R. Bununla birlikte, bağımlı değişkenim aşağıdaki çizime sahiptir: İşte tüm değişkenlerime sahip bir scatterplot matrisi ( WARbağımlı değişkendir): Bu değişken üzerinde bir dönüşüm gerçekleştirmem gerektiğini biliyorum (ve muhtemelen bağımsız değişkenler?) Ancak gereken tam dönüşümden emin değilim. Birisi beni doğru yöne işaret edebilir mi? Bağımsız …

4
Bir ARIMA modelini takmadan önce bir zaman serisini ne zaman günlüğe dönüştüreceğiniz
Önceden tek değişkenli zaman serilerini tahmin etmek için tahmini pro kullanmıştım , ancak iş akışımı R'ye değiştiriyorum. .arima (). Bazı durumlarda, tahmin uzmanı tahmin yapmadan önce dönüşüm verilerini günlüğe kaydetmeye karar verir, ancak bunun nedenini henüz anlamadım. Öyleyse sorum şu: ARIMA yöntemlerini denemeden önce zaman serilerimi ne zaman log-dönüşüm yapmalıyım? …

3
Bu tuhaf biçimli dağılım nasıl modellenir (neredeyse ters J)
Aşağıda gösterilen bağımlı değişkenim bildiğim hiçbir hisse senedi dağıtımına uymuyor. Doğrusal regresyon, tahmin edilemeyen Y ile garip bir şekilde ilişkili olan (2 arsa) normal olmayan, sağa eğik artıkları üretir. Dönüşümler veya en geçerli sonuçları ve en iyi tahmin doğruluğunu elde etmenin başka yolları için herhangi bir öneriniz var mı? Mümkünse, …


3
R-kolonunda matris normalleşmesi [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 6 yıl önce kapandı . Bir matrisin sütun şeklinde normalleşmesini R'de yapmak istiyorum. Bir matris verildiğinde m, her bir sütunu sütunların toplamına bölerek her sütunu …

3
Neden güç veya kütük dönüşümleri makine öğrenmede çok fazla öğretilmiyor?
Makine öğrenmesi (ML), doğrusal ve lojistik regresyon tekniklerini yoğun olarak kullanır. Ayrıca özellik mühendislik teknikleri (güvenir feature transform, kernelvs.). Neden hiçbir şey hakkında variable transformation(örneğin power transformation) ML belirtilen? (Örneğin, özelliklere kök veya günlük alma hakkında hiçbir zaman duymadım, genellikle polinomları veya RBF'leri kullanıyorlar.) Benzer şekilde, ML uzmanları neden bağımlı …

6
İleri regresyon modelleme örnekleri
GLM veya OLS kullanarak karmaşık, çoklu doğrusal olmayan ilişkileri modellemek için gereken adımları gösteren gelişmiş bir doğrusal regresyon durum çalışması arıyorum. Temel okul örneklerinin ötesine geçen kaynakları bulmak şaşırtıcı bir şekilde zordur: Okuduğum kitapların çoğu, bir tahmincinin bir BoxCox'u veya en iyi durumda doğal bir eğri ile birleştiğinde yanıtın bir …

4
Normal rv'nin basıklık ve çarpıklığını arttıracak dönüşüm
gözlemlerinin normal olarak dağıtıldığı gerçeğine dayanan bir algoritma üzerinde çalışıyorum ve algoritmanın bu varsayımın sağlamlığını ampirik olarak test etmek istiyorum.YYY Bunu yapmak için , normalliğini aşamalı olarak bozacak bir dizi dönüşüm . Örneğin s normal sahip oldukları çarpıklık ve basıklık , ve progresif olarak artırmaya dönüşümün bir dizi bulmaya iyi …

3
Yanıt 4. kök tarafından dönüştürüldüğünde regresyon katsayıları nasıl yorumlanır?
1/4Heterossedastisitenin bir sonucu olarak yanıt değişkenimde dördüncü root ( ) güç dönüşümü kullanıyorum . Ama şimdi regresyon katsayılarımı nasıl yorumlayacağımdan emin değilim. Geri dönüşümü yaparken katsayıları dördüncü güce götürmem gerektiğini varsayıyorum (regresyon çıktısının altına bakınız). Tüm değişkenler milyonlarca dolar cinsindendir, ancak milyarlardaki dolar değişimini bilmek istiyorum. Diğer bağımsız değişken sabit …


2
Oran verisini dönüştürme: arcsin karekökü yeterli olmadığında
Yüzde / orantı verileri için arsin kare kök dönüşümüne (daha güçlü?) Bir alternatif var mı? Şu anda üzerinde çalıştığım veri setinde, bu dönüşümü uyguladıktan sonra belirgin heteroseladastisite kalıyor, yani artık değerlere karşı yerleştirilmiş değerlerin çizimi hala çok fazla bakımlı. Yorumlara yanıt vermek için düzenlendi: veriler, bir bağışın% 0-100'ünü% 10'un katlarına …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.