«categorical-encoding» etiketlenmiş sorular

Kategorik değişkenleri sayısal değişkenler kümesi olarak temsil etme. Kategorik verileri işlemeleri için birçok analiz türünde gereklidir. Yaygın bir örnek, kukla kodlama, efekt kodlama, Helmert kodlama, kullanıcı tanımlı kontrastlar vb. Yoluyla regresyon / ANOVA'da kategorik bir yordayıcı kullanmaktır.

4
Kontrast matrisi nedir?
Kontrast matrisi tam olarak nedir (kategorik yordayıcılarla yapılan bir analize ilişkin bir terim) ve kontrast matrisi tam olarak nasıl belirtilir? Yani, sütun nedir, satır nedir, bu matristeki kısıtlamalar nelerdir ve sütun jve satırdaki sayı ne anlama igelir? Dokümanlara ve web’e bakmaya çalıştım ama görünen o ki, herkes onu kullanıyor ama …


1
Tek etkin kodlamayı kullanırken sütunlardan birini düşürme
Anladığım kadarıyla, makine öğreniminde, veri kümenizin aynı bilgileri etkili bir şekilde kodladıkları için yüksek derecede ilişkili özelliklere sahip olması bir sorun olabilir. Son zamanlarda birisi, kategorik bir değişken üzerinde tek-sıcak kodlama yaptığınızda, ilişkili özelliklerle sonuçlandığınızı, bu yüzden bunlardan birini "referans" olarak bırakmanız gerektiğini belirtti. Örneğin, cinsiyeti iki değişken olarak kodlamak …


3
ANCOVA'ya karşı kukla kodlama ile çoklu regresyon ne zaman kullanılmalıdır?
Geçenlerde ANCOVA kullanarak 2 kategorik değişken ve bir sürekli değişkeni manipüle eden bir deneyi analiz ettim. Bununla birlikte, bir gözden geçiren, kukla değişkenler olarak kodlanan kategorik değişken ile çoklu regresyonun, hem kategorik hem de sürekli değişkenlerle deneyler için daha uygun bir test olduğunu ileri sürmüştür. ANCOVA'ya karşı kukla değişkenlerle çoklu …

2
Lojistik regresyonda kategorik öngörücünün önemi
Lojistik regresyonda kategorik değişkenler için z değerlerini yorumlamakta zorlanıyorum. Aşağıdaki örnekte 3 sınıflı bir kategorik değişkenim var ve z değerine göre CLASS2, diğerleri olmasa da alakalı olabilir. Ama şimdi bu ne anlama geliyor? Diğer sınıfları birleştirebileceğimi mi? Tüm değişkenin iyi bir öngörücü olmayabilir mi? Bu sadece bir örnektir ve buradaki …

5
SVM veya Sinir Ağı kullanılırken kategorik değişkeni sayısal değişkene yeniden kodlama
SVM veya Sinir Ağını kullanmak için, kategorik değişkenleri sayısal değişkenlere dönüştürmesi (kodlaması) gerekir, bu durumda normal yöntem 0-1 ikili değerleri, k. Kategorik değeri (0,0, .. olarak dönüştürülür) kullanmaktır. ., 1,0, ... 0) (1, k-th konumundadır). Bunu yapmak için başka yöntemler var mı, özellikle de 0-1 gösteriminin Sinir Ağı'nda oldukça istenen …

1
LASSO'da kategorik öngörücüler nasıl tedavi edilir
Bazı kategorik değişken öngörücülere ve bazı sürekli olanlara sahip bir LASSO kullanıyorum. Kategorik değişkenler hakkında bir sorum var. Anladığım ilk adım, her birini aptallara bölmek, adil cezalandırma için standartlaştırmak ve sonra gerilemek. Kukla değişkenleri tedavi etmek için çeşitli seçenekler ortaya çıkar: Her bir faktör için mankenlerden biri hariç hepsini dahil …

2
Regresyonda nitel değişken kodlama “tekilliklere” yol açar
"Kalite" adı verilen bağımsız bir değişkenim var; bu değişkenin 3 tepki yöntemi vardır (kötü kalite; orta kalite; yüksek kalite). Bu bağımsız değişkeni çoklu doğrusal regresyonuma tanıtmak istiyorum. Bir ikili bağımsız değişken (kukla değişken, ben kod 0/ olabilir 1) olduğunda, bir çoklu doğrusal regresyon modeline tanıtmak kolaydır. Ancak 3 yanıt yöntemi …

2
Nominal / kategorik veriler için “gösterge değişkeni” ile “gösterge değişkeni”
"Kukla değişken" ve "gösterge değişkeni" , 0/1 kodlamalı bir kategoriye üyeliği tanımlamak için sık kullanılan terimlerdir; genellikle 0: Kategoriye üye değil, 1: Kategoriye üye. 26.11.2014 tarihinde scholar.google.com'da (tırnak işaretleri dahilinde) yapılan hızlı bir arama, yaklaşık 318.000 makalede "kukla değişken" ve yaklaşık 112.000 makalede "gösterge değişkeni" olduğunu gösterir. "Kukla değişken" terimi …

2
R'de kukla kodlama yerine efekt kodlaması ile regresyon nasıl yapılır?
Şu anda bağımsız değişkenler olarak sadece kategorik / faktör değişkenlerine sahip olduğum bir regresyon modeli üzerinde çalışıyorum. Bağımlı değişkenim logit dönüşümü oranıdır. R, "faktör" türünden hemen sonra aptalları nasıl kodlayacağını otomatik olarak bildiğinden, R'de normal bir regresyon çalıştırmak oldukça kolaydır. Bununla birlikte, bu tip kodlama, her bir değişkenten bir kategorinin …

1
Kategorik değişkenler (R cinsinden) için mevcut olan farklı kodlama türleri nelerdir ve bunları ne zaman kullanırsınız?
Doğrusal bir model veya karışık bir model takarsanız, kategorik veya nominal bir değişkenin, kukla koşullandırma (R varsayılanı) ve efekt kodlaması gibi paramaterlerin tahmin edildiği bir dizi değişkene dönüştürülmesi için farklı kodlama türleri vardır. Etkileşimleriniz olduğunda efekt kodlamanın (bazen sapma veya kontrast kodlama olarak adlandırılır) tercih edildiğini duydum, ancak olası kontrastlar …

2
GLM'de kukla (manuel veya otomatik) değişken oluşturmayı anlama
Glm formülünde bir faktör değişkeni (örn. M ve F seviyeli cinsiyet) kullanılırsa, kukla değişkenler oluşturulur ve glm modeli özetinde ilişkili katsayılarıyla (örn. Cinsiyet C) bulunabilir. Faktörü bu şekilde bölmek için R'ye güvenmek yerine, faktör bir dizi sayısal 0/1 değişkeni (örneğin, cinsiyetM (M için 1, F için 0), cinsiyetF (F için …

3
Hangi algoritmalar bir sıcak kodlama gerektirir?
Sıralı olmayan değişkenler için ne zaman bir sıcak kodlama kullanılacağından ve ne zaman kullanılacağından emin değilim Algoritma benzerliği hesaplamak için bir mesafe metriği kullandığında kullanırım. Ne tür algoritmaların sıralı olmayan kategorik özelliklerin tek-sıcak kodlu olmasını gerektireceği ve hangilerinin istemeyeceği konusunda genel bir kural verebilir mi?

2
Örneğin haftanın günlerine dayalı regresyon
Doğru yönde ilerlemek için biraz yardıma ihtiyacım var. Herhangi bir istatistik okuduğumdan beri uzun zaman oldu ve jargon değişmiş gibi görünüyor. Şunun gibi araba ile ilgili verilerim olduğunu düşünün: A şehrinden B şehrine yolculuk süresi A kasabasından B kasabasına uzaklık Motor boyutu Sürücü ayakkabısı boyutu Otomobil markası ve modeli Haftanın …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.