Nominal / kategorik veriler için “gösterge değişkeni” ile “gösterge değişkeni”


15

"Kukla değişken" ve "gösterge değişkeni" , 0/1 kodlamalı bir kategoriye üyeliği tanımlamak için sık kullanılan terimlerdir; genellikle 0: Kategoriye üye değil, 1: Kategoriye üye.

26.11.2014 tarihinde scholar.google.com'da (tırnak işaretleri dahilinde) yapılan hızlı bir arama, yaklaşık 318.000 makalede "kukla değişken" ve yaklaşık 112.000 makalede "gösterge değişkeni" olduğunu gösterir. "Kukla değişken" terimi aynı zamanda " bağlı değişken " in istatistiksel olmayan matematiğinde bir anlam ifade eder, bu da endekslenmiş eşyalarda "kukla değişken" in daha fazla kullanılmasına katkıda bulunur.

Konuya bağlı sorularım:

  1. Bu terimler her zaman eş anlamlı mıdır (istatistikler dahilinde)?
  2. Bu terimlerden herhangi biri, kategorik kodlamanın diğer biçimlerine (örneğin efekt kodlaması , Helmert kodlaması vb. ) Hiç kabul edilebilir şekilde uygulanıyor mu?
  3. Bir terimi diğerine tercih etmek için hangi istatistiksel veya disiplin nedenleri var?

4
İkili koşullar için "gösterge değişkeni" kullanma eğilimindeyim, örneğin seks maledeğerlerde olduğu gibi kodlanabilir 1veya 0. 2'den fazla kategoriye sahip kategorik bir değişken varsa, daha sonra her düzeydeki üyelik için gösterge değişkenlerine genişletilirse, bu gösterge değişkenleri kümesini tanımlamak için "kukla değişkenler" kullanırdım.
Gregor - Monica'yı

2
Bence cinsiyet 1 veya 0 olarak kodlanabilir, cinsiyet çok daha karmaşık bir yapıdır. (bu konuda seks de daha karmaşık olabilir);)
Alexis

2
nokta iyi alınmış, düzenlenmiş sex.
Gregor - Monica'yı

2
Böyle bir gösterge değişkeni deme eğilimindeyim male, burada 1 doğru (bu durumda erkek) ve 0 yanlış (bu durumda kadın) anlamına gelir. Değişken adını kullanırsam, sexbu veri kümesine her döndüğümde bu değişkeni nasıl kodladığımı aramam gerekecek.
Maarten Buis

4
"Kukla değişken" in çeşitli hikayelerinin çılgınca ve maalesef teknik olmayan izleyiciler tarafından küçümseme veya küçümseme anlamına geldiği şeklinde yanlış yorumlandığını duydum. Beni terime karşı çevirecek kadar utanç vericiydi ve ikna ediyorlardı. "gösterge" benim için açık ve anlaşılır.
Nick Cox

Yanıtlar:


12

"Kukla değişken", kategorik bir yordayıcıyı temsil eden (birlikte temsil eden) sayısal değişken (ler) den bahsetmenin daha genel bir yoludur; bu nedenle terim Helmert & effect kodlama † ' da kullanılanlar için de geçerlidir . Bunun temel nedeni "stand-in" anlamına gelen "kukla" nın genel kullanımıdır. "Gösterge değişkeni" Gösterge fonksiyonları re ile ilgilidir - bu yüzden bazı özelliklere sahip olup olmadıklarını göstermek için sadece bir veya sıfır olabilir; bu nedenle terim sadece referans seviyesi kodlamada kullanılanlar için geçerlidir applies . Tabii ki bazı insanlar "referans düzeyinde kodlama" anlamında "kukla kodlama" kullanır; muhtemelen "kukla değişkenler" için daha kısıtlı bir tanımlamaya sahiptirler ya da olması gereken herhangi bir oranda.

† Eğer bu "aptallar" demezseniz, onlara ne diyorsunuz ?

xiiuiM

xi=1M(ui)={1when uiM0when uiM

1M()M

※ Veya @ gung'un belirttiği gibi seviye-kodlama anlamına gelir.


2
Hah ... bunu motive eden bazı kaynaklara bağlantılar sağlayabilir misiniz? Deneyimlerime göre "kukla değişken" 0/1 için büyük miktarda kodlama için kullanılır. Kukla önerdiğin gibi kullanıldığından emin değilim ve başkalarının bunu ters anlamda kullandığını bildiğimden emin değilim. Örneğin, Alkharusi, H. (2012) "Regresyon Analizinde Kategorik Değişkenler: Kukla ve Etki Kodlamasının Karşılaştırılması" Uluslararası Eğitim Dergisi 4 (2): 202-210.
Alexis

2
"Kukla değişken" 0/1 kodlaması için kullanılmaz demedim, sadece daha genel anlamda kullanılabilir.
Scortchi - Monica'yı eski durumuna döndürün

1
Gerçekten alıntıladığınız makalede, efekt kodlama kullanarak "kukla değişkenler 1, 0 ve -1 değerlerini alır" der. (Tabii ki bunu söyleyeceklerse "kukla kodlama"
demişlerdi

1
Hançerli üst tablonuzdaki soruya gelince, onlara "XXX kodlama kullanarak kategorik değişkenler" deme eğilimindeyim.
Alexis

2
Bu nokta en iyi Knuth tarafından arxiv.org/abs/math/9205211'de yapılır . Fikri KE Iverson'a bağlar . Kısacası, bir gösterge işlevi icat etmemize veya başlatmamıza gerek yoktur, ancak resmi tartışmalarda yazılımımızın bizim için ne yaptığını takip etmemiz gerekir.
Nick Cox

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.