Kategorik bir vektörü alan ve onu bir sıcak kodlama kullanarak ikili temsile dönüştüren operatörün adı nedir? Bilimsel bir makale yazdığım ve bunun için uygun bir isme ihtiyaç duyduğumdan merak ediyorum.
Kategorik bir vektörü alan ve onu bir sıcak kodlama kullanarak ikili temsile dönüştüren operatörün adı nedir? Bilimsel bir makale yazdığım ve bunun için uygun bir isme ihtiyaç duyduğumdan merak ediyorum.
Yanıtlar:
İstatistikçiler tek-sıcak kodlamayı kukla kodlama olarak adlandırırlar . Diğerlerinin önerdiği gibi ( yorumlarda Scortchi dahil ), bu tam eşanlamlı değildir, ancak bu genellikle 0-1 kodlu kategorik değişkenler için kullanılacak olan terimdir.
Ayrıca bkz: Nominal / kategorik veriler için "kukla değişken" ile "gösterge değişkeni"
Hedef kitlenize bağlıdır.
As Tim söyledi, istatistikçiler kodlama kukla diyoruz ve regresyon modeli gibi bir şey anlatırken ne beklenir en görmek için bu. "Mağazanın konumuna göre ayarlamak için kukla kodlanmış değişkenler dahil edildi." Bence bir sıcak kodlama burada biraz garip görünebilir.
Bununla birlikte, başka bir Tim'in de söylediği gibi, bir sıcak kodlama, makine öğrenimi literatüründe oldukça yaygındır. En azından benim için düğümlerin (sinir ağında olduğu gibi), fiziksel tellerin (bir cihazda) veya bunun gibi bir şeyin varlığını hafifçe ima eder.
Resmi olarak, sanırım bir dizi gösterge işlevi uyguluyorsunuz , ancak bu muhtemelen bir kanıtın dışında çok resmi.
Terim elektronik mühendisliğinden gelir. Sadece kimin "sıcak" diyeceğini düşünün? Sadece "sıcak" veya "canlı" elektrikle çalışanlar , tel üzerinde elektrik potansiyeli olduğu anlamına gelir . "Bir sıcak", bir kablo üzerindeki ayrı elektrik sinyal seviyesinin, bir kablo seti üzerinde sıcak / soğuğa çözüleceği devre tasarımını ifade eder. Ben EE arka plan ile bazı makine öğrenme millet analoji ilgi çekici buldum sanırım.
Ekonometri ve istatistiklerde karşılaşabileceğiniz dummy
ya indicator
da oldukça benzer olan değişkenler, çünkü bunlar farklı göstergeleriyle farklı kategorileri temsil etmek için kullanılır. Ancak ince bir fark var. Örneğin, K kategorileri için K-1 mankenleri yaparsınız, çünkü temel kategori 0'a ayarlanmış tüm mankenlere karşılık gelir. Buna karşılık, bir sıcak kodlamada, temel kategorinin kendi kablosuna sahip olacağı K telleri olduğunu düşünüyorum ( değişken).
İstatistiksel olarak eğitildim ve kısa süre önce makine öğrenimi / comp sci lit'te "tek etkin kodlama" yı duydum. Genellikle tek ısıtmalı matrise tasarım matrisi / veri matrisi / tasarım çerçevesi olarak değindim.
Fizik bilimlerinde ve mühendislikte buna (genelleştirilmiş) Kronecker deltası denir .
En basit şekilde, olarak tanımlanan Kroneker deltası bu önemsiz bir şekilde
Bu nedenle, " " hangilerinin en çok kategori bağlamda açıksa yazarlar " " şeklinde kısalırlar.
Kronecker deltası Sigma / Pi / Einstein / vb. terimlerin koşullu olarak belirtilmesine izin verdiğinden gösterimler.
Sadece ortak programlama yapılarına bu ilişkilendirmek, Kronecker delta en condition?1:0
nerede ?:
olduğunu koşullu operatör .
Teğetsel bir not olarak, yazarları eski moda genel eşdeğer lehine terk etmeye teşvik ediyorum . Eski moda notasyonunun bir avantajı yoktur, genelleştirilmiş notasyon daha açık ve genişletilebilir.
Christopher Bishop'un Örüntü Tanıma ve Makine Öğrenmesi -of- şemasını kullanır .K
İşte kitaptan bir alıntı,
İkili değişkenler, iki olası değerden birini alabilen miktarları tanımlamak için kullanılabilir. Bununla birlikte, çoğu kez, birbirini dışlayabileceği olası durumlardan birini üstlenebilecek ayrı değişkenlerle karşılaşırız . Bu tür değişkenleri ifade etmenin çeşitli alternatif yolları olmasına rağmen, kısa bir süre içinde özellikle uygun bir gösterimin, değişkenin, aşağıdakilerden birinin bulunduğu -boyutlu bir vektör ile temsil edildiği of- şeması olduğunu göreceğiz . elemanları eşittir ve geri kalan bütün elemanları eşit . Örneğin, alabilecek bir değişkenimiz varsa1 K K x x k 1 0 K = 6durumlar ve değişkenin belirli bir gözlemi, olduğu duruma karşılık gelir.