Makine öğreniminde, parametrelere ve hiper parametrelere sahip bir modeli şöyle görünür:M
Y≈MH(Φ|D)
Burada parametredir ve hiper parametreleridir. , eğitim verileri ve , çıktı verileridir (sınıflandırma görevi durumunda sınıf etiketleri).H D YΦHDY
Eğitim sırasında amaç, belirttiğimiz bazı kayıp fonksiyonlarını optimize eden parametrelerinin tahminini bulmaktır . Model ve kayıp fonksiyonu , dayandığından, ortaya çıkan parametreler de hiper-parametrelere . LMLHΦHΦ^LMLHΦH
Hiper-parametreler , antrenman sırasında 'öğrenilmez', ancak değerlerinin değişmez olduğu anlamına gelmez. Tipik olarak, hiper parametreler sabittir ve yerine basitçe modelini düşünüyoruz . Burada, hiper parametreler ayrıca a-priori parametreleri olarak kabul edilebilir. M M HHMMH
Karışıklık kaynağı, ve açıkçası parametrelerine ek olarak, eğitim rutini sırasında hiper parametrelerin değiştirilmesinden kaynaklanır . Eğitim sırasında yi değiştirmek için potansiyel olarak birkaç motivasyon vardır . Bir örnek, optimizasyon rutininin hızını ve / veya stabilitesini arttırmak için eğitim sırasındaki öğrenme oranını değiştirmek olabilir. , H ΦMHHΦ^H
Önemli ayrım noktası, sonuçta, örneğin, etiket kestirimi, , hiper-parametreler değil, model parametrelerine dayanmaktadır . Φ HYpredΦH
Bununla birlikte, ayrım uyarılara sahiptir ve sonuç olarak çizgiler bulanıklaşmaktadır. Örneğin kümeleme, özellikle de Gauss Karışımı Modellemesi (GMM) görevini düşünün. Burada belirlenen parametreler , arasında ayarlanır küme vasıtasıyla ve arasında ayarlanır Gauss çekirdeği için standart sapmalar .ˉ μ N ˉ σ N NΦ={μ¯,σ¯}μ¯Nσ¯NN
Buradaki hiper parametresini sezgisel olarak tanıyor olabilirsiniz. Bu kümeler sayısıdır . Öyleyse . Tipik olarak, küme doğrulaması, verilerinin küçük bir alt örneğini kullanarak apriori'yi belirlemek için kullanılır . Ancak, Gaussian Mixture Models öğrenme algoritmamı, eğitim sırasında çekirdek sayısı değiştirmek için bazı kriterlere göre değiştirebilirim. Bu senaryoda, hiper parametresi olan , parametre kümesinin bir parçası haline gelir ., H = { N } K D N , N Φ = { ˉ u , ˉ σ , N }NH={N}NDNNΦ={μ¯,σ¯,N}
Bununla birlikte, bu sonuç işaret edilmelidir, ya da bir veri noktası için, tahmin edilen değer veriler dayanır olup . Kendisine, her biri Gauss çekirdekleri için bir olabilirlik değerinin katkıda mesafesine göre , ilgili gelen ve kendi . 'Parametre' burada açıkça yer almaz, bu yüzden tartışmasız modelin bir parametresi değildir.D G M M ( ˉ u , ˉ σ ) , N , N d d u σ KdDGMM(μ¯,σ¯)NNddμσN
Özet: Parametreler ve hiper parametreler arasındaki fark, modelini tasarlarken uygulayıcılar tarafından kullanılma şekilleri ve kayıp fonksiyonu yöntemlerinden dolayı farklıdır . Umarım bu iki terim arasında açıklığa kavuşturulmasına yardımcı olur.LML