Zemin Gerçeği Nedir?


30

Makine Öğrenmesi bağlamında, Zemin Gerçeği kavramının çok fazla kullanıldığını gördüm . Çok şey aradım ve Wikipedia'da şu tanımı buldum :

Makine öğrenmesinde "temel gerçek" terimi, eğitim setinin denetimli öğrenme teknikleri için sınıflandırılmasının doğruluğunu ifade eder. Bu, araştırma modellerini kanıtlamak veya yanlışlamak için istatistiksel modellerde kullanılır. "Temel gerçeğe uygunluk" terimi, bu test için uygun objektif (kanıtlanabilir) verilerin toplanması sürecini ifade eder. Altın standart ile karşılaştırın.

Bayesian spam filtreleme, denetimli öğrenmenin yaygın bir örneğidir. Bu sistemde, algoritma spam ile spam olmayan arasındaki farkları manuel olarak öğretir. Bu, algoritmayı eğitmek için kullanılan mesajların temel gerçeğine bağlıdır - temel gerçeği yanlışlıkları, ortaya çıkan spam / istenmeyen posta kararlarındaki yanlışlıklar ile ilişkilendirilecektir.

Mesele şu ki, ne anlama geldiğini bilemiyorum Mi bu etiket her biri için kullanılan veri nesnesi veya hedef fonksiyonu her bir etiket verir veri nesnesi , ya da başka belki bir şey?

Yanıtlar:


25

Temel gerçek, eğitim ve test örnekleri için hedef değişkeniniz için ölçtüğünüz şeydir.

Neredeyse her zaman güvenli bir şekilde etiketin aynısını uygulayabilirsiniz.

Bazı durumlarda tam olarak etiket ile aynı değildir. Örneğin, veri kümenizi arttırırsanız, temel gerçeği (gerçek ölçümleriniz) ile artırılmış örneklerin atadığınız etiketlerle olan ilişkisi arasında ince bir fark vardır. Ancak, bu ayrım genellikle bir sorun değildir.

Temel gerçek yanlış olabilir. Bu bir ölçümdür ve içinde hatalar olabilir. Bazı ML senaryolarında, altta yatan bir nesnel gerçeği tanımlamanın zor olduğu öznel bir ölçüm de olabilir - örneğin otomatikleştirmeyi umduğunuz uzman görüşü veya analizi. Eğittiğiniz herhangi bir ML modeli, onu eğitmek ve test etmek için kullanılan temel gerçeğin kalitesi ile sınırlı olacaktır ve bu Vikipedi alıntı ile ilgili açıklamanın bir parçasıdır. Bu nedenle, ML ile ilgili yayınlanan makalelerin, verilerin nasıl toplandığına dair tam açıklamaları da içermesi gerekir.


Eğitim sırasında, özelliklerden elde edilen bilgiler (örneğin, puan haritalarından) kullanılarak gt (örneğin, bölümlendirme problemleri gibi) değiştirilebilir veya oluşturulabilir mi?
Alex,

@Alex: Genellikle değil. Bir revize edilmiş çıktı veya yarı otomatik sürecin bir boru hattında bir sonraki algoritma için temel gerçeği ürettiği bazı durumlar olabilir. Bununla birlikte, bazı kurallarla kendi hedeflerini gözden geçiren bir algoritmaya atıfta bulunuyorsanız, bu genellikle yeni bir temel gerçek olarak kabul edilmez - bunun yerine temel gerçek, eğitim için sağlanan orijinal bölümleme olacaktır. Herhangi bir akıllı otomatik arıtma, bunun yerine modelin bir parçası olur.
Neil Slater,

İnsan etkileşimi ile yapılan bir iyileştirme veya orijinal görüntü olmayan verileri ifade eden (örneğin, bazı kaynak görüntüler 3D model kullanılarak üretilmiştir, bu nedenle çok daha iyi bir "gerçek" bölümleme oluşturabilir) yeni temel gerçeği olabilir. Her ne kadar birinci modeli inşa etmek için kullanılan 1. nesil hakikat gerçeği fikrini, bir yinelemeden geçen 2. nesil hakikat gerçeğinden ayırmak isteyebilirsiniz ve ikinci model aynı mimari olsa bile, ikinci bir model inşa etmek için kullanılır. geribildirim üzerine eğitildi.
Neil Slater,

'geribildirim konusunda eğitimli' - yakın, fakat tam olarak değil. FCN modelini gördüyseniz, son katman, log softmax loss fonksiyonuna gt haritası ile birlikte takılan puan haritasıdır. Yaptığım şey puan haritasını almak, ondan bazı verileri çıkarmak (örneğin, argmax ikili blob sayısı) ve (bir şekilde) gt maskesini kayıp fonksiyonuna bağlamadan önce değiştirmek. Bu ne kadar yasal?
Alex,

@Alex: Bu, modelinizin bir parçası ve yeni temel gerçeği değil. Karar vermediğiniz sürece, keyfi bir şekilde, yeni bir modelin amacının birleşik işlevinizi öğrenmek olduğuna karar verin. Bu durumda, yeni model için temel gerçek budur - ancak, orijinal ölçümden otomatik olarak değiştirildiği için bu verilerin karmaşık kaynağını kesinlikle belirtmelisiniz.
Neil Slater,

2

Temel gerçek: Bu, modelinizin tahmin etmesini istediğiniz gerçektir.

Biraz gürültülü olabilir, ancak modelinizin bu temel gerçeğe neden olan verilerdeki temel deseni öğrenmesini istiyorsunuz. Pratik olarak, modeliniz yer gerçeğini asla tahmin edemez, çünkü yer gerçeği de bazı gürültülere sahip olacaktır ve hiçbir model yüzde yüz doğruluk vermez, ancak modelinizin mümkün olduğunca yakın olmasını istersiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.