Bir var Makine Öğrenimi ders bu dönem ve profesör bir bulmamızı istedi gerçek dünya problemi gibi, sınıfta tanıtılan makine öğrenme yöntemlerden biriyle bunu çözmek:
- Karar ağaçları
- Yapay Sinir Ağları
- Vektör makineleri desteklemek
- Örnek Tabanlı Öğrenme ( kNN , LWL )
- Bayesian Ağları
- Takviye öğrenme
Ben hayranları biriyim stackoverflow ve Stack Exchange ve know veritabanı döker onlar müthiş çünkü bu web sitelerinin halka sağlanmıştır arasında! Umarım, bu veritabanları hakkında iyi bir makine öğrenme mücadelesi bulabilir ve çözebilirim.
Benim fikrim
Aklıma gelen bir fikir, soru gövdesindeki girilen kelimelere dayanarak sorular için etiketler öngörmektir. Bayesian ağının bir soru için etiket öğrenmenin doğru aracı olduğunu düşünüyorum ancak daha fazla araştırmaya ihtiyaç var. Neyse, öğrenme aşamasından sonra kullanıcı soruyu girmeyi bitirdiğinde, ona bazı etiketler önerilmelidir.
Lütfen söyle bana :
İstatistik topluluğuna deneyimli insan olarak ML iki soru hakkında sorular sormak istiyorum:
Etiket önerisinin en azından çözme şansı olan bir sorun olduğunu düşünüyor musunuz? Bununla ilgili herhangi bir tavsiyen var mı? Biraz endişeliyim çünkü stackexchange henüz böyle bir özelliği uygulamadı.
Stackexchange veritabanına dayanan ML projesi için başka / daha iyi bir fikriniz var mı? Stackexchange veritabanlarından öğrenilecek bir şeyler bulmak gerçekten zor .
Veritabanı hataları hakkında dikkat edilmesi gerekenler: Veritabanlarının büyük olmasına ve birçok örneği olmasına rağmen, mükemmel olmadıklarını ve hata yaptıklarını belirtmek isterim. Açık olanı, güvenilmez olan kullanıcıların çağıdır. Soru için seçilen etiketler bile% 100 doğru değil. Her neyse, bir problem seçiminde verilerin doğruluğunun yüzdesini göz önünde bulundurmalıyız.
Sorunun kendisi hakkında değerlendirme:data-mining
Projem böyle veya böyle bir şey olmamalı . Sadece gerçek dünyada ML yöntemlerinin bir uygulaması olmalıdır.