«data-mining» etiketlenmiş sorular

Veri madenciliği, daha önce bilinmeyen kalıpları keşfetmek için veritabanı bağlamında yapay zeka yöntemlerini kullanır. Bu haliyle, yöntemler genellikle denetimsizdir. Bu yakından ilişkilidir ancak makine öğrenimi ile aynı değildir. Veri madenciliğinin temel görevleri küme analizi, aykırı değer tespiti ve ilişkilendirme kurallarının madenciliğidir.

5
K-araçlarının sakıncaları nasıl anlaşılır
K-aracı küme analizinde yaygın olarak kullanılan bir yöntemdir. Anladığım kadarıyla, bu yöntem HERHANGİ BİR varsayım gerektirmez, yani, bana bir veri kümesi ve önceden belirlenmiş sayıda küme verir, k ve ben sadece küme içindeki kare hataların (SSE) en aza indirgenen bu algoritmayı uygularım hata. Yani k-aracı aslında bir optimizasyon problemidir. K-araçlarının …

12
Veri madenciliği, istatistik, makine öğrenmesi ve AI arasındaki fark nedir?
Veri madenciliği, istatistik, makine öğrenmesi ve AI arasındaki fark nedir? Çok benzer problemleri çözmeye çalışan 4 alan olduklarını söylemek doğru olur mu? Farklı yaklaşımlarla? Tam olarak ortak noktaları nedir ve nereleri farklıdır? Aralarında bir çeşit hiyerarşi varsa, ne olurdu? Daha önce de benzer sorular sorulmuştu ama hala anlamadım: Veri Madenciliği …

4
Cohen'in basit İngilizce dilinde kappa
Bir veri madenciliği kitabı okuyorum ve sınıflayıcıların tahmin performansını değerlendirmenin bir aracı olarak Kappa istatistiklerinden bahsetti. Ancak bunu anlayamıyorum. Ayrıca Wikipedia'yı da kontrol ettim ama bu da yardımcı olmadı: https://en.wikipedia.org/wiki/Cohen's_kappa . Cohen'in kappa sınıflandırıcıların öngörü performansını değerlendirmede nasıl yardımcı olur? Ne anlatıyor? % 100 kappa'nın sınıflandırıcının rastgele bir sınıflandırıcıyla tamamen …

9
Rastgele bir ormandan bilgi edinmek
Rastgele ormanlar kara kutu olarak kabul edilir, ancak son zamanlarda rastgele bir ormandan hangi bilgilerin elde edilebileceğini düşünüyordum? En belirgin şey değişkenlerin önemidir, en basit değişkende, sadece değişkenlerin oluşum sayısını hesaplayarak yapılabilir. Düşündüğüm ikinci şey etkileşimler. Ağaç sayısı yeterince büyükse, o zaman değişken çiftlerinin oluşum sayısının test edilebildiğini düşünüyorum (ki …

11
Doktora olmadan veri madenciliği alanında çalışmak
Bir süredir veri madenciliği ve makine öğrenimi ile çok ilgilenmiştim , kısmen okulda o alanda yoğunlaştığım için, aynı zamanda sadece programlamadan biraz daha fazla düşünce gerektiren sorunları çözmeye çalışırken gerçekten çok daha heyecanlı olduğum için bilgi ve kimin çözümü çok formlara sahip olabilir. Araştırmacı / bilim adamı geçmişim yok, veri …


8
Makine öğrenenlerde bulmak zor Becerileri?
Veri madenciliği ve makine öğrenmesi o kadar popüler hale gelmiş gibi görünüyor ki, artık hemen hemen her CS öğrencisi sınıflandırıcılar, kümeleme, istatistiksel NLP… vb. Sorum şu: Bir veri madencisinin onu diğerlerinden farklı kılacak beceriler nelerdir? Onu o kadar kolay olmayan, onun gibi biri gibi biri yapması için.

8
Mevcut bir değişken (ler) ile tanımlanmış bir korelasyon ile rastgele bir değişken oluşturun
Bir simülasyon çalışması için, mevcut bir değişkenine önceden tanımlanmış (popülasyon) bir korelasyon gösteren rastgele değişkenler oluşturmalıyım .YYY RPaketlere baktım copulave CDVinebelirli bir bağımlılık yapısına sahip rastgele çok değişkenli dağılımlar üretebiliyorum. Bununla birlikte, ortaya çıkan değişkenlerden birini mevcut bir değişkene sabitlemek mümkün değildir. Herhangi bir fikir ve mevcut fonksiyonlara bağlantılar takdir …

2
Neden sadece üç bölüm? (eğitim, doğrulama, test)
Modelleri geniş bir veri kümesine sığdırmaya çalışırken, ortak tavsiye, verileri üç bölüme ayırmaktır: eğitim, doğrulama ve test veri kümesi. Bunun nedeni, modellerin genellikle üç "seviye" parametresine sahip olmalarıdır: ilk "parametre", model sınıfıdır (örneğin, SVM, sinir ağı, rasgele orman), ikinci parametre grubu, "düzenlileştirme" parametreleri veya "hiperparametreler" dir ( örneğin, kement ceza …


8
Örnekleme 'büyük veri' zamanında önemli midir?
Ya da daha fazla "olacak" mı? Büyük Veri , istatistikleri ve ilgili bilgileri daha da önemli hale getirir ancak Örnekleme Teorisinin altını çizer. Bu yutturmaca 'Büyük Veri' etrafında gördüm ve "neden" her şeyi analiz etmek isteyeyim merak ediyorum yardımcı olamaz ? "Örnekleme Teorisi" nin tasarlanması / uygulanması / icat edilmesi …


3
K-Means ve EM ile Kümelenme: Bunlar nasıl ilişkilidir?
Verileri kümelemek için algoritmalar çalıştım (denetimsiz öğrenme): EM ve k-araçları. Aşağıdakileri okumaya devam ediyorum: k-aracı, kümelerin küresel olduğu varsayımlarıyla birlikte EM'nin bir çeşididir. Birisi yukarıdaki cümleyi açıklayabilir mi? Küresel olanın ne anlama geldiğini ve kmeans ve EM'in birbirleriyle nasıl ilişkili olduğunu anlamıyorum, çünkü biri olasılıksal ödevini diğeri ise deterministik bir …


3
Gizli Markov modelleri ve sinir ağları arasındaki farklar nelerdir?
Sadece ayaklarımın istatistiklerini ıslattığım için üzgünüm, eğer bu soru mantıklı gelmiyorsa. Gizli aramaları (haksız kumarhaneler, zar atma vb.) Ve sinir ağlarını tahmin etmek için Markov modellerini ve kullanıcıların arama motorundaki tıklamaları incelemek için kullandım. Her ikisinde de gözlemleri kullanarak çözmeye çalıştığımız gizli durumlar vardı. Anladığım kadarıyla ikisi de gizli durumları …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.