«data-mining» etiketlenmiş sorular

Veri madenciliği, daha önce bilinmeyen kalıpları keşfetmek için veritabanı bağlamında yapay zeka yöntemlerini kullanır. Bu haliyle, yöntemler genellikle denetimsizdir. Bu yakından ilişkilidir ancak makine öğrenimi ile aynı değildir. Veri madenciliğinin temel görevleri küme analizi, aykırı değer tespiti ve ilişkilendirme kurallarının madenciliğidir.

2
Önceki etkinliklerin zamanlarına bağlı olarak bir sonraki etkinliğin ne zaman gerçekleştiğini nasıl tahmin edebilirim?
Ben bir lise öğrencisiyim ve bir bilgisayar programlama projesi üzerinde çalışıyorum, ancak bir lise istatistik dersinin ötesinde istatistik ve modelleme verileri konusunda çok fazla deneyimim yok, bu yüzden kafam karıştı. Temel olarak, birisinin bir belgeyi yazdırmaya karar verdiği zamanlarda oldukça büyük bir listem var (herhangi bir istatistiksel test veya önlem …

7
Makine Öğreniminde Taraflı Veriler
Zaten veri seçimi tarafından (ağırlıklı olarak) önyargılı verilerle bir Makine Öğrenimi projesi üzerinde çalışıyorum. Bir dizi sabit kodlu kuralınız olduğunu varsayalım. Kullanabileceği tüm veriler zaten bu kurallara göre filtrelenmiş veriler olduğunda, bunun yerine bir makine öğrenme modeli nasıl oluşturulur? Her şeyi açıklığa kavuşturmak için en iyi örnek Kredi Riski Değerlendirmesi …

3
Etkileşimli veri görselleştirmesi ne zaman yararlıdır?
Yakında vereceğim bir konuşmaya hazırlanırken, yakın zamanda etkileşimli veri görselleştirme için iki büyük (Ücretsiz) araca girmeye başladım : GGobi ve mondrian - her ikisi de çok çeşitli yetenekler sunuyorlar (biraz buggy olsalar bile). Artikülasyon konusunda yardımınızı istiyorum (hem kendime hem de gelecekteki izleyicilerime) Etkileşimli grafikleri kullanmak ne zaman yardımcı olur? …



3
Veri harmanlama nedir?
Bu terim, yöntemle ilgili iş parçacıklarında sıklıkla görülür . Is karıştırma veri madenciliği ve istatistik öğrenme belirli bir yöntem? Google'dan alakalı bir sonuç alamıyorum. Karıştırma, birçok modelin sonuçlarını karıştırıyor ve daha iyi bir sonuç veriyor. Bu konuda daha fazla bilgi edinmeme yardımcı olan herhangi bir kaynak var mı?

10
Veri madenciliği yazılım araçlarının incelenmesi
Mühendis olarak eğitilmiş olmama rağmen, veri madenciliğiyle daha fazla ilgilendiğimi fark ettim. Şu anda alanı daha fazla araştırmaya çalışıyorum. Özellikle, var olan farklı yazılım araçları kategorilerini ve her kategoride hangi araçların ve neden önemli olduğunu anlamak istiyorum. ("En iyi" araçları söylemediğimi unutmayın, sadece önemli olanlar bir alev savaşı başlattığımız sürece.) …

4
Gizli özelliklerin anlamı?
Tavsiye sistemleri için matris çarpanlara ayırma modellerini anlamaya çalışıyorum ve her zaman 'gizli özellikleri' okuyorum, ama bu ne anlama geliyor? Bir özelliğin bir eğitim veri kümesi için ne anlama geldiğini biliyorum, ancak gizli özellikler fikrini anlayamıyorum. Konuyla ilgili bulabildiğim her makale çok sığ. Düzenle: en azından beni fikri açıklayan bazı …

1
Lojistik regresyon ve destek vektör makineleri arasındaki fark nedir?
Lojistik regresyonun, eğitim örneklerini ayıran bir hiper düzlem bulduğunu biliyorum. Ayrıca destek vektör makinelerinin hiper düzlemi maksimum marjla bulduğunu da biliyorum. Benim sorum: lojistik regresyon (LR) ve destek vektör makineleri (SVM) arasındaki fark, SVM hiper düzlemi maksimum marjla bulurken LR'nin eğitim örneklerini ayıran herhangi bir hiper düzlem bulması mı? Yoksa …

3
Neden diğer algoritmalar yerine k-araçlarını kullanıyoruz?
K-ortalamaları hakkında araştırma yaptım ve bunlar var: k-means bilinen kümelenme sorunlarını çözmek için denetimsiz öğrenme yöntemini kullanan en basit algoritmalardan biridir. Büyük veri kümeleriyle gerçekten iyi çalışır. Bununla birlikte, K-Ortalamalarının dezavantajları vardır: Aykırı değerlere ve gürültüye karşı güçlü hassasiyet Dairesel olmayan küme şekliyle iyi çalışmaz - küme sayısı ve başlangıç …

2
Niceliksel modellemede model performansı
Kuantil regresyon kullanıyorum (örneğin R aracılığıyla gbmveya quantregR ile) - medyana odaklanmak yerine üst kuantile (örneğin 75.) odaklanmak. Tahminli bir modelleme geçmişinden geldiğimde, modelin bir test setine ne kadar iyi uyduğunu ölçmek ve bunu bir işletme kullanıcısına açıklayabilmek istiyorum. Benim sorum nasıl? Sürekli hedefli tipik bir ortamda aşağıdakileri yapabilirim: Genel …

3
Doğru analiz tekniğinin ve testinin seçilmesine yardımcı olan akış şemaları
İstatistiksel bilgiye ihtiyaç duyan ancak resmi olarak eğitilmiş bir istatistikçi olmayan biri olarak, belirli bir sorunu çözmek için doğru yaklaşımı seçmeme yardımcı olacak bir akış şemasına (veya bir tür karar ağacına) sahip olmayı yararlı bulurdum (örn. " buna ihtiyaç duyar ve bunu ve bunu normal olarak dağıtılacağını düşünür mü? X …



2
Sınıflandırma ve regresyon ağaçlarının arkasındaki matematik
Herkes CART'ta sınıflandırmanın ardındaki bazı matematiği açıklamaya yardımcı olabilir mi? İki ana aşamanın nasıl gerçekleştiğini anlamak istiyorum. Örneğin, bir veri kümesi üzerinde bir CART sınıflandırıcısı eğittim ve tahmini performansını işaretlemek için bir test veri kümesi kullandım ancak: Ağacın ilk kökü nasıl seçilir? Her dal neden ve nasıl oluşturulur? 15 sütun …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.