Bunlar arasında önemli bir örtüşme var, ancak bazı ayrımlar yapılabilir. Zorunluluktur, bazı şeyleri fazla basitleştirmek veya başkalarına kısa yoldan vermek zorunda kalacağım, ancak bu alanların bir kısmını anlamak için elimden gelenin en iyisini yapacağım.
İlk olarak, Yapay Zeka diğerlerinden oldukça farklıdır. AI, akıllı ajanların nasıl oluşturulacağının araştırılmasıdır. Uygulamada, bir bilgisayarı akıllı bir ajan olarak (örneğin, bir kişi) davranacak ve bir görevi yerine getirecek şekilde programlamaktır. Bu, öğrenme veya tümevarımı içermek zorunda değildir , “daha iyi bir fare kapanı inşa etmenin bir yolu olabilir”. Örneğin, AI uygulamaları devam eden işlemleri izlemek ve kontrol etmek için programlar içermiştir (örneğin, çok düşük görünüyorsa A görünüşünü arttırın). AI lanetlemek-yakın içerebilir dikkat edin şey o 'aptalca' o yapmaz sürece, bir makine yapar.
Bununla birlikte, pratikte istihbarat gerektiren görevlerin çoğu deneyimlerden yeni bilgiler üretme yeteneği gerektirir. Bu nedenle, AI içindeki geniş bir alan makine öğrenmesidir . Bazı performans ölçütlerine göre, görevdeki performansı tecrübe ile geliştiyse, bir bilgisayar programının deneyimle ilgili bazı görevleri öğrendiği söylenir. Makine öğrenmesi, bilgileri otomatik olarak çıkarabilen (yani çevrimiçi insan rehberliği olmadan) algoritmaları içerir. Kesinlikle bu talimatların doğrudan türetilmiş, ya da klasik istatistik, ilham fikirler dahil olduğu, ancak bunlar yok olmasıolmak. AI'ya benzer şekilde, makine öğrenmesi çok geniştir ve bazı endüktif bileşenler olduğu sürece hemen hemen her şeyi içerebilir. Makine öğrenmesi algoritmasına bir örnek Kalman filtresi olabilir.
Veri madenciliği , ilham alan ve tekniklerinin çoğunu makine öğreniminden (ve bazıları da istatistiklerden) alan ancak farklı amaçlara girilen bir alandır . Veri madenciliği, bir kişi tarafından , belirli bir durumda, belirli bir veri setinde, bir amacı göz önünde bulundurularak gerçekleştirilir. Tipik olarak, bu kişi, makine öğrenmede geliştirilen çeşitli örüntü tanıma tekniklerinin gücünden yararlanmak ister. Oldukça sık, veri seti büyük , karmaşık ve / veya özel problemleri olabilir(gözlemlerden daha fazla değişken olduğu gibi). Genellikle amaç, önceden çok az bilginin olmadığı bir alandaki bazı ön kavrayışları keşfetmek / oluşturmak ya da gelecekteki gözlemleri doğru bir şekilde tahmin edebilmektir. Ayrıca, veri madenciliği prosedürleri 'denetlenmemiş' (cevabı - keşfi bilmiyoruz) veya 'denetlenebilir' (cevabı - tahminini biliyoruz) olabilir. Amacın, genellikle altta yatan veri üretme süreci hakkında daha karmaşık bir anlayış geliştirmek olmadığını unutmayın . Yaygın veri madenciliği teknikleri kümelenme analizleri, sınıflandırma ve regresyon ağaçları ve sinir ağlarını içerir.
Sanırım bu sitede hangi istatistiklerin olduğunu açıklamak için fazla bir şey söylememe gerek yok ama belki birkaç şey söyleyebilirim. Klasik istatistikler (burada hem frekans hem de Bayesian demek istiyorum) matematikte bir alt başlıktır. Bunu büyük olasılıkla olasılık hakkında bildiklerimizin ve optimizasyon hakkında bildiklerimizin kesişmesi olarak düşünüyorum. Her ne kadar matematiksel istatistikler basitçe Soruşturma'nın Platonik bir araştırma nesnesi olarak incelenebilse de, çoğu zaman matematiğin diğer, daha nadir görülen alanlarından daha pratik ve uygulamalı olarak anlaşılmaktadır. Bu haliyle (ve özellikle yukarıdaki veri madenciliğinin aksine), bazı veri üretme sürecini daha iyi anlamak için kullanılır. Böylece, genellikle resmi olarak belirlenmiş bir modelle başlarve bundan, bu modeli gürültülü örneklerden (yani, tahmin - bazı kayıp fonksiyonlarını optimize ederek) doğru bir şekilde çıkarmak ve onu diğer olasılıklardan (örneğin, örnekleme dağılımlarının bilinen özelliklerine dayanan çıkarımlar) ayırt edebilmek için türetilmiş prosedürlerdir. Prototipik istatistiksel teknik regresyondur.