boyuna veriler için makine öğrenme teknikleri


11

Boyuna verileri modellemek için herhangi bir makine öğrenme tekniği (denetimsiz) olup olmadığını merak ediyordum. Her zaman karışık efekt modelleri kullandım (çoğunlukla doğrusal olmayan) ama bunu yapmanın başka bir yolu olup olmadığını merak ettim (makine öğrenimini kullanarak).

Makine öğrenimi ile, rastgele orman, sınıflandırma / kümeleme, karar ağaçları ve hatta derin öğrenme vb.


Ne demek istediğini "makine öğrenimi" ile tanımlayabilir misin? Uygun katmanlaşmadan sonra bir LME'yi artırabilirsiniz. Aslında bu oldukça yeni olurdu!
usεr11852

@ usεr11852, soruya biraz daha açıklama ekledim - umarım bu biraz daha açıklığa kavuşur.
John_dydx

Ah ... tanımınıza göre artırmak ML değil. Cool Açıklık için teşekkürler umarım yakında biraz dikkat çekecektir.
usεr11852

... ve de artıyor.
John_dydx

3
Bu soru oldukça belirsiz görünüyor. "Makine öğrenmesi" geniş bir terimdir ve hatta "rastgele orman, sınıflandırma / kümeleme, karar ağaçları ve hatta derin öğrenme vb." oldukça geniştir. İlgilendiğiniz açık bir uygulama var mı? Örneğin, ikilik çıktıyı sınıflandırmanız gerekiyorsa, lojistik karma efektler modeli veya lojistik GEE kullanabilirsiniz. Makine öğrenimi ve istatistiksel modeller farklı şeyler olmak zorunda değildir.
Jon

Yanıtlar:


7

Bir denekten birden fazla gözlem olması durumunda (örneğin, aynı hastadan çoklu ziyaretler), 'hasta kimliği' bir 'gruplama' değişkenidir. Model değerlendirmesi sırasında aynı hastadan yapılan ziyaretlerin hem eğitim hem de test verilerinde görünmemesine dikkat edilmelidir, çünkü bunlar birbiriyle ilişkilidir ve sınıflandırıcı doğruluğunun şişmesine yol açacaktır .

Çapraz doğrulama sklearn belgeleri gruplanmış veriler için çapraz doğrulama tekrarlayıcılara sahiptir. Bkz. GroupKFold , LeaveOneGroupOut ve LeavePGroupsOut .

Daha da iyisi, Tekrarlayan Sinir Ağları veya Gizli Markov Modelleri'ni deneyin .


4

Boylamınızı, yalnızca boylamı temsil eden özellikler ekleyerek, örneğin zamanı temsil eden bir özellik ekleyerek standart makine öğrenme yöntemleriyle modelleyebilirsiniz. Veya bir gruba, kişiye vb. Üyeliği belirten bir özellik (panel veri durumunda).

Özellik oluşturma / çıkartma konusunda yaratıcıysanız, ML algoritmalarıyla her şeyi modelleyebilirsiniz.


1
@PhlippePro, bu cevap hakkında biraz kafam karıştı. (1) Eğitim setinizde olmayan bir kişiyi tahmin etmek isterseniz ne olur? Sadece eğitim setiniz için katsayılarınız var, değil mi? (2) Kişiye karşılık gelen bir özellik eklemek, veri kümenizde 100.000 kişinin olduğu varsayılarak 100.000'e kadar yeni kukla değişken eklenmesine neden olabilir. Bu yeni özellikler sadece orijinal özelliklerin yanında olacak mı?
user0

(1) Eğitim veri setinizde tahmin etmek istediğiniz kişilere sahip değilseniz, "kişi özelliğini" kullanamazsınız, bu doğru. (2) Kukla özellikler yapmak yerine, bir "kategorik" özellik yapabilirsiniz (örneğin, bunları R'de as.factor ile kategorik olarak belirtirsiniz). Bazı algoritmalar çok fazla kategoriyi işleyemez (örneğin, randomForest sadece yaklaşık 50 işleyebilir), o zaman gerçekten kukla değişkenler olarak belirtmeniz gerekir ve işaret ettiğiniz gibi (çok) birçok özellik elde edebilirsiniz.
PhilippPro

ML kadar kolayca boyuna veri anlamına gelmediği
Aksakal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.