Akıllı telefon veri kümesi problemini kullanarak insan etkinliği tanıma


9

Bu toplulukta yeniyim ve umarım sorum buraya tam olarak uyacaktır. Lisans veri analizi kursumun bir parçası olarak, akıllı telefon veri setlerini kullanarak insan etkinliği tanıma projesini yapmayı seçtim. Endişe duyduğum kadarıyla bu konu Makine Öğrenimi ve Destek Vektör Makineleri ile ilgilidir. Bu teknolojilere henüz aşina değilim, bu yüzden yardıma ihtiyacım olacak.

Bu proje fikrini takip etmeye karar verdim http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (üstteki ilk proje) Projenin amacı, bir kişinin hangi aktivitenin olduğunu belirlemektir. konunun beline bir akıllı telefon (Samsung Galaxy S II) tarafından kaydedilen verilerden (örn. WALKING, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, SITTING, STANDING, LAYING) ilgi çekici (ör. Gömülü ivmeölçer ve jiroskop kullanarak veriler, 50Hz sabit bir hızda 3 eksenli doğrusal hızlanma ve 3 eksenli açısal hız içerir.

Tüm veri seti, bazı açıklama ve özellik etiketleriyle birlikte bir klasörde verilir. Veriler, verilerin şu biçimde temsil edildiği 'test' ve 'tren' dosyaları için bölünür:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

Ve bu dosyanın içerdiği şeyin çok küçük bir örneğidir.

Bu verilerin neyi temsil ettiğini ve nasıl yorumlanabileceğini gerçekten bilmiyorum. Ayrıca verilerin analizi, sınıflandırılması ve kümelenmesi için hangi araçları kullanmam gerekecek? Bu verileri dahil etiketleri ile excel koymak ve örneğin örnek verileri ayıklamak ve bunun üzerinde çalışmak için R veya python kullanmak herhangi bir yolu var mı?

Herhangi bir ipucu / ipuçları çok takdir edilecektir.

Yanıtlar:


8

Veri kümesi tanımları bu sayfada:

Alttaki Özellik Bilgileri

veya ZIP klasörünün içinde, içinde sütun başlıklarınız olan etkinlik_etiketleri adlı dosyayı görebilirsiniz, README'yi dikkatlice okuduğunuzdan emin olun, içinde bazı iyi bilgiler var. Komutunu .csvkullanarak R'deki bir dosyayı kolayca getirebilirsiniz read.csv.

Örneğin, dosya adını verirseniz samsungdata, R'yi açıp şu komutu çalıştırabilirsiniz:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

Veya zaten R'deki çalışma dizininin içindeyseniz aşağıdakileri çalıştırabilirsiniz

data <- read.csv("samsungdata.csv", header = TRUE)

Adın dataveri kümenizi aramak istediğiniz adla değiştirilebileceği yer.


Anlıyorum. README dosyasını inceledim, ancak yine de kendi verilerini nasıl okuyabildiğini anlayamıyorum. Örneğin, train / X_train.txt'file eğitim setini temsil eder (postada gösterdiğim örnek veriler bu dosyadan gelir).
Jakubee

Bana öyle geliyor ki veri seti oldukça geniştir, her satırda features.txt dosyasının içinde listelenen 561 değişken vardır. Ben bundan bahsettiğinize inanıyorum.
MCP_infiltrator

Yani 'özellikler' dosyasındaki değişkenin her biri, örneğin 'x-test.txt' dosyasındaki her bir sütuna karşılık gelir mi yoksa yanlış mıyım?
Jakubee

Ben böyle alıyorum. README'den ne toplayabileceğim, dosyanın içerdiği şey.
MCP_infiltrator

@ Jakubee Evet. features.txtDosyada 561 satır / değişken adı ve dosyada X_train.txther değişken için bir tane olmak üzere 561 sütun vardır .
Marco13

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.