Birkaç girişi olan bir panda veri çerçevem var ve bazı mağaza türlerinin geliri arasındaki ilişkiyi hesaplamak istiyorum. Gelir verileri, faaliyet alanlarının sınıflandırılması (tiyatro, giyim mağazaları, yiyecek ...) ve diğer veriler bulunan çok sayıda mağaza vardır.
Yeni bir veri çerçevesi oluşturmaya ve aynı kategoriye ait tüm mağaza türlerinin geliri olan bir sütun eklemeye çalıştım ve geri dönen veri çerçevesi yalnızca ilk sütunu doldurdu ve geri kalanı NaN'lerle dolu. Yorgun olduğum kod:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Bunu yapmak istiyorum, bu yüzden .corr()
mağaza kategorileri arasındaki korelasyon matrisini vermek için kullanabilirim .
Ondan sonra matris değerlerini (-1 ile 1 arasında, Pearson'un korelasyonunu kullanmak istediğimden) matplolib ile nasıl çizebileceğimi bilmek istiyorum.