19717 kişinin programlama dili seçimini çoktan seçmeli sorularla yanıtlayan bir veri çerçevem var. İlk sütun elbette cevap verenin cinsiyeti iken geri kalanı seçtikleri seçimlerdir. Bu nedenle Python'u seçersem, yanıtım bash yerine Python sütununa kaydedilir ve tersi de geçerlidir.
ID Gender Python Bash R JavaScript C++
0 Male Python nan nan JavaScript nan
1 Female nan nan R JavaScript C++
2 Prefer not to say Python Bash nan nan nan
3 Male nan nan nan nan nan
Ne istiyorum kategoriler her Gender
kayıt altında örnekleri sayısını döndüren bir tablodur . Bu nedenle 5000 erkek Python ve 3000 kadın JS'de kodlanmışsa, bunu almalıyım:
Gender Python Bash R JavaScript C++
Male 5000 1000 800 1500 1000
Female 4000 500 1500 3000 800
Prefer Not To Say 2000 ... ... ... 860
Bazı seçenekleri denedim:
df.iloc[:, [*range(0, 13)]].stack().value_counts()
Male 16138
Python 12841
SQL 6532
R 4588
Female 3212
Java 2267
C++ 2256
Javascript 2174
Bash 2037
C 1672
MATLAB 1516
Other 1148
TypeScript 389
Prefer not to say 318
None 83
Prefer to self-describe 49
dtype: int64
Ve yukarıda açıklandığı gibi gerekli değildir. Bu pandalarda yapılabilir mi?
Gender
dizin için 0'ların tümünü döndürüyor .