Bir df'nin bir sütununu diğer df'lerle karşılaştırmak istiyorum. Sütunlar adlar ve soyadlar. Bir veri çerçevesindeki bir kişinin bir diğerinde olup olmadığını kontrol etmek istiyorum.
Bir df'nin bir sütununu diğer df'lerle karşılaştırmak istiyorum. Sütunlar adlar ve soyadlar. Bir veri çerçevesindeki bir kişinin bir diğerinde olup olmadığını kontrol etmek istiyorum.
Yanıtlar:
Belirli bir sütundaki değerlerin eşittir değerlerini kontrol etmek istiyorsanız, Ad diyelim ki her iki Veri Çerçevesini de yenisiyle birleştirebilirsiniz:
mergedStuff = pd.merge(df1, df2, on=['Name'], how='inner')
mergedStuff.head()
where
Büyük bir veri kümeniz varsa , bunun daha verimli ve hızlı olduğunu düşünüyorum.
İki farklı sütundaki değerleri karşılaştırma
Set kullanarak, her sütunda benzersiz değerler elde edin. Bu iki kümenin kesişimi, her iki sütunda da benzersiz değerler sağlayacaktır.
Örnek:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1['c2']).intersection(set(df2['c2']))
Çıktı:
{2, 5}
İki veri çerçevesinin sütun adlarını karşılaştırma
İki veri karesinin sütun adlarını karşılaştırmaya çalışıyorsanız:
Eğer df1
ve df2
iki dataframes ise:
set(df1.columns).intersection(set(df2.columns))
Bu, her iki veri çerçevesinde bulunan benzersiz sütun adlarını sağlar.
Örnek:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1.columns).intersection(set(df2.columns))
Çıktı:
{'c2', 'c3'}