SQL ile eşdeğerini yapmanın bir yolunu arıyorum
SELECT DISTINCT col1, col2 FROM dataframe_table
Pandaların sql karşılaştırmasının hiçbir anlamı yok distinct
.
.unique()
yalnızca tek bir sütun için çalışır, bu yüzden sütunları birleştirebilirim veya onları bir liste / demete koyabilir ve bu şekilde karşılaştırabilirim, ancak bu pandaların daha doğal bir şekilde yapması gereken bir şey gibi görünüyor.
Bariz bir şeyi mi kaçırıyorum yoksa bunu yapmanın bir yolu yok mu?
df.apply(pd.Series.unique)
ancak benzersiz değerlerin sayısı sütunlar arasında değişiyorsa bu işe yaramaz, bu nedenle sütun adlarının anahtar olarak ve benzersiz değerler olarak bir