Benim numpy dizilerim np.nan
eksik değerleri belirtmek için kullanır . Veri seti üzerinde yinelediğimde, bu tür eksik değerleri tespit etmem ve bunları özel yollarla ele almam gerekiyor.
Naively kullandım numpy.isnan(val)
, val
desteklenen türlerin alt kümeleri arasında olmadığı sürece iyi çalışıyor numpy.isnan()
. Örneğin, dize alanlarında eksik veriler oluşabilir, bu durumda şunu elde ederim:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
İstisnaları ve geri dönüşleri yakalayan pahalı bir paketleyici yazmaktan başka False
, bunu zarif ve verimli bir şekilde halletmenin bir yolu var mı?
pandas.isnull()
mükemmel çalışıyor gibi görünüyor. Şu anda uğraştığım tek veri türü numpy.isnan()
dizedir ve pandas.isnull()
onu iyi idare eder. Aslında, ona fırlattığım tüm rastgele nesneleri iyi idare ediyor gibi görünüyor. Endişe ettiğiniz belirli sorunlar var mıydı? Aksi takdirde, en azından pandalar için kanonik bir cevap gibi göründüğü için yorumunuzu tam teşekküllü bir cevap olarak göndermek isteyebilirsiniz.
pandas
haspandas.isnull()
: Bunun ihtiyaçlarınızı karşılayıp karşılamadığından emin değilim, bu nedenle bazı örnek veriler iyi olabilir.