Python kullanarak bir dizindeki dosya sayısını saymak gerekir.
Sanırım en kolay yolu len(glob.glob('*'))
, ama aynı zamanda dizinin kendisini bir dosya olarak sayar.
Bir dizindeki dosyaları saymanın herhangi bir yolu var mı ?
Python kullanarak bir dizindeki dosya sayısını saymak gerekir.
Sanırım en kolay yolu len(glob.glob('*'))
, ama aynı zamanda dizinin kendisini bir dosya olarak sayar.
Bir dizindeki dosyaları saymanın herhangi bir yolu var mı ?
Yanıtlar:
os.listdir()
kullanmaktan biraz daha verimli olacaktır glob.glob
. Bir dosya adının sıradan bir dosya olup olmadığını (dizin veya başka bir varlık değil) test etmek için şunu kullanın os.path.isfile()
:
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
folder_path
içini eklemeyi unutmayın os.path.filename(name)
. stackoverflow.com/questions/17893542/…
os.path.join(DIR, name)
Üzerinden kullanmanın yararı nedir DIR + '/' + name
? İkincisi daha kısa ve IMO, öncekinden daha açıktır. Muhtemelen ikincisinin başarısız olacağı bazı işletim sistemleri var mı?
import os
path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
Tüm dosya türleri için alt dizinler şunları içerir:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
Yalnızca dosyalar (alt dizinlerden kaçınma):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
Burada fnmatch çok kullanışlı oluyor:
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
Daha fazla ayrıntı: http://docs.python.org/2/library/fnmatch.html
os.path.isfile()
kabul edilen yanıtla test etmek yerine, bu çok daha hızlıdır (10,000 dosya içeren bir dizindeki testlerimin yarısı kadar) . Ayrıca önemli ölçüde daha hızlı glob.glob()
.
Dizindeki tüm dosyaları (alt dizinlerdeki dosyalar da dahil olmak üzere) saymak istiyorsanız, en pitonik yol şudur:
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
Dosya sayımlarını açıkça eklemekten daha hızlı olan toplamı kullanıyoruz (zamanlamalar beklemede)
_
bir for
döngüde kullanabileceğimizi biliyorum . os.walk
ayrıca biliyorum. Ama sum
işlevin içinde alt çizgi ile neler olup bittiğinden emin değil misiniz, lütfen biraz ayrıntı verebilir misiniz? Teşekkürler!
import os
print len(os.listdir(os.getcwd()))
Kimsenin bahsetmediğine şaşırdım os.scandir
:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
Bu os.listdir
herhangi bir dizin için kullanır ve çalışır:
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
bu bir jeneratörle basitleştirilebilir ve aşağıdakilerle biraz daha hızlı hale getirilebilir:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
İşte yararlı bulduğum basit bir tek satırlık komut:
print int(os.popen("ls | wc -l").read())
ls
genel olarak kaşlarını çatmıştır (sıklıkla sorunlara neden olabilir), ancak bu kabukta kötü bir "çabuk ve kirli" yöntem değildir. ls -1
Yine de kullanmalısınız , böylece dosya başına bir satır garanti eder.
@DanielStutzbach'ın verdiği yanıta katılırken: os.listdir()
kullanmaktan biraz daha verimli olacak glob.glob
.
Ancak, klasördeki belirli dosya sayısını saymak istiyorsanız, kullanmak istediğiniz ekstra bir hassasiyet len(glob.glob())
. Örneğin, kullanmak istediğiniz bir klasördeki tüm pdf'leri sayacak olsaydınız:
pdfCounter = len(glob.glob1(myPath,"*.pdf"))
Basit:
print(len([iq for iq in os.scandir('PATH')]))
sadece dizindeki dosya sayısını sayar, ben tüm dosyaları geri dönen belirli bir dizini yinelemek için liste anlama tekniği kullandık. "len (döndürülen liste)" dosya sayısını döndürür.
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
İşletim sisteminin standart kabuğunu kullanacaksanız, saf pitonik yol kullanmak yerine sonucu çok daha hızlı alabilirsiniz.
Windows için örnek:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
Kullandığım glob.iglob
benzer bir dizin yapısı için
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
Aşağıdaki seçeneklerin her ikisi de 4 döndürür (beklendiği gibi, yani alt klasörleri saymaz )
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
Bunu yaptım ve bu klasördeki (Attack_Data) dosya sayısını döndürdü ... Bu iyi çalışıyor.
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))