Dosyaya yazmak için listeden rastgele 50 öğe seçin


130

Şimdiye kadar dosyanın nasıl içe aktarılacağını, yeni dosyalar nasıl oluşturulacağını ve listeyi nasıl rastgele hale getirileceğini buldum.

Bir dosyaya yazmak için listeden rastgele yalnızca 50 öğe seçerken sorun mu yaşıyorum?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

Yani toplam randomizasyon dosyası

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

İlk rastgele 3 set, ikinci rastgele set 3 ve üçüncü rastgele set 3 olan 3 dosya (out_file1 | 2 | 3) istiyorum (bu örnek için, ancak oluşturmak istediğim dosya 50 olmalıdır)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

Yani son '4' dahil edilmeyecek ki bu sorun değil.

Randomize ettiğim listeden nasıl 50 tane seçebilirim?

Daha da iyisi, orijinal listeden rastgele 50'yi nasıl seçebilirim?


ne demek istiyorsun?
O.rka

Yanıtlar:


270

Liste rastgele sıradaysa, sadece ilk 50'yi alabilirsiniz.

Aksi takdirde kullanın

import random
random.sample(the_list, 50)

random.sample Yardım Metni:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)

1
random.sampleSeçmiş olduğu endeksleri de geri alabilir miyim ?
zyy

43

Rastgele öğeleri seçmenin kolay bir yolu, karıştırıp dilimlemektir.

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables

@MonicaHeddneck Neden rastgele karıştırma ve dilimleme daha iyi olsun? Seçimi rastgele karıştırarak bir dizi örnek seçmek, rastgele karıştırma ve ardından karıştırılmış örneklerin bir dilimini almakla aynı faydalara sahip olmaz mıydı? Açıklayabilir misin? Teşekkürler.
salvu

7
Bunu, bir makine öğrenimi projesi için kolayca bir test / eğitim seti oluşturmak için kullandım. random.choice(mylist,3)Bunun yaptığı gibi kullanmak , iki ayrık küme oluşturmaz.
Monica Heddneck

29

Daha random.choice()iyi bir seçenek olduğunu düşünüyorum .

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

işlev, listeden rastgele seçilen 3 değerden oluşan bir dizi döndürür


7
Bence kullanman gerekiyor random.choice(mylist, 3, replace=False). Ayrıca kullanımı daha az kafa karıştırıcı import numpy as npvenp.random.choice(mylist, 3, replace=False)
John La Rooy

10
Bu, liste maddesini tekrarlama şansı var
Paullo

Hayır, bu daha iyi bir seçenek değil, ~ 100 kat daha yavaş
nitesh kansal

-3

Diyelim ki listenizde 100 öğe var ve bunların 50 tanesini rastgele bir şekilde seçmek istiyorsunuz. İşte izlenecek adımlar:

  1. Kitaplıkları içe aktarın
  2. Rastgele sayı üreteci için tohum oluştur, onu 2'ye koydum
  3. Rastgele bir şekilde almak için bir sayı listesi hazırlayın
  4. Rakam listesinden rastgele seçimler yapın

Kod:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.