Ruby'deki diziden yinelenen öğeleri kaldırma


325

Yinelenen öğeler içeren bir Ruby dizi var.

array = [1,2,2,1,4,4,5,6,7,8,5,6]

For-loop'ları ve yinelemeyi kullanmadan tüm benzersiz öğeleri korurken bu dizideki tüm yinelenen öğeleri nasıl kaldırabilirim?

Yanıtlar:


722
array = array.uniq

uniq tüm yinelenen öğeleri kaldırır ve dizideki tüm benzersiz öğeleri korur.

Bu Ruby dilinin birçok güzelliğinden biridir.


50
hayır, uniq! yöntem henüz benzersiz olsaydı sıfır döndürür Örn: a = [1,2,3,4] a.uniq -> [1,2,3,4] ama a.uniq! -> nil
duykhoa

15
Bunu gerçekten yakut dilinin güzelliği olarak görmezdim ... sadece yakut standart kütüphanesinin güzelliği mi? beni yanlış anlamayın, dil hakkında çok güzel şeyler var.
Justin L.

7
aynı şeyi Objective-C, Javascript ve PHP için yazınız. O zaman bize Ruby'nin güzel bir dil olmadığını söyle!
Adam Waite

3
Bu aynı zamanda karmaşık türler için de geçerlidir: [{how: "are"}, {u:"doing"}, {how: "are"}].uniq => [{:how=>"are"}, {:u=>"doing"}]
Blaskovicz

5
@duykhoa ne diyor, uniq! yöntem nil döndürür, ancak genellikle bir dönüşü umurumda değil .uniq!nesnenin kendisi üzerinde çalışır
carpinchosaurio

82

Kavşağı iade edebilirsiniz.

a = [1,1,2,3]
a & a

Bu, kopyaları da silecektir.


12
İşlevsel olarak, bu cevap doğrudur, ancak bence bu sadece uniq kullanmaktan daha az okunabilir.
Fiona T

21
Sadece buraya koyuyordum, bu yüzden bu sayfayı ziyaret eden kişi bunu yapmanın başka yollarını da görecek, herhangi bir şekilde daha iyi olduğunu söylemeye çalışmıyordum.
jaredsmith

3
Bunun nedeni, set işlemleri kullanılırken ortaya çıkan dizinin, genellikle tekrar değeri olmayan bir veri yapısı olan bir set olarak ele alınmasıdır. a | a(Birlik) kullanmak aynı hileyi yapardı.
Cezar

47

Yinelenen öğeleri uniq yöntemiyle kaldırabilirsiniz:

array.uniq  # => [1, 2, 4, 5, 6, 7, 8]

Bilmek de yararlı olabilecek uniqbir blok alır, bu yüzden bir dizi anahtarınız varsa:

["bucket1:file1", "bucket2:file1", "bucket3:file2", "bucket4:file2"]

ve benzersiz dosyaların ne olduğunu bilmek istiyorsanız, aşağıdakileri bulabilirsiniz:

a.uniq { |f| f[/\d+$/] }.map { |p| p.split(':').last }

5
Biraz kafam karıştı. Blok, kendi karşılaştırma işlevinize ihtiyacınız varsa kullanılır - örneğin, uniqbu diziye blok olmadan göndermek , bloğunuzla aynı değeri döndürür.
hdgarrood

18

Herkes umursar başka bir alternatif.

to_setDiziyi bir Kümeye dönüştüren bir dizinin yöntemini de kullanabilirsiniz ve tanım gereği, küme öğeleri benzersizdir.

[1,2,3,4,5,5,5,6].to_set => [1,2,3,4,5,6]

4
Eğer hafızayı önemsiyorsanız, to_set4 nesne uniqayırırken bir tane ayırır .
Jan Klimo

18

Birisi yinelenen değerlerin tüm örneklerini kaldırmanın bir yolunu arıyorsa, bkz. " Ruby dizisindeki yinelenen öğeleri nasıl verimli bir şekilde ayıklayabilirim? ".

a = [1, 2, 2, 3]
counts = Hash.new(0)
a.each { |v| counts[v] += 1 }
p counts.select { |v, count| count == 1 }.keys # [1, 3]

3
Ya da sadece yapabilir a = [1, 2, 2, 3] a.find_all { |x| a.count(x) == 1 } # [1, 3]
Tim Wright

Bağlantılı soru aynı değildir; Yinelenen değerleri nasıl bulacağınızı ve nasıl döndüreceğinizi soruyor. OP kopyaları kaldırmak istiyor.
Kalay Adam

0

Sadece bir fikir vermek için:

require 'fruity'
require 'set'

array = [1,2,2,1,4,4,5,6,7,8,5,6] * 1_000

def mithun_sasidharan(ary)
  ary.uniq
end

def jaredsmith(ary)
  ary & ary
end

def lri(ary)
  counts = Hash.new(0)
  ary.each { |v| counts[v] += 1 }
  counts.select { |v, count| count == 1 }.keys 
end

def finks(ary)
  ary.to_set
end

def santosh_mohanty(ary)
    result = ary.reject.with_index do |ele,index|
      res = (ary[index+1] ^ ele)
      res == 0
    end
end

SHORT_ARRAY = [1,1,2,2,3,1]
mithun_sasidharan(SHORT_ARRAY) # => [1, 2, 3]
jaredsmith(SHORT_ARRAY) # => [1, 2, 3]
lri(SHORT_ARRAY) # => [3]
finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

puts 'Ruby v%s' % RUBY_VERSION

compare do
  _mithun_sasidharan { mithun_sasidharan(array) }
  _jaredsmith { jaredsmith(array) }
  _lri { lri(array) }
  _finks { finks(array) }
  _santosh_mohanty { santosh_mohanty(array) }
end

Hangi, çalıştırıldığında sonuçlanır:

# >> Ruby v2.7.1
# >> Running each test 16 times. Test will take about 2 seconds.
# >> _mithun_sasidharan is faster than _jaredsmith by 2x ± 0.1
# >> _jaredsmith is faster than _santosh_mohanty by 4x ± 0.1 (results differ: [1, 2, 4, 5, 6, 7, 8] vs [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, ...
# >> _santosh_mohanty is similar to _lri (results differ: [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, ...
# >> _lri is similar to _finks (results differ: [] vs #<Set: {1, 2, 4, 5, 6, 7, 8}>)

Not: bunlar kötü sonuçlar verdi:

  • lri(SHORT_ARRAY) # => [3]
  • finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
  • santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

-4

Yerleşik işlevleri kullanmadan XOR işlecini kullanmayı deneyin:

a = [3,2,3,2,3,5,6,7].sort!

result = a.reject.with_index do |ele,index|
  res = (a[index+1] ^ ele)
  res == 0
end

print result

Yerleşik işlevlerle:

a = [3,2,3,2,3,5,6,7]

a.uniq

2
İndirmedim ve Ruby hakkında hiçbir şey bilmiyorum, ama aynı .sort!zamanda dahili bir işlev değil mi?
Carolus
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.