Ekonomik olarak uygulanabilir herhangi bir kamuya açık yazılım, kopya olup olmadıklarını belirlemek için ses dosyalarını karşılaştırır mı?


2

Bu sorunun damarı içerisinde https://unix.stackexchange.com/questions/3037/is-there-an-easy-way-to-replace-duplicate-files-with-hardlinks , otomatik olarak ayrıştırılacak bir yazılım var mı? şarkılarımın kütüphane ve gerçekten ortadan kaldırılabileceği kopyaları olanları bulmak? İşte bir örnek:

Kardeşim eskiden remix yapan CD'lerin büyük bir hayranıydı. Favori parçalarının hepsini alıp bir tanesine koyardı. Sonra bilgisayarımı okumak için kullanırdı. Şimdi HDD'mde 6 adet Californication kopyası var ve hepsi genel olarak birkaç baytlık bir fark. Kütüphanemde böyle yüzlerce şarkı var. Onları benzersiz olanlara dönüştürmek istiyorum. Hepsinde doğru ID3 etiketi bulunmuyor, bu yüzden zor olduğu gibi Untitled(74).mp3aynı olduğunu bulmak .californication.mp3whowrotethis.mp3

Bir konser albümü ve bir stüdyo albümü ripinin aynı olduğunu düşünmek istemiyorum (eğer sanatçı / unvan eşleştirmesini yapsaydım, bu senaryo ile bitirdim, bu benim için işe yaramadı).

Windows kullanıyorum (platformunuzu seçin) ve yılın ilerleyen zamanlarında bir OSX kutusu alacağım. Organize olması için gerekliyse Linux kullanacağım. Korumasız AAC ve mp3 dosyalarım var. WAV veya MIDI ile uğraşmak için bonus puanları ve bunlardan MP3'e dönüştürmek için bonus puanları (eğer eşleştiklerini bilirsem daha sonra dönüştürmek veya işleri kolaylaştırırsa vaktinden önce dönüştürmek için her zaman Audacity ve LAME kullanabilirim).

Herhangi bir öneriniz var mı, yoksa Programcılara veya SO'ya gidip bunları karşılaştırmak ve yazılımı kendim yazmak için bir gereksinim listesi oluşturmak zorunda mıyım?


"Bonus puanları", bunu yapabilen herkese ödül sunacağım anlamına geliyor :-)
Josh

Eh ben sanmıyorum bir ödül sunmak için burada noktaları yok ama sen devam et istersen:P
jcolebrand

Ben de cevabı istiyorum, bu yüzden bir cevap alamazsan, sana bir ödül sunarım.
Josh,

Programcılar ve StackOverflow, yazılım geliştirme talebinde bulunmak için değil, programlama ve programcı problemleri ve araçları içindir. Böyle bir istek gönderirseniz, çok kısa bir sırayla kaldırılır, bu yüzden yapmayın.
David Ma,

1
@David ~ Ağ hakkında oldukça az şey biliyorum. Topladığınız 2k temsilcisini takdir ediyorum, ama ben bir ağ üzerinde bir modum ve genel olarak SO ve Programcılar ve 10k den fazla temsilci hakkında her şeyi biliyorum. Profillerimden herhangi birine bakın. Ama endişeyi takdir ediyorum. Sadece, "MP3 kodlu bir şarkı için bir dalga biçimini genelleştirmenin en iyi yolu nedir, böylece benzerliği belirlemek için [genetik kod] ile benzer eserler arasında eşleşebilirim" gibi soruları nasıl ifade edeceğimi biliyorum. bu çok cevaplanabilir bir soru. Olası cevaplar WAV'dir veya tüm şarkıları 64kbps'ye yeniden kodlayın ve mod8 karelerine yapıştırın.
jcolebrand

Yanıtlar:


2

Aslında oldukça zor bir algoritmik problem, ama neyse ki zaten yazılmış. MusicBrainz Picard şarkıları sese göre belirleyecek ve daha sonra ses parmak izi büyük bir veritabanına dayanarak bir isim atayacaktır.

Bir kopyayı tanımlarsa, şarkıya, sonuna eklenmiş bir numarayla orijinal adıyla aynı adı verir; böylece, sonuna eklenmiş bir numaraya sahip şarkıları kaldırarak kopyaları kolayca silebilirsiniz. Picard'ı kullanmaya başladığımdan bu yana birkaç yıl geçti, bu yüzden yinelenen kaldırma eklenmiş olabilir.

MusicBrainz Picard http://musicbrainz.org/doc/PicardTagger


Bu aracı biraz unutmuştum, ama sanırım onları bir veritabanına parmak izi vererek çalıştığını hatırlıyorum ve görünüşte iyi parmak izi olmayan yüksek bir sayıya sahip gibiyim. • Algoritmik olarak zor olan problem için, onu bir meydan okuma olarak görüyorum. MP3'leri ayrıştırma ve çeşitli bit aralıklarına karşı parmak izi için kullanabileceğim benzersiz bir dalga biçimi bulma hakkında bir şeyler öğrenmem gerekecek, ancak bu öğrenme için oldukça iyi olabilir. Aksi halde, genel olarak dünya için yararlı bir şey yapmayı öğrenmenin bir yolu olarak görüyorum. Şimdi de başka potansiyel sonuçlar da görüyorum.
jcolebrand
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.