«data-compression» etiketlenmiş sorular

5
0 ve 1 'lerden oluşan bir dizgenin ne kadarının sıkıştırılabileceği konusunda bilinen bir maksimum var mı?
Uzun zaman önce, bir tür profesörün gelecekte sadece iki bite (veya bunun gibi bir şey) verilerini sıkıştırabileceğimizi söylediği bir gazete makalesini okudum. Bu elbette doğru değil (ve tam olarak ne söylediğine dair hafızamın doğru olmadığı olabilir). Anlaşılır bir şekilde 0 ve 1 'lerden oluşan herhangi bir diziyi sadece iki bite …

7
PRNG'ler eşyaları sihirli bir şekilde sıkıştırmak için kullanılabilir mi?
Bu fikir, programlamayı öğrenen bir çocuk olarak ve ilk olarak PRNG'lerle karşılaştığımda ortaya çıktı. Ne kadar gerçekçi olduğunu hala bilmiyorum, ama şimdi yığın değişimi var. İşte şaşırtıcı bir sıkıştırma algoritması için 14 yaşında bir şema: Bir PRNG alın ve suzun bir sahte rastgele bayt dizisi elde etmek için tohumla birlikte …

6
Kayıpsız sıkıştırma algoritmaları entropiyi azaltır mı?
Wikipedia'ya göre : Shannon'un entropisi, bir mesajda yer alan bilgileri, mesajın belirlenen (veya tahmin edilebilir) kısmının aksine ölçmektedir. İkincisinin örnekleri, dil yapısındaki fazlalığı veya harf veya kelime çiftlerinin, üçüzlerin ve benzerlerinin oluşum sıklıklarına ilişkin istatistiksel özellikleri içerir. Bu yüzden entropi bir mesajda yer alan bilgi miktarının bir ölçüsüdür. Entropi kodlayıcıları, …

4
Belirli bir boyuttaki tüm izomorfik olmayan grafikleri numaralandır
boyutundaki tüm yönlendirilmemiş grafikleri numaralandırmak istiyorum nnn, ancak her izomorfizm sınıfının yalnızca bir örneğine ihtiyacım var . Başka bir deyişle, izomorfik olmayan (yönlendirilmemiş) tüm grafikleri nnn köşelerinde sıralamak istiyorum. Bunu nasıl yapabilirim? Daha kesin bir ifadeyle, bir yönsüz grafikler bir dizi üretecektir bir algoritma isteyen , aşağıdaki özelliği ile: Her …


11
Von Neumann'ın günah alıntılarındaki rastgeleliği artık geçerli değil mi?
Bazı adamlar şöyle dedi: Deterministik yöntemlerle rasgele sayılar üretmeye çalışan herkes, elbette bir günah durumunda yaşamaktadır. Bu her zaman yalnızca bir bilgisayarla gerçek rasgele sayılar üretemeyeceğiniz anlamına gelir. Bilgisayarların tek bir Intel 8080 mikroişlemcinin (~ 6000 vana) eşdeğer büyüklüğünde olduğunu söyledi. Bilgisayarlar daha karmaşık hale geldi ve von Von Neumann'ın …

5
Asal sayıları kullanarak veri sıkıştırma
Geçenlerde aşağıdaki ilginç yazı tökezledi rastgele veri setlerini, verilerin türüne ve biçimine bakılmaksızın her zaman% 50'den daha verimli bir şekilde sıkıştırdığını iddia . Temel olarak, asal sayıları, her sayının kendine has bir asal ürün olduğu düşünüldüğünde, kolayca çözülmesi kolay olan 4-bayt veri topaklarının bir gösterimini oluşturmak için kullanır. Bu dizileri …

3
Kolmogorov karmaşıklığına yaklaşmak
Kolmogorov Karmaşıklığı hakkında bir şeyler okudum, Vitanyi ve Li'den bazı makaleler ve kitaplar okudum ve Yazarların stilometrisini doğrulamak için Normalize Sıkıştırma Mesafesi kavramını kullandım (her bir yazarın bazı metinleri ve grup belgelerini benzerliklerine göre nasıl yazdığını belirleyin). Bu durumda, veri kompresörleri bir Kolingogo makinesi olarak kullanılabileceğinden, Kolmogorov karmaşıklığını yaklaşık olarak …

7
Birçok benzer PNG görüntüsünün bu (kayıpsız) sıkıştırma yöntemleri neden etkisiz?
Az önce şu şeyle karşılaştım: Bir png görüntüsünün birden çok özdeş kopyasını bir klasöre koydum ve sonra bu klasörü aşağıdaki yöntemlerle sıkıştırmaya çalıştım: tar czf folder.tar.gz folder/ tar cf folder.tar folder/ && xz --stdout folder.tar > folder.tar.xz (bu özdeş görüntüler için iyi çalışır, ancak benzer görüntüler için kazanç sıfırdır) zip …

1
Alan adlarının sıkıştırılması
Bir kişinin rastgele bir IDN ana bilgisayar adının ( RFC5890 tarafından tanımlandığı gibi ) etki alanını nasıl çok sıkı bir şekilde sıkıştırabileceğini ve bunun ilginç bir meydan okuma olabileceğinden şüpheleniyorum. Bir Unicode ana bilgisayar veya etki alanı adı (U-etiketi), genellikle üst düzey etki alanına (ör. Altındaki Yunanca harfler ) bağlı …


7
Rastgele takımsız oyun kartı verileri entropi kodlama deposuna yaklaşmak, eşleştirmek ve hatta yenmek için sıkıştırılabilir mi? Öyleyse nasıl?
Simüle edilmiş bir kart oyunu için kullandığım gerçek verilerim var. Ben sadece kartların saflarıyla ilgileniyorum, takım elbise ile değil. Ancak standart kart destesidir, bu yüzden destede her bir rütbeden sadece vardır . Güverte her el için iyi karıştırılır ve sonra tüm güverteyi bir dosyaya gönderirim. Dolayısıyla , çıktı dosyasında olan …

4
Veriler Shannon veri sıkıştırma sınırından daha küçük bir boyuta sıkıştırılabilir mi?
Veri sıkıştırma algoritmaları ve veri sıkıştırma için teorik sınır hakkında okuyordum. Son zamanlarda "Kombinatoryal Entropi Kodlaması" adlı bir sıkıştırma yöntemiyle karşılaştım, bu yöntemin ana fikri, dosyayı dosyada sunulan karakterler, frekansları ve dosya tarafından temsil edilen bu karakter permütasyonunun dizini olarak kodlamaktır. Bu belgeler bu yöntemin açıklanmasına yardımcı olabilir: https://arxiv.org/pdf/1703.08127 http://www-video.eecs.berkeley.edu/papers/vdai/dcc2003.pdf …

1
Sıkıştırma oranı neden bir “a” dizisi için bzip2'yi kullanıyor?
library(ggplot2) compress <- function(str) { length(memCompress(paste(rep("a", str), collapse=""), type="bzip2")) / nchar(paste(rep("a", str), collapse="")) } cr <- data.frame(i = 1:10000, r = sapply(1:10000, compress)) ggplot(cr[cr$i>=5000 & cr$i<=10000,], aes(x=i, y=r)) + geom_line() Sıkıştırma oranı "a" için 37'de başlar ve 39 "a" s'de başabaşa vurur (sıkıştırma oranı = 1). Grafik oldukça pürüzsüz başlar …

2
Huffman Kodlamasının Aritmetik kodlamaya bir genellemesi var mı?
Huffman Kodlaması, Aritmetik Kodlama ve Aralık Kodlaması arasındaki ilişkileri anlamaya çalışırken, Huffman kodlamasının eksikliklerinin kesirli bit paketleme sorunuyla ilgili olduğunu düşünmeye başladım . Yani, bir sembol için 240 olası değere sahip olduğunuzu ve bunu bitlere kodlamanız gerektiğini varsayalım, "tam" 8'e ihtiyacınız olmasa bile, sembol başına 8 bit ile sıkışmış olacaksınız, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.