Tasarım için, nasıl göründüğünü test etmek için ünlü "Lorem ipsum" metnimiz var.
Aradığım şey, metin dosyalarını okurken karakter kodlamayla ilgili bazı yöntemleri test etmek için JUnit testlerimde kullanabileceğim, birkaç farklı kodlama ile kodlanmış Metin içeren bir dizi dosya.
Misal:Bir Having ISO 8859-1
kodlanmış test dosyası ve bir Windows-1252
kodlanmış test dosyası. Windows-1252, 80 16 - 9F 16 bölgesindeki farklılıkları tetiklemelidir . Başka bir deyişle, ISO 8859-1'den ayırt edilebilmesi için bu bölgenin en az bir karakterini içermesi gerekir.
Belki de en iyi test dosyaları seti, her kodlama için test dosyasının tüm karakterlerini bir kez içerdiği yerdir. Ama belki bir şeyin farkında değilim - hepimiz bu kodlama işini seviyoruz, değil mi? :-)
Orada karakter kodlama sorunları için bir dizi test dosyası var mı?