«unicode» etiketlenmiş sorular

Unicode, tüm yazı sistemlerini, teknik sembolleri ve noktalama işaretlerini içeren yazılı metin için gerekli tüm karakterleri tanımlayan evrensel bir karakter seti olarak tasarlanmıştır.

20
UTF-16 zararlı olarak kabul edilmeli mi?
Muhtemelen tartışmalı bir sorunun ne olduğunu soracağım: “En popüler kodlamalardan biri olan UTF-16 zararlı olarak kabul edilmeli mi?” Bu soruyu neden soruyorum? Kaç programcı UTF-16'nın gerçekten değişken uzunluklu bir kodlama olduğunun farkında? Bununla, vekil çiftler olarak temsil edilen, birden fazla element alan kod noktaları olduğunu kastediyorum. Biliyorum; Java, String, C …
432 unicode 

5
UTF-8, milyonlarca yeni karaktere sahip geniş bir yabancı dilin kullanılmasını destekleyebilir mi?
Durumunda bir uzaylı istilası karakterlerin kendi muhtemelen büyük miktardaki için izin vermek için bir şekilde UTF-8 tasarlanmıştır oluştu ve biz mevcut bilgisayar sistemlerinin tümünde kendi dilleri desteklemek zorunda kaldılar? (Elbette, uzaylıların aslında dilleri olup olmadığını, nasıl iletişim kurduklarını, nasıl iletişim kurduklarını bilmiyoruz, ancak argüman uğruna, lütfen sadece onların yaptığını hayal …
86 unicode  utf-8 

15
Unicode karakterleri değişken isimlerinde kullanmak kötü mü? [kapalı]
Geçenlerde Pyleghon 3'e göre bir AllegSkill sıralama algoritması uygulamaya çalıştım. İşte matematiğin neye benzediği: Hayır, gerçekten. İşte o zaman yazdıklarım: t = (µw-µl)/c # those are used in e = ε/c # multiple places. σw_new = (σw**2 * (1 - (σw**2)/(c**2)*Wwin(t, e)) + γ**2)**.5 Aslında Python 3'ün kabul edilemez √ya …
82 naming  unicode 

8
Neden birden fazla Unicode kodlaması var?
Unicode'un, önceki girişimlerin çoğunda (ASCII, vb.) Küçük bir adres alanı (8 bit) nedeniyle birçok farklı kodlamanın tüm sorununu çözecek şekilde tasarlandığını düşündüm. Öyleyse neden bu kadar çok Unicode kodlaması var? UTF-8, UTF-16, vs. gibi (esasen) aynı olanın birden fazla versiyonu bile

2
UTF-8 CSV dosyalarında Malzeme Listesi (bayt sipariş işareti) bulunmalı mıdır?
İş kolu yazılımımız, kullanıcının belirli verileri CSV olarak kaydetmesini sağlar . Vahşi ortamda kullanılan pek çok farklı format (tümü "CSV") olduğundan, "varsayılan format" ın nasıl görünmesi gerektiğine karar veriyoruz. Hat / alan ayırıcıları ve kaçma ile ilgili olarak kullanabileceğimiz bir standart var: RFC 4180 . Metin kodlaması ile ilgili olarak, …

2
Unicode lisansı
Unicode Kullanım Koşulları, veri dosyalarını kullanan herhangi bir yazılımın (veya bir modifikasyonunun) Unicode lisans referanslarını taşıması gerektiğini belirtir. Bana göre çoğu Unicode kütüphanesi, bir karakterin rakam, harf, sembol vb. Olup olmadığını kontrol etme fonksiyonlarına sahiptir ve bu nedenle Unicode Veri Dosyalarının (genellikle tablo şeklinde) değiştirilmesini içerecektir. Bu, lisansın geçerli olduğu …

3
Microsoft SQL Server'da neden dizelerin önüne N koymamız gerekiyor?
T-SQL öğreniyorum. Gördüğüm örneklerden, bir varchar()hücreye metin eklemek için, sadece eklenecek dizeyi yazabiliyorum, ancak nvarchar()hücreler için her örnek dizeleri N harfiyle öneklendirdi. Aşağıdaki sorguyu nvarchar()satır içeren bir tabloda denedim ve iyi çalışıyor, bu nedenle N öneki gerekli değil: insert into [TableName] values ('Hello', 'World') Gördüğüm her örnekte neden dizeler N'ye …

8
UTF-8 (ve belki UTF-16 / UTF-32) dışındaki karakter kodlamaları kaldırılmalıdır mı?
Bir evcil hayvan eşim, karakter kümesi desteği için kod dağları bulunan birçok yazılım projesine bakıyor. Beni yanlış anlamayın, ben tamamen uyumluluk için varım ve metin editörlerinin dosyaları birden çok karakter setinde açmanıza ve kaydetmenize izin vermesinden memnunum Beni rahatsız eden şey, evrensel olmayan karakter kodlamalarının çoğalmasının “sorun” değil, “uygun Unicode …


5
İnsanların Unicode yerine Japonlara özgü kodlamaları kullanmalarına neden olan sorunlar nelerdir?
İşyerinde Shift-JIS ve diğer kodlamalarda birçok Japonca metin dosyasına rastladım. Tüm bilgisayar kullanıcıları için birçok mojibake (okunamayan karakter) sorununa neden olur . Unicode, bu tür bir sorunu tüm diller için tek bir karakter seti tanımlayarak çözmeyi amaçladı ve UTF-8 seri hale getirme işleminin İnternette kullanılması önerildi. Öyleyse neden herkes Japonca …



3
Tüm yerelleştirmeler ve dize türleri için çalışan genelleştirilmiş bir dize ters işlevi yazmak mümkün müdür?
Sadece Dev-Days'in Jon Skeet (Tony the Pony ile) sunumunu izliyordum . Her ne kadar "bir dize ters fonksiyonu yazmak" kodlama röportaj 101 olsa da - Aslında tüm yerelleştirme ve tüm dize türlerinde çalışan bir değil, genel bir dize ters fonksiyonu yazmak mümkün olduğundan emin değilim. Giriş dizesinin ascii, UTF8, UTF16 …

2
UTF-16 sabit genişlikli mi yoksa değişken genişlikli mi? UTF-8'in neden bayt sırası sorunu yok?
UTF-16 sabit genişlikli mi yoksa değişken genişlikli mi? Farklı kaynaklardan farklı sonuçlar aldım: Gönderen http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16, Unicode karakterlerini on altı bitlik yığınlarda saklar. Gönderen http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16 bit Unicode Dönüşüm Biçimi), Unicode kod alanında 0 ile 0x10FFFF arasında 1.112.064 [1] numara (kod noktası adı verilir) kodlayabilen bir karakter …

3
Kullanabileceğim bir Unicode sentinel değeri?
Bir dosya formatı tasarlıyorum ve doğru yapmak istiyorum. Bir ikili biçim olduğundan, dosyanın ilk bayt (veya bayt) gerekir değil (sadece PNG dosya başlığında gibi geçerli metinsel karakterleri oluşturmak 1 ). Bu, biçimi tanımayan araçların ilk birkaç bayta bakarak bir metin dosyası olmadığını görmelerini sağlar. Yukarıdaki herhangi bir kod noktası 0x7Fgeçersiz …
14 unicode 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.