Aksanlı karakter sorunu


0

UTF-8'de kodlanmış bir sürü web sitem var. Vurgular ve tuhaf olanları üzerlerindeki dalgalı çizgiler ve her türlü eğlenceli şeyler içerir.

Onları herhangi bir metin düzenleyicide açmaya çalıştığımda, karakter kodlaması UTF-8'e ayarlanmış Notepad ++ bile olsa garip karakterler elde ederim.

Tarayıcımda:

görüntü tanımını buraya girin

Metin editöründe:

görüntü tanımını buraya girin

Biri burada neler olduğunu açıklayabilir mi?

Yanıtlar:


1

HTML, harfleri ve yabancı dillerde kullanılan diğer karakterleri takip eden varlıkları kullanır . Bir göz atın ve o "ó"karakterin olduğunu göreceksiniz "ó".

Ve bu tarayıcılarda UTF-8 ve Karakter Kodlaması hakkında iyi bir makale:

Başlangıçta, ASCII vardı ve işler basitti. Fakat onlar iyi değildi, çünkü kimse Kirilce ya da Tayca dilinde yazamıyordu. Böylece, ASCII'nin ifade edebileceği karakterleri genişleterek sorunu çözmek için karakter kodlamaları çoğaldı. Karakter kodlama geçmişinin saçma olarak basitleştirilmiş bir sürümü, şimdi etrafta dolaşan birçok karakter kodlaması olduğunu gösteriyor.

Bir karakter kodlaması, bilgisayara ham sıfırları ve gerçek karakterleri nasıl yorumlayacağını söyler. Bunu genellikle sayıları karakterlerle eşleştirerek yapar.


1

Sayfa, karakter referansları olan varlık referansları (eski terim) veya adlandırılmış karakter referansları (HTML5 terim) kullanılarak yazılmıştır. UTF-8 kodlu bir sayfada, örneğin “ó” kullanabilirsiniz, ancak bunun gibi bir referans óda geçerlidir ve çeşitli nedenlerle sayfa yazarları / geliştiricileri tarafından tercih edilebilir (örneğin, “ó” nasıl yazıldığını bilmeden) ). Çoğu zaman, varlıkların kullanımı, tarayıcılarda UTF-8'e yaygın destek vermeden önce bir zamanlar gerekli olan (1990'larda) eski uygulamalardan sadece bir tanesidir.

Gösterim ó, HTML kaynak kodunu daha az okunabilir hale getirmesine rağmen kullanımı tamamen güvenlidir. Örneğin, bir kullanıcı metni kopyalayıp yapıştırırsa “ó” alır, çünkü óyalnızca HTML kaynağında bulunur; bir tarayıcının HTML ayrıştırıcısı tarafından dahili olarak “ó” ya dönüştürülür.

Ancak, bazı referanslar güvensiz. Genel olarak, HTML 4.01'de tanımlanan varlıklar güvenlidir. (Bazıları dolayı her zaman yazı sorunlara düzgün işlenmez karakterleri anlamlara gelebilir, ancak bu tür problemler oldukça bağımsız karakteri kendisi karşı bir varlığın kullanım mevcuttur.) Çok daha büyük bir kümesi vardır HTML5 adlı karakter referansları , ve eski tarayıcı sürümleri genellikle uzantılara destek vermez.

Örneğin, ōdesteklenebilir veya olmayabilir. Destekleniyorsa, “ō” olarak gösterilir (o macron ile); desteklenmiyorsa (örneğin, IE 9 ve daha üstü), tam anlamıyla oluşturulur. Bu yüzden karakterin kendisini veya sayısal referansı kullanmak çok daha güvenlidir ō.


1

Onları herhangi bir metin düzenleyicide açmaya çalıştığımda garip karakterler alıyorum

importación

Bunlar HTML Özel Varlık Kodlarıdır .

ó Akut aksanı olan bir "küçük harf" o "için özel karakter gösterimidir.

Sen tam listesini görebilirsiniz HTML Özel Varlık Kodları de HTML Kodları Tablo .


HTML Varlıkları ve / veya ISO Latin-1 kodları, normal klavye komutlarıyla HTML'de üretilemeyen özel karakterler ve semboller üretmek için diğer alfasayısal karakterler gibi kaynak kodlara yerleştirilebilir.

Mesela, Düsseldorf'ı tanıtmak için HTML kaynağını okumalısınız.

Düsseldorf or Düsseldorf

Kaynak HTML: Özel Karakterler


Bu açıklama için çok teşekkür ederim. Çok yararlı. Yani burada hiçbir hata yoktur ve bu benim HTML kodumda doğru görüntülenecek, ben sadece aptalım. Thanks :)
Simon Kiely
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.