Bu yazıda bazı cevaplar gördüm ve tamamlanmış temel bilgi olarak kabul edilebilir, çünkü aynı sorunu çözmek için C # Programlama'da birkaç yaklaşım var. Dikkate alınması gereken tek şey, Saf UTF-8 ve BOM ile UTF-8 arasındaki fark hakkında .
Geçen hafta, işimde, BOM ile CSV dosyalarını ve saf UTF-8 (BOM olmadan) diğer CSV'leri çıkaran bir işlevsellik geliştirmem gerekiyor, her CSV dosyası Kodlama türü farklı standart olmayan API'ler tarafından kullanılacak API, BOM ile UTF-8 ve BOM olmadan okunan diğer API'yı okur. Okumayı, bu kavram hakkında referanslar konusunda araştırma yapmak isteyen " BOM olmadan UTF-8 ve UTF-8 arasındaki fark nedir? " Yığın taşması tartışma ve bu Wikipedia linki " Bayt sırası işareti " yaklaşımım inşa etmek.
Son olarak, her iki UTF-8 kodlama türü (BOM ve saf) için C # Programlama aşağıdaki örnek gibi benzer olması gerekiyordu:
//for UTF-8 with B.O.M., equals shared by Zanoni (at top)
string result = System.Text.Encoding.UTF8.GetString(byteArray);
//for Pure UTF-8 (without B.O.M.)
string result = (new UTF8Encoding(false)).GetString(byteArray);