Bir dosyanın başından ï »¿nasıl kaldırırım?

Question 1

Gedit kullanarak açtığımda iyi görünen bir CSS dosyam var , ancak PHP tarafından okunduğunda (tüm CSS dosyalarını tek bir dosyada birleştirmek için), bu CSS'nin başına şu karakterler ekleniyor: ï »¿

PHP tüm boşlukları kaldırır, dolayısıyla kodun ortasındaki rastgele bir "ï» ¿her şeyi karıştırır. Bahsettiğim gibi, dosyayı gedit'te açtığımda aslında bu karakterleri göremiyorum, bu yüzden onları çok kolay silemiyorum.

Sorunu Google'da araştırdım ve dosya kodlamasında açıkça yanlış bir şeyler var, bu da dosyaları bir dizi metin düzenleyicisi ile ftp ve rsync aracılığıyla farklı Linux / Windows sunucularına kaydırdığım için mantıklı . Yine de karakter kodlama hakkında pek bir şey bilmiyorum, bu yüzden yardım için minnettarım.

Yardımcı oluyorsa, dosya UTF-8 biçiminde kaydediliyor ve gedit onu ISO-8859-15 biçiminde kaydetmeme izin vermiyor (belge, belirtilen karakter kodlaması kullanılarak kodlanamayan bir veya daha fazla karakter içeriyor). Windows ve Linux satır sonlarıyla kaydetmeyi denedim, ancak ikisi de yardımcı olmadı.

Question 2

Senin için üç kelime:

Bayt Sırası İşareti (BOM)

Bu, ISO-8859-1'deki UTF-8 BOM'un temsilidir. Editörünüze BOM'ları kullanmamasını veya bunları çıkarmak için farklı bir düzenleyici kullanmamasını söylemelisiniz.

Ürün reçetesinin kaldırılmasını otomatikleştirmek için bu sorudaawk gösterildiği gibi kullanabilirsiniz .

Başka bir yanıtın da söylediği gibi , en iyisi PHP'nin BOM'u doğru şekilde yorumlamasıdır, bunun için şu şekilde kullanabilirsiniz mb_internal_encoding():

 <?php
   //Storing the previous encoding in case you have some other piece 
   //of code sensitive to encoding and counting on the default value.      
   $previous_encoding = mb_internal_encoding();

   //Set the encoding to UTF-8, so when reading files it ignores the BOM       
   mb_internal_encoding('UTF-8');

   //Process the CSS files...

   //Finally, return to the previous encoding
   mb_internal_encoding($previous_encoding);

   //Rest of the code...
  ?>

Question 3

Dosyanızı Notepad ++ ile açın . Gönderen Kodlama menüsünden seçmek BOM olmadan UTF-8 Dönüştür dosyayı kaydetmektedir, bu yeni dosya ile eski dosyayı değiştirin. Ve kesinlikle işe yarayacak.

Question 4

In PHP , söz konusu karakteri dahil olmayan tüm karakterleri kaldırmak için aşağıdakileri yapabilirsiniz.

$response = preg_replace('/[\x00-\x1F\x80-\xFF]/', '', $response);

Question 5

Kabuk erişimine sahip olanlar için, public_html dizininde BOM setine sahip tüm dosyaları bulmak için küçük bir komut var - bunu sunucunuzdaki doğru yolunuzla değiştirdiğinizden emin olun.

Kod:

grep -rl $'\xEF\xBB\xBF' /home/username/public_html

ve vi düzenleyiciden memnunsanız , dosyayı vi'de açın:

vi /path-to-file-name/file.php

Ve Malzeme Listesini kaldırmak için komutu girin:

set nobomb

Dosya 'yı kaydet:

wq

Question 6

BOM yalnızca bir karakter dizisidir (UTF-8 için $ EF $ BB $ BF), bu nedenle komut dosyalarını kullanarak bunları kaldırın veya editörü eklenmeyecek şekilde yapılandırın.

Gönderen UTF-8 den BOM Çıkarma :

#!/usr/bin/perl
@file=<>;
$file[0] =~ s/^\xEF\xBB\xBF//;
print(@file);

PHP'ye kolayca çevrildiğinden eminim.

Question 7

Benim için bu işe yaradı:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Bu metayı kaldırırsam, ï »¿yeniden belirir. Umarım bu birine yardımcı olur ...

Question 8

PHP bilmiyorum, bu yüzden bunun mümkün olup olmadığını bilmiyorum, ancak en iyi çözüm dosyayı başka bir kodlama yerine UTF-8 olarak okumaktır. Ürün reçetesi aslında SIFIR GENİŞLİK KIRILMAZ ALANDIR. Bu boşluktur, bu nedenle dosya doğru kodlamayla (UTF-8) okunuyorsa, BOM beyaz boşluk olarak yorumlanacak ve elde edilen CSS dosyasında yok sayılacaktır.

Ayrıca, dosyayı doğru kodlamayla okumanın bir başka avantajı da, karakterlerin yanlış yorumlanması konusunda endişelenmenize gerek olmamasıdır. Editörünüz, onu kaydetmek istediğiniz kod sayfasının ihtiyacınız olan tüm karakterleri yapmayacağını söylüyor. PHP daha sonra dosyayı yanlış kodlamayla okuyorsa, büyük olasılıkla BOM dışındaki diğer karakterler sessizce yanlış yorumlanıyor. UTF-8'i her yerde kullanın ve bu sorunlar ortadan kalkar.

Question 9

Kullanabilirsiniz

vim -e -c 'argdo set fileencoding=utf-8|set encoding=utf-8| set nobomb| wq'

Awk ile değiştirmek işe yarıyor gibi görünüyor, ancak yerinde değil.

Question 10

grep -rl $ '\ xEF \ xBB \ xBF' * | xargs vim -e -c 'argdo set fileencoding = utf-8 | kodlamayı ayarla = utf-8 | nobomb ayarla | wq '

Question 11

Bazı PHP dosyalarımda (ï »¿ï» ¿) BOM ile aynı sorunu yaşadım.

PhpStorm kullanıyorsanız , kısayol tuşunu Ayarlar -> IDE Ayarları -> Tuş Eşleme -> Ana Menü -> Dosya -> Malzeme Listesini Kaldır'da kaldırmak için ayarlayabilirsiniz.

Question 12

Notepad ++ 'da, "Kodlama" menüsünü ve ardından "BOM olmadan UTF-8 olarak Kodla" yı seçin. Sonra kaydedin.

Yığın Taşması sorusuna bakın. BOM olmadan UTF-8'de metin kaydetmek için Not Defteri nasıl yapılır? .

Question 13

Söz konusu PHP dosyasını Notepad ++ ile açın.

En üstteki Kodlama'yı tıklayın ve "BOM olmadan UTF-8'de Kodlama" yerine yalnızca "UTF-8'de Kodlama" olarak değiştirin. Sunucunuzdaki dosyayı kaydedin ve üzerine yazın.

Question 14

Aynı problem, farklı çözüm.

PHP dosyasındaki bir satır, XML başlıklarını yazdırıyordu (PHP ile aynı başlangıç / bitiş etiketlerini kullanır). Görünüşe göre bu etiketlerdeki kod, kodlamayı ayarlıyor ve PHP içinde çalıştırılıyor ve bu da garip karakterlerle sonuçlanıyor. Her iki durumda da çözüm şudur:

# Original
$xml_string = "&lt;?xml version=\"1.0\" encoding=\"UTF-8\"?&gt;";

# fixed
$xml_string = "<" . "?xml version=\"1.0\" encoding=\"UTF-8\"?" . ">";

Question 15

BOM'u UTF-8 kodlu dosyalardan kaldırmanız gerekiyorsa, önce bunlardan haberdar olan bir düzenleyiciye sahip olmanız gerekir.

Ben şahsen E Metin Editörü kullanıyorum .

Sağ altta, BOM etiketi dahil olmak üzere karakter kodlama seçenekleri vardır. Dosyanızı yükleyin, seçilmişse Bayt Sırası İşaretleyicinin seçimini kaldırın, yeniden kaydedin ve yapılmalıdır.

Alternatif metin http://oth4.com/encoding.png

E ücretsiz değildir, ancak ücretsiz bir deneme sürümü vardır ve mükemmel bir düzenleyicidir (sınırlı TextMate uyumluluğu).

Question 16

Sen açabilirsiniz PhpStorm ve dosya üzerinde sağ tıklayıp tıklayıp Kaldır BOM ...

Question 17

İşte BOM ile ilgili sorun için başka bir iyi çözüm. Bunlar iki VBScript (.vbs) komut dosyasıdır.

Biri bir dosyada ürün reçetesini bulmak ve diğeri dosyadaki lanet olası malzeme listesini ÖLDÜRMEK için. Oldukça iyi çalışıyor ve kullanımı kolay.

Bir .vbs dosyası oluşturun ve aşağıdaki kodu içine yapıştırın.

VBScript komut dosyasını yalnızca şüpheli dosyayı .vbs dosyasına sürükleyip bırakarak kullanabilirsiniz. Size bir ürün reçetesi olup olmadığını söyleyecektir.

' Heiko Jendreck - personal helpdesk & webdesign
' http://www.phw-jendreck.de
' 2010.05.10 Vers 1.0
'
' find_BOM.vbs
' ====================
' Kleines Hilfsmittel, welches das BOM finden soll
'
 Const UTF8_BOM = "ï»¿"
 Const UTF16BE_BOM = "þÿ"
 Const UTF16LE_BOM = "ÿþ"
 Const ForReading = 1
 Const ForWriting = 2
 Dim fso
 Set fso = WScript.CreateObject("Scripting.FileSystemObject")
 Dim f
 f = WScript.Arguments.Item(0)
 Dim t
 t = fso.OpenTextFile(f, ForReading).ReadAll
 If Left(t, 3) = UTF8_BOM Then
     MsgBox "UTF-8-BOM detected!"
 ElseIf Left(t, 2) = UTF16BE_BOM Then
     MsgBox "UTF-16-BOM (Big Endian) detected!"
 ElseIf Left(t, 2) = UTF16LE_BOM Then
     MsgBox "UTF-16-BOM (Little Endian) detected!"
 Else
     MsgBox "No BOM detected!"
 End If

BOM olduğunu söylerse, gidin ve aşağıdaki kodla ikinci .vbs dosyasını oluşturun ve suspicios dosyasını .vbs dosyasına sürükleyin.

' Heiko Jendreck - personal helpdesk & webdesign
' http://www.phw-jendreck.de
' 2010.05.10 Vers 1.0
'
' kill_BOM.vbs
' ====================
' Kleines Hilfmittel, welches das gefundene BOM löschen soll
'
Const UTF8_BOM = "ï»¿"
Const ForReading = 1
Const ForWriting = 2
Dim fso
Set fso = WScript.CreateObject("Scripting.FileSystemObject")
Dim f
f = WScript.Arguments.Item(0)
Dim t
t = fso.OpenTextFile(f, ForReading).ReadAll
If Left(t, 3) = UTF8_BOM Then
    fso.OpenTextFile(f, ForWriting).Write (Mid(t, 4))
    MsgBox "BOM gelöscht!"
Else
    MsgBox "Kein UTF-8-BOM vorhanden!"
End If

Kod Heiko Jendreck'ten .

Question 18

PHPStorm'da, birden çok dosya ve BOM için dosyanın başlangıcında olması gerekmiyorsa, arama yapabilir \x{FEFF}(Normal İfade) ve hiçbir şey olmadan değiştirebilirsiniz.

Question 19

Aynı sorun, ancak yalnızca bir dosyayı etkiledi, bu yüzden boş bir dosya oluşturdum, kodu orijinal dosyadan yeni dosyaya kopyalayıp / yapıştırdım ve ardından orijinal dosyayı değiştirdim. Fantezi değil ama işe yaradı.

Question 20

Tüm BOMed dosyalarını aramak için Total Commander'ı kullanın :

BOM ile UTF-8 dosyalarını aramanın zarif yolu?

Bu dosyaları Eclipse gibi uygun bir düzenleyicide (Malzeme Listesini tanıyan) açın .
Dosyanın kodlamasını ISO olarak değiştirin (sağ tıklama, özellikler).
Dosyanın başından ï »¿kesin, kaydedin
Dosyanın kodlamasını tekrar UTF-8 olarak değiştirin

... ve n ... d'yi tekrar kullanmayı düşünmeyin bile!

Question 21

Ben de aynı sorunu yaşadım. Sorun, php dosyalarımdan birinin utf-8'de olmasıydı (en önemlisi, tüm php dosyalarında bulunan yapılandırma dosyası).

Benim durumumda, benim için çalışan 2 farklı çözümüm vardı:

Öncelikle, yapılandırma dosyalarında (veya .htaccess'te) AddDefaultCharsetDirective kullanarak Apache Yapılandırmasını değiştirdim. Bu çözüm Apache'yi doğru kodlamayı kullanmaya zorlar.

AddDefaultCharset ISO-8859-1

İkinci çözüm, php dosyasının kötü kodlamasını değiştirmekti.

Question 22

Dosyaadı.css dosyanızın metnini kopyalayın.
Css dosyanızı kapatın.
Dosya adı çakışmasını önlemek için dosyaadı2.css olarak yeniden adlandırın.
MS Not Defteri veya Wordpad'de yeni bir dosya oluşturun.
Metni içine yapıştırın.
Kodlama seçeneklerinden UTF-8'i seçerek dosyaadı.css olarak kaydedin.
Dosyaadı.css dosyasını yükleyin.

Question 23

Bu benim için çalışıyor!

def removeBOMs(fileName):
     BOMs = ['ï»¿',#Bytes as CP1252 characters
    'þÿ',
    'ÿþ',
    '^@^@þÿ',
    'ÿþ^@^@',
    '+/v',
    '÷dL',
    'Ýsfs',
    'Ýsfs',
    '^Nþÿ',
    'ûî(',
    '„1•3']
     inputFile = open(fileName, 'r')
     contents = inputFile.read()
     for BOM in BOMs:
         if not BOM in contents:#no BOM in the file...
             pass
         else:
             newContents = contents.replace(BOM,'', 1)
             newFile = open(fileName, 'w')
             newFile.write(newContents)
             return None

Question 24

Kontrol edin index.php, "... charset=iso-8859-1" bulun ve yerine "... "charset=utf-8 .

Belki işe yarar.