DOCX Formatının DOC'a Göre Avantajları


9

Bugün yanlışlıkla .docx'in aynı .zip olduğunu (veya aralarında büyük bir fark olmadığını) öğrendim. .Docx dosyasını .zip olarak değiştirip WinRAR ile açtığınızda, klasörlerde bir grup XML dosyası görürsünüz. Bu XML dosyasında metin, yazı tipleri, sahip, son değiştirilme vb. Saklanır. Tek kelimeyle tüm bilgiler bir XML verisi olarak saklanmaktadır.

Ancak aynı .doc uzantı dosyaları için doğru değildir. Bunları .rar olarak .rar olarak açmak imkansızdır.

Öyleyse soru: Microsoft'un veri depolama şeklini değiştirdiği .docx verilerini XML'de depolamanın avantajı nedir? Aslında, XML biçiminin avantajını değil, Microsoft'un neden .docx verilerini depolamak için birden fazla XML dosyası kullandığını bilmek istiyorum. Bu, .docx'in kökte yeni bir biçim olmadığını gösterir.


1 Dakika içinde .. 5 neredeyse aynı cevaplar. SO Gücü.
MRG

1
Verilerin XML biçiminde olması, yeni biçim olmadığı anlamına gelmez. Bu XML'i OpenOffice'e besleyemez ve doğru şekilde oluşturmasını sağlayamazsınız. XML yapısının, hangi niteliklerin, hangi öğelerin vb.

1
Başlığı daha bilgilendirici bir şeye değiştirmeyi düşünün.
Carl Bergquist

2
Tabii ki bu yeni bir biçim. Şimdi hadi.

Sevgili Janis Veinbergs ve Kyle Rozendo XML ve XSD ile birçok kez çalıştım ve nasıl çalıştığını biliyorum !!! Dikkatli olun "kök" dedi. Yeni bir biçim değil, sadece kullanılan XML biçimi olduğunu kabul edemez !!!!
Narek

Yanıtlar:


12

Bir .docxdosya, yalnızca XML dosyalarını değil, görüntü dosyaları gibi gömülü kaynakları da depolayabilir. Base64 veya bir şeydeki şeyleri kodlamak ve bir XML dosyası içinde saklamak veya başka bir ikili serileştirme formatı icat etmek yerine, standart ZIP formatıyla gitmeye karar verdiler.

Bunun yanı sıra XML, çok sayıda gereksiz desen içeren çok ayrıntılı bir dosya biçimidir. XML dosyaları için yüksek bir sıkıştırma oranı elde edebilirsiniz.

Bu arada, "bizi kandırmak" bölümünü gerçekten anlamıyorum. Sıfırdan yeni bir şifreli dosya formatı icat etmek veya standart, bilinen bir format kullanmak daha mı iyi?


Gördüğüm en büyük yararı, aslında bu dosyaları oluşturmak için Açık API'ler olması, bu nedenle sıfırdan .docx dosyaları oluşturmak, özel SDK'lara çok harcama yapmadan mümkündür. Microsoft SDK, önceden hazırlanmış bir belgeyi sıfırdan oluşturmak için C # kodu oluşturacak bir belge reflektörü bile sağlar.
Eddins

@Guard: Evet. Cevabım sorunun orijinal versiyonunu ele alıyor. Soru o zamandan beri önemli ölçüde değişti;) Orijinal başlık "Microsoft kandırıyor mu?"
Mehrdad Afshari

xml kendi başına "bilinen" bir biçim oluşturmaz, .docx bunun en iyi örneklerinden biridir.
artistoex

5

Wikipedia makalesi oldukça güzel özetliyor:

"Microsoft, açık bir dosya biçimini benimseme yönünde giderek artan bir baskı altına girdi, özellikle de birkaç ülke resmi belgelerin açık bir biçimde olması gereken kuralları kabul etti."

Düzenleme: Ve XML kadar çok ayrıntılı ve doğal olarak gerçekten iyi sıkıştırır kadar sıkıştırmak bir anlam ifade ediyor.


3
"Açık", "sıkıştırılmış olabilir" anlamına gelmez.
Greg Hewgill

3
Sıkıştırmanın sıkıştırma dışında başka avantajları da vardır. Aynı zamanda birden çok dosya için bir kap görevi görür.
Joey

3

Yeniden adlandırılmış bir .zip dosyası kullanmak oldukça yaygın bir uygulamadır - örneğin Quake III .pak dosyaları gerçekten .zip dosyalarıdır. Zaten mükemmel olanları varsa kendi sıkıştırılmış dosya biçiminizi icat etmenin bir anlamı yoktur.


1
ZIP arşivlerini kullanmanın diğer örnekleri: Java .jar, Winamp .wsz/ .wal(kaplamalar), Firefox .xpi(XPInstaller - temalar, eklentiler). ( tararşivler de popülerdir.)
user1686 9:09

1

Sıkıştırılmış XML kullanan yalnızca Office Açık XML değil. Open Office'in OpenDocument'i perde arkasında aynı şeyi yapıyor.

Açık Ambalaj Sözleşmelerinin Wikipedia sayfasında listelenen birkaç avantajı vardır :

dolaylı söz

Bir logonun 1.000 kez tekrarlandığı bir katalog örneğini ele alalım. Bir dolaylı mekanizma kullanarak, logoyu değiştirmek istiyorsak, tek bir dosyada yalnızca bir girişi değiştirmemiz gerekir, arama yapılmadan, nereye bakacağımızı biliyoruz. Bu, sürdürülebilirliği önemli ölçüde artırır. Dosyalarınızın depolandığı ZIP dizinlerinin düzenini değiştirmek istiyorsanız, önemsiz bir konu haline gelir, çünkü dosyaya işaret edebilecek her öğeyi bilmenize gerek yoktur, hepsi tek bir noktadadır.

Kümeleme

Belgelerin küçük parçalara bölünmesini teşvik eder. Bu, dosya bozulmasının etkisini azaltmak için daha iyidir. Ve veri erişimi için daha iyi: örneğin, bir XML bölümündeki tüm stil bilgileri, her ayrı çalışma sayfası veya tablo kendi farklı bölümlerinde. Bu, istemciler için daha hızlı erişim ve daha az nesne oluşturma olanağı sağlar ve birden çok işlemin aynı belge üzerinde çalışmasını kolaylaştırır.

Chunking, programcılara da fayda sağlar. Bir stil sayfasını diğeriyle değiştirmek XML işlemi değil ZIP dosyası işlemi haline gelir. Ve bir programcının anlaması gereken şey miktarını azaltır, çünkü bir konudaki tüm bilgilerin o yığın içinde olduğunu varsayarak parçalara yaklaşabilirler: büyük bir dosyada çok sayıda yabancı unsurlar.

Nispi dolaylı

Açık Paketleme Kurallarında, referansı olan her dosyanın dolaylı listelerle birlikte kendi _rels dosyası vardır. Bu, bazı durumlarda bazı bilgilerin ilişkili tüm kaynaklarıyla kesilip yapıştırılmasını kolaylaştırır, dosyalar arasında ad çakışması olasılığını ortadan kaldırmak için ad kapsamı sağlar.


0

En büyük yararı, dosyayı açıp xml dosyalarından metni kopyalayarak verilerinize erişebilmenizdir. Bu, Word 2007'nin bir kopyasına sahip olmasanız bile bir zip yardımcı programı ve bir metin düzenleyici ile yapılabilir.

Biçimi eski ikili biçimlerden daha açık hale getiren budur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.