Hangisi daha etkilidir: Birden çok MySQL tablosu veya bir büyük tablo?

Question 1

MySQL veritabanımda çeşitli kullanıcı bilgilerini saklıyorum. Başlangıçta çeşitli tablolarda kurulmuştu, yani verilerin UserIds ile bağlantılı olduğu ve verileri gerektiği gibi görüntülemek ve işlemek için bazen karmaşık çağrılar yoluyla çıktı olarak verildi. Yeni bir sistem kurmak, tüm bu tabloları büyük bir ilgili içerik tablosunda birleştirmek neredeyse mantıklı.

Bu bir yardım mı yoksa engel mi olacak?
Arama, güncelleme veya arama / manipülasyonda hız faktörleri?

İşte tablo yapılarımdan bazılarının bir örneği:

kullanıcılar - Kullanıcı Kimliği, kullanıcı adı, e-posta, şifreli parola, kayıt tarihi, ip
user_details - çerez verileri, adı, adresi, iletişim bilgileri, bağlılık, demografik veriler
user_activity - katkılar, son çevrimiçi, son görüntüleme
user_settings - profil görüntüleme ayarları
user_interests - reklamcılık hedeflenebilir değişkenleri
user_levels - erişim hakları
user_stats - isabetler, sayımlar

Düzenleme: Şimdiye kadar tüm cevapları yükselttim, hepsinin esasen sorumu cevaplayan unsurları var.

Tabloların çoğu 1: 1 ilişkisine sahiptir, bu da onları normalleştirmenin ana nedenidir.

Bu hücrelerin büyük bir kısmının boş kalması muhtemelken tablo 100'den fazla sütuna yayılırsa sorunlar olacak mı?

Question 2

Birden çok tablo aşağıdaki şekillerde / durumlarda yardımcı olur:

(a) farklı kişiler farklı masalar içeren uygulamalar geliştirecekse, bunları bölmek mantıklıdır.

(b) Veri toplamanın farklı bölümleri için farklı kişilere farklı türden yetkiler vermek istiyorsanız, bunları bölmek daha uygun olabilir. (Elbette, görüşleri tanımlamaya ve bunlara uygun şekilde yetki vermeye bakabilirsiniz).

(c) Verileri farklı yerlere taşımak için, özellikle geliştirme sırasında, daha küçük dosya boyutlarıyla sonuçlanan tabloların kullanılması mantıklı olabilir.

(d) Daha küçük ayak izi, tek bir varlığın belirli veri koleksiyonuna ilişkin uygulamalar geliştirirken rahatlık sağlayabilir.

(e) Bu bir olasılıktır: tek bir değer verisi olarak düşündüğünüz şey, gelecekte gerçekten birden çok değer haline gelebilir. Örneğin, kredi limiti şu an için tek bir değer alanıdır. Ancak yarın, değerleri değiştirmeye karar verebilirsiniz (başlangıç tarihi, bitiş tarihi, kredi değeri). Bölünmüş tablolar artık kullanışlı olabilir.

Benim oyum, veriler uygun şekilde bölünmüş olarak birden çok tablo için olacaktır.

İyi şanslar.

Question 3

Tabloları birleştirmeye denormalizasyon denir.

JOINBir bakım cehennemi yaratma pahasına daha hızlı çalıştırmak için (çok sayıda sorgu yapan) bazı sorguların yapılmasına yardımcı olabilir (veya olmayabilir) .

MySQLJOINyani sadece yöntemi kullanabilme yeteneğine sahiptir NESTED LOOPS.

Bu, sürüş tablosundaki her kayıt için MySQL, sürülen tablodaki bir döngüdeki eşleşen bir kaydı bulduğu anlamına gelir .

Bir kaydın bulunması oldukça maliyetli bir işlemdir ve saf kayıt taraması kadar uzun bir süre sürebilir.

Tüm kayıtlarınızı tek bir tabloya taşımak bu işlemden kurtulmanıza yardımcı olur, ancak tablonun kendisi büyür ve tablo taraması daha uzun sürer.

Diğer tablolarda çok sayıda kaydınız varsa, tablo taramasındaki artış, sıralı olarak taranan kayıtların faydalarını fazla ağırlaştırabilir.

Öte yandan bakım cehennemi garantilidir.

Question 4

Hepsi 1: 1 ilişkiler mi? Demek istediğim, bir kullanıcı, örneğin, farklı kullanıcı seviyelerine aitse veya kullanıcıların ilgi alanları, kullanıcı ilgi alanları tablosunda birkaç kayıt olarak temsil ediliyorsa, o zaman bu tabloların birleştirilmesi hemen söz konusu olamaz.

Normalleştirme ile ilgili önceki cevaplarla ilgili olarak, veritabanı normalleştirme kurallarının performansı tamamen göz ardı ettiği ve sadece düzgün bir veritabanı tasarımının ne olduğuna baktığı söylenmelidir. Genellikle başarmak istediğiniz şey budur, ancak performans arayışında aktif olarak denormalize etmenin mantıklı olduğu zamanlar vardır.

Sonuç olarak, sorunun tablolarda kaç alan olduğuna ve bunlara ne sıklıkla erişildiğine bağlı olduğunu söyleyebilirim. Kullanıcı aktivitesi genellikle çok ilginç değilse, performans ve bakım nedenleriyle her zaman aynı kayıtta tutulması bir sıkıntı olabilir . Örneğin ayarlar gibi bazı verilere çok sık erişiliyorsa, ancak çok fazla alan içeriyorsa, tabloları birleştirmek de uygun olmayabilir. Yalnızca performans kazancıyla ilgileniyorsanız, ayarları ayrı tutmak, ancak bunları kendi oturum değişkenlerine kaydetmek gibi başka yaklaşımları da düşünebilirsiniz, böylece veritabanını onlar için çok sık sorgulamanıza gerek kalmaz.

Question 5

Do bütün bu tabloları var 1-to-1ilişki? Örneğin, her kullanıcı satırında user_statsveya içinde yalnızca bir karşılık gelen satır olacak mı user_levels? Eğer öyleyse, bunları tek bir masada birleştirmek mantıklı olabilir. İlişki yine de değilse 1 to 1 , muhtemelen onları birleştirmek (normalden çıkarmak) mantıklı olmaz.

Bunları tek bir tabloya karşılık ayrı tablolarda bulundurmak, yüz binlerce veya milyonlarca kullanıcı kaydınız yoksa muhtemelen performans üzerinde çok az etkiye sahip olacaktır. Elde edeceğiniz tek gerçek kazanç, sorgularınızı birleştirerek basitleştirmektir.

ETA:

Senin Eğer endişe sahip olmakla ilgilidir çok fazla sütun , sonra düşünmek genellikle birlikte kullanmak ve bu birleştirmek Bunlar ne (gerekirse veya birkaç ayrı tablolar) ayrı bir tabloda kalanını bırakarak.

Verileri kullanma şeklinize bakarsanız, tahminimce sorgularınızın% 80'i gibi bir şeyin bu verilerin% 20'sini, kalan% 80'inin ise yalnızca ara sıra kullanıldığını göreceksiniz. Sık kullanılan% 20'yi tek bir masada birleştirin ve genellikle kullanmadığınız% 80'i ayrı tablolarda bırakın ve muhtemelen iyi bir uzlaşmaya sahip olacaksınız.

Question 6

Büyük bir tablo oluşturmak ilişkisel veritabanı ilkelerine aykırıdır. Hepsini tek bir masada birleştirmezdim. Birden fazla tekrarlanan veri örneği alacaksınız. Örneğin, kullanıcınızın üç ilgi alanı varsa, yalnızca üç farklı ilgi alanını depolamak için aynı kullanıcı verilerini içeren 3 satırınız olacaktır. Kesinlikle çoklu 'normalleştirilmiş' tablo yaklaşımını tercih edin. Veritabanı normalizasyonu için bu Wiki sayfasına bakın .

Düzenleme: Sorunuzu güncellediğiniz için cevabımı güncelledim ... İlk cevabıma şimdi daha çok katılıyorum ...

bu hücrelerin büyük bir kısmı muhtemelen boş kalacaktır

Örneğin, bir kullanıcının herhangi bir ilgi alanı yoksa, normalleştirirseniz, o kullanıcı için ilgi tablosunda basit bir satırınız olmayacaktır. Eğer her şey tek bir büyük tabloda varsa, o zaman sadece NULL içeren sütunlara (ve görünüşe göre birçoğuna) sahip olacaksınız.

Tonlarca tablonun olduğu bir telefon şirketi için çalıştım, veri almak birçok katılım gerektirebilir. Bu tablolardan okuma performansı kritik olduğunda, o zaman raporların işaret edebileceği birleştirme, hesaplama vb. Gerektirmeyen düz bir tablo (yani normalleştirilmiş bir tablo) oluşturabilecek prosedürler oluşturulur. Bunlar, daha sonra işi belirli aralıklarla çalıştırmak için bir SQL sunucu aracısı ile birlikte kullanıldığında (yani, bazı istatistiklerin haftalık görünümü haftada bir çalışır vb.).

Question 7

Neden herkesin sahip olduğu temel kullanıcı bilgilerini içeren bir kullanıcı tablosuna sahip olarak ve ardından temelde kullanıcı kimliğiyle ilişkili herhangi bir anahtar, değer çifti olabilecek bir "user_meta" tablosu ekleyerek Wordpress'in yaptığı aynı yaklaşımı kullanmıyorsunuz? Dolayısıyla, kullanıcı için tüm meta bilgilerini bulmanız gerekiyorsa, bunu sorgunuza ekleyebilirsiniz. Ayrıca, oturum açma gibi şeyler için gerekmiyorsa, her zaman fazladan sorgu eklemek zorunda kalmazsınız. Bu yaklaşımın avantajı, tablonuzu kullanıcılarınıza twitter tutamaçlarını veya her bir ilgi alanını saklama gibi yeni özellikler eklemeye açık bırakır. Ayrıca, ilişkili kimliklerden oluşan bir labirentle uğraşmak zorunda kalmayacaksınız çünkü tüm meta verileri yöneten bir tablonuz var ve bunu 50 yerine yalnızca bir ilişkilendirmeyle sınırlayacaksınız.

Wordpress, özelliklerin eklentiler aracılığıyla eklenmesine izin vermek için bunu özellikle yapar, bu nedenle projenizin daha ölçeklenebilir olmasına izin verir ve yeni bir özellik eklemeniz gerekirse tam bir veritabanı revizyonu gerektirmez.

Question 8

Sanırım bu "duruma göre değişir" durumlarından biri. Birden fazla masaya sahip olmak daha temiz ve muhtemelen teorik olarak daha iyidir. Ancak tek bir kullanıcı hakkında bilgi almak için 6-7 masaya katılmanız gerektiğinde, bu yaklaşımı yeniden düşünmeye başlayabilirsiniz.

Question 9

Diğer tabloların gerçekte ne anlama geldiğine bağlı olduğunu söyleyebilirim. Bir user_details, 1'den fazla kullanıcı / kullanıcı içeriyor mu vb. İhtiyaçlarınıza en uygun normalleştirme seviyesi, taleplerinize bağlıdır.

İyi indeksi olan bir tablonuz varsa, bu muhtemelen daha hızlı olacaktır. Ancak öte yandan bakımı muhtemelen daha zordur.

Bana göre User_Details muhtemelen Kullanıcılar ile 1'e 1 ilişki olduğu için atlayabilirsiniz. Ancak geri kalanı muhtemelen kullanıcı başına çok sayıda satırdır?