Çok detaylı soru için şimdiden özür dilerim. Sorunu yeniden oluşturmak için tam bir veri kümesi oluşturmak için sorgular dahil ettik ve 32 çekirdekli bir makinede SQL Server 2012 çalıştırıyorum. Ancak bunun SQL Server 2012'ye özgü olduğunu sanmıyorum ve bu belirli örnek için 10'luk bir MAXDOP zorladım.
Aynı bölüm şeması kullanılarak bölümlenmiş iki tablom var. Bölümleme için kullanılan sütunda bir araya getirilirken, SQL Server'ın paralel bir birleştirme birleşimini beklendiği kadar optimize edemediğini ve bunun yerine HASH JOIN kullanmayı seçtiğini fark ettim. Bu özel durumda, sorguyu bölüm işlevine göre 10 ayrık aralığa bölerek ve bu sorguların her birini SSMS'de aynı anda çalıştırarak, daha uygun bir paralel MERGE JOIN'i elle simüle edebiliyorum. Hepsini aynı anda çalıştırmak için WAITFOR kullanılması, sonuçta tüm sorguların orijinal paralel HASH JOIN tarafından kullanılan toplam sürenin ~% 40'ını tamamlıyor.
Eşit olarak bölümlenmiş tablolar durumunda SQL Server'ın bu optimizasyonu kendi başına yapması için bir yol var mı? MERGE BİRLEŞTİRMESİNİ paralel hale getirmek için SQL Server'ın genellikle çok fazla masrafa maruz kalacağını anlıyorum, ancak bu durumda en az ek yükü olan çok doğal bir kesme yöntemi var gibi görünüyor. Belki de, optimize edicinin henüz tanıyacak kadar zeki olmadığı özel bir durumdur?
Bu sorunu yeniden oluşturmak için basitleştirilmiş bir veri seti oluşturacak SQL:
/* Create the first test data table */
CREATE TABLE test_transaction_properties
( transactionID INT NOT NULL IDENTITY(1,1)
, prop1 INT NULL
, prop2 FLOAT NULL
)
/* Populate table with pseudo-random data (the specific data doesn't matter too much for this example) */
;WITH E1(N) AS (
SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
)
, E2(N) AS (SELECT 1 FROM E1 a CROSS JOIN E1 b)
, E4(N) AS (SELECT 1 FROM E2 a CROSS JOIN E2 b)
, E8(N) AS (SELECT 1 FROM E4 a CROSS JOIN E4 b)
INSERT INTO test_transaction_properties WITH (TABLOCK) (prop1, prop2)
SELECT TOP 10000000 (ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) % 5) + 1 AS prop1
, ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) * rand() AS prop2
FROM E8
/* Create the second test data table */
CREATE TABLE test_transaction_item_detail
( transactionID INT NOT NULL
, productID INT NOT NULL
, sales FLOAT NULL
, units INT NULL
)
/* Populate the second table such that each transaction has one or more items
(again, the specific data doesn't matter too much for this example) */
INSERT INTO test_transaction_item_detail WITH (TABLOCK) (transactionID, productID, sales, units)
SELECT t.transactionID, p.productID, 100 AS sales, 1 AS units
FROM test_transaction_properties t
JOIN (
SELECT 1 as productRank, 1 as productId
UNION ALL SELECT 2 as productRank, 12 as productId
UNION ALL SELECT 3 as productRank, 123 as productId
UNION ALL SELECT 4 as productRank, 1234 as productId
UNION ALL SELECT 5 as productRank, 12345 as productId
) p
ON p.productRank <= t.prop1
/* Divides the transactions evenly into 10 partitions */
CREATE PARTITION FUNCTION [pf_test_transactionId] (INT)
AS RANGE RIGHT
FOR VALUES
(1,1000001,2000001,3000001,4000001,5000001,6000001,7000001,8000001,9000001)
CREATE PARTITION SCHEME [ps_test_transactionId]
AS PARTITION [pf_test_transactionId]
ALL TO ( [PRIMARY] )
/* Apply the same partition scheme to both test data tables */
ALTER TABLE test_transaction_properties
ADD CONSTRAINT PK_test_transaction_properties
PRIMARY KEY (transactionID)
ON ps_test_transactionId (transactionID)
ALTER TABLE test_transaction_item_detail
ADD CONSTRAINT PK_test_transaction_item_detail
PRIMARY KEY (transactionID, productID)
ON ps_test_transactionId (transactionID)
Şimdi nihayet alt-optimal sorguyu yeniden oluşturmaya hazırız!
/* This query produces a HASH JOIN using 20 threads without the MAXDOP hint,
and the same behavior holds in that case.
For simplicity here, I have limited it to 10 threads. */
SELECT COUNT(*)
FROM test_transaction_item_detail i
JOIN test_transaction_properties t
ON t.transactionID = i.transactionID
OPTION (MAXDOP 10)
Bununla birlikte, her bir bölümü işlemek için tek bir iplik kullanmak (aşağıdaki birinci bölüm için örnek) çok daha verimli bir plana yol açacaktır. Bunu tam olarak aynı anda 10 bölümün her biri için aşağıdakine benzer bir sorgu çalıştırarak test ettim ve 10'un tamamı 1 saniyede bitti:
SELECT COUNT(*)
FROM test_transaction_item_detail i
INNER MERGE JOIN test_transaction_properties t
ON t.transactionID = i.transactionID
WHERE t.transactionID BETWEEN 1 AND 1000000
OPTION (MAXDOP 1)