Vektörlerin nokta ürününün varyansının birim vektörlerinin tüm dağılımları üzerinde minimum nedir?


10

Bir dağıtım üzerinde bulmaya çalışıyorum n say, rasgele vektörler x1,,xn üzerinde, k boyutlu birim küre (burada n>k ) o en aza indirir maxijVar(xiTxj) kısıt tabi E[xiTxj]=0 .

Bazı dağılımları denedim ve neredeyse hepsinin 1 / k varyansı var 1/k. Örneğin, her bir x_i'nin her bir koordinatının \ left \ {- 1 / \ sqrt {k}, 1 / \ sqrt {k} \ right \} arasından xibağımsız ve eşit bir şekilde seçildiği dağılım ve her bir x_i 1 / k varyansına sahip k -boyutlu birim küredeki bağımsız tek tip vektördür .{1/k,1/k}xik1/k

Tüm dağılımlar arasında minimum varyans 1 / k1/k?


Ne kadar sıkı bir sınırla ilgileniyorsun? Yani, sadece n> 100k için çalışan 1 / 100k'lik bir alt sınır ilginç olabilir mi?
daniello

@daniello, n> ck için 1 / ck alt sınırı, c'nin sabit olduğu anlamına mı geliyor? Bunu nasıl kanıtlayabilirim?
peng

Soruda anlamadığım bir şey: başlangıçta birim vektörleri üzerinden dağıtım söylüyorsunuz , ancak birim vektörleri oluşturmaya çalıştığınızı söylediğin tüm dağılımlar değil ... Bunu tüm , ? E [ | x i | ] = 1xiE[|xi|]=1
daniello

@deniello, tüm vektörleri "birim" yapmayı amaçladım. Maalesef, "Gauss" vektörü üzerinde normalleştirme yapmayı unuttum, normalleştirmeden sonra tekdüze vektör ile aynı olacak. Bu hatayı işaret ettiğiniz için teşekkür ederiz.
peng

Yanıtlar:


8

Problemin eşdeğer fakat daha basit görünen bir formülasyonunu sunacağım ve ( n / k - 1) / ( n = 1) alt sınırını göstereceğim . Ayrıca, kuantum bilgisinde açık bir probleme bağlantı da gösteriyorum. [Revizyon 3'te düzenleme: Önceki revizyonlarda, aşağıda gösterilen alt sınırın elde edildiği vakaların kesin bir karakterizasyonunun zor olabileceğini iddia ettim çünkü karmaşık vakadaki benzer bir soru, SIC-POVM'ler hakkında açık bir problem içeriyor kuantum bilgisi. Ancak, SIC-POVM'lerle bu bağlantı yanlıştı. Ayrıntılar için, aşağıdaki “Kuantum bilgisinde SIC-POVM'lere yanlış bağlantı” bölümüne bakın.]

Eşdeğer formülasyon

İlk olarak, daniello'nun cevabında belirtildiği gibi, Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Yani cevabın geri kalanında, biz varyans unutup yerine maksimum minimize ij E [( x i T x j ) 2 ].

Daha sonra, hedefimizin maksimum ij E [( x i T x j ) 2 ] değerini en aza indirmeye karar verdiğimizde , E [ x i T x j ] = 0 kısıtlamasını göz ardı edebiliriz. birim vektörler x 1 ,…, x n , o zaman objektif fonksiyonun değerini değiştirmeden max ij E [( E [ x i T x j ] = 0'ı tatmin etme olasılığını her biri bağımsız olarak 1/2 ile ortadan kaldırabiliriz. x i T x j) 2 ].

Ayrıca, objektif fonksiyonun maks ij E [( x i T x j ) 2 ] 'den (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] olarak değiştirilmesi optimum değeri değiştirmez. İkincisi en fazla eskidir çünkü ortalama en fazla maksimuma sahiptir. Ancak, ( i , j ) ( i ≠ gibi farklı seçimler için her zaman E [( x i T x j ) 2 ] değerlerini yapabilirizj ) permutasyonu ile eşit n vektörleri x 1 , ..., x , n rasgele.

Bu nedenle, herhangi bir n ve k için , söz konusu sorunun optimum değeri minimum (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] 'ye eşittir, burada x 1 ,…, x n birim vektörleri in k cinsinden değer olarak alan rastgele değişkenlerdir .

Ancak, beklentinin doğrusallığı ile, bu objektif fonksiyon beklenen E değerine eşittir [(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 ]. Minimum değer en fazla ortalama olduğu için, artık olasılık dağılımlarını dikkate almaya gerek yoktur. Yani, yukarıdaki sorunun optimum değeri, aşağıdakilerin optimum değerine eşittir:

(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2'yi küçültmek için birim vektörleri x 1 ,…, x n ∈ ℝ k seçin .

Alt sınır

Bu eşdeğer formülasyonu kullanarak, optimal değerin en azından ( n / k - 1) / ( n −1) olduğunu kanıtlayacağız .

1≤ in için , X i = x i x i T birim vektörü x i'ye karşılık gelen sıra-1 projektör olsun . Ardından, ( x i T x j ) 2 = Tr ( X i X j ) tutar.

Let Y Σ = I x i . Sonra, ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n'yi tutar .

Cauchy-Schwarz eşitsizliği, Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k ve dolayısıyla ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 anlamına gelir / k - n . N ( n −1) 'e bölerek , objektif değerin en azından ( n / k - 1) / ( n −1) olduğunu elde ederiz .

Özellikle, n = k +1 olduğunda, daniello'nun cevabı optimal değerden 2 faktör içinde yer alır.

Bu alt sınır ne zaman elde edilebilir?

Bu alt sınıra ( n / k - 1) / ( n −1) ulaşmak, Y = ( n / k ) I yapılmasına eşdeğerdir . Ulaşılabilir olduğunda kesin karakterizasyonu bilmiyorum, ancak aşağıdaki yeterli koşullar mevcut:

  • Zaman , n = k + 1, bu göz önüne alınarak ulaşılabilir k düzenli meydana + 1 birim vektörleri k 2 / (dan iyileştirilmesi, merkezi orijinde -simplex k ( k optimum 1 / için Daniello yanıtında + 1)) k 2 .
  • Zaman n, bir katı olan k , bu ℝ ortonormal bir sabitleme açıkça ulaşılabilir k ve baz vektörlerinin her atama n / k bir hacim 1 , ..., v , n .
  • O bazı seçimi ile ulaşılabilir olup olmadığını Daha genel geçen mermi noktasından daha, k ve her iki n = n 1 ve n = n 2 , o zaman da aynı için ulaşılabilir k ve n = n 1 + n 2 . Özel olarak, bu ulaşılabilir olup olmadığını , n = bir K + b burada bir ve b sağlayan tamsayılardır birb ≥0.

Ayrıntıları kontrol etmeme rağmen, herhangi bir küresel 2 tasarımının bu alt sınıra ulaşan bir çözüm verdiği anlaşılıyor .

Kuantum bilgisinde SIC-POVM'lere yanlış bağlantı

Daha önceki revizyonlarda şunları söyledim:

Buna tamamen cevap vermenin zor bir soru olduğundan şüpheleniyorum. Bunun nedeni, karmaşık space k vektör uzayını düşünürsek , bu sorunun kuantum bilgisinde açık bir problemle ilgili olmasıdır.

Fakat bu ilişki yanlıştı. Nedenini açıklayacağım.

Daha doğrusu, aşağıdaki sorunu göz önünde bulundurun:

Küçültmek için birim vektörleri x 1 ,…, x n ∈ ℂ k seçin (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

Yukarıdaki alt sınır bu karmaşık versiyonda eşit olarak geçerlidir. Karmaşık sürümde n = k 2 olduğu durumu düşünün . Daha sonra alt sınır 1 / ( k + 1) 'e eşittir .

Şimdiye kadar, doğruydu.

Bir dizi k 2 birim vektörleri x 1 , ..., x k 2 ∈ ℂ k denen alt sınır elde SIC-POVM ebatlan k ,

Bu bölüm yanlıştı. Bir SIC-POVM bir dizi k 2 birim vektörler x 1 , ..., x n ∈ ℂ k kendisi için | x i * x j | 2 = 1 / ( k +1) tüm ij için . Gereklilik tüm çiftleri için tutmalı buraya geldiğini hatırlatırız ij , tüm çiftleri üzerinde sadece ortalama ij . “Eşdeğer formülasyon” bölümünde, maksimumu minimuma indirmek ve ortalamayı minimize etmek arasındaki denkliği gösterdik, ancak bu mümkün çünkü x 1,…, X n , birim vektörleri alan rastgele değişkenlerdir. Burada x 1 ,…, x n sadece birim vektörlerdir, bu yüzden aynı hileyi kullanamayız.


5

v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

E[xaxb]=0xaxb12

Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j} (xaxb)2=0abVar[xaxb]=E[(xaxb)2]=11(k+12)(xaxb)2=0. Böylece, her söz konusu olan , : ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

Benim sezgim bu alır gibi kötü (küçük) ama bir kanıt yok olmasıdır. Daha ilginç olan, bu yapının n >> k için ve 'nin bağımsız olarak seçilmesi gerektiğinde (muhtemelen farklı dağıtımlardan) görünmesidir .xi

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.