CNF formüllerinin rastgele ölçülmesi


12

CNF formüllerinin kabaca 2 geniş sınıfta bölümlenebileceği yaygın olarak bilinmektedir: rastgele ve yapılandırılmış. Yapılandırılmış CNF formülleri, rastgele CNF formüllerine karşıt olarak, tesadüfen gerçekleşmesi muhtemel olmayan kalıpları gösteren bir tür düzen sergiler. Bununla birlikte, bir dereceye kadar rastgelelik gösteren yapısal formüller bulunabilir (yani, belirli belirli cümle grupları diğerlerinden çok daha az yapılandırılmış görünür) ve bazı zayıf yapı biçimlerine sahip rastgele formüller (yani, belirli belirli cümle grupları diğerlerinden daha az rastgele görünür ). Dolayısıyla, bir formülün rastgele olması sadece bir evet / hayır olgusu değildir.

Let bir CNF formül verilen bir fonksiyonu F F arasında bir gerçek değer verir 0 ve 1 : dahil 0 ise, vasıtasıyla saf yapısal formül 1 vasıtasıyla saf bir rasgele formül.r:F[0,1]FF0101

Birinin böyle bir icat etmeye çalışıp çalışmadığını merak ediyorum . Tabii ki r tarafından döndürülen değer (en azından bu benim niyetimdir) sağlam bir teorik gerçeklikten ziyade bazı makul kriterlere göre pratik bir ölçüm olacaktır.rr

Birisinin tanımında veya bir formülün diğer faydalı genel özelliklerini belirlemede kullanılabilecek herhangi bir istatistiksel göstergeyi tanımlayıp tanımlayıp çalışmadığını bilmek istiyorum . İstatistiksel gösterge ile böyle bir şey kastediyorum:r

  1. HCV (Hit Varyans Sayısı)

    olsun değişken verilen bir fonksiyon v jN , kaç kez geri v j belirir F . V , F'de kullanılan değişkenler kümesi olsun . Let ˉ h F = 1hF:NNvjNvjFVFAHC (Ortalama İsabet Sayısı) olabilir. Aşağıdaki gibi, HCV tanımlanır: lHVC=1h¯F=1|V|vjVhF(vj)

    Rasgele durumlarda, HCV çok düşüktür (tüm değişkenler neredeyse aynı sayıda belirtilir), yapılandırılmış örneklerde (bazı değişkenler çok sık kullanılır ve bazıları kullanılmaz, yani "kullanım kümeleri" vardır).HVC=1|V|vjV(hF(vj)h¯F)2



  2. YARDIM (Ortalama Safsızlık Derecesi)

    Let sayısı olmak v j olumlu oluşur ve let h - F ( v j ) o negatif oluşur sayısı. Let i : N[ 0 , 1 ] bir fonksiyonu değişken verilen bu v jV , onun kimliği (Safsızlık Derecesi) döndürür. İ ( v j ) işlevi şu şekilde tanımlanır: i (hF+(vj)vjhF(vj)i:N[0,1]vjVi(vj) . Pozitif zamanların yarısında ve negatif zamanların yarısında meydana gelen bu değişkenler maksimum Safsızlık Derecesine sahipken, her zaman pozitif veya daima negatif olan bu değişkenler (yani saf değişmezler) minimum Safsızlık Derecesine sahiptir. AID basitçe şu şekilde tanımlanır: AID=1i(vj)=2min(hF+(vj),hF(vj))hF(vj)

    Rastgele örneklerde (en azından0,5değişkenli değişkenlerin reddedilmesiyle üretilenlerde), AID neredeyse1'eeşitken, yapılandırılmış örneklerde genellikle1'denuzaktır.AID=1|V|vjVi(vj)

    0.511

  3. IDV (Safsızlık Derecesi Sapması)

    IDV, farklı olasılık değişkenlerini ortadan kaldırarak üretilen rasgele örnekleri açıkladığından, yalnızca AID'den daha sağlam bir göstergedir . Şu şekilde tanımlanır: I D V = 10.5

    IDV=1|V|vjV(i(vj)AID)2

    00

Motivasyonları

  1. CNF formüllerinin nasıl çalıştığını, rastgele yararlılıklarının / yapılarının nasıl ölçülebildiğini daha iyi anlamak için, istatistiksel göstergelerine bakarak diğer yararlı genel özellikler çıkarılabilirse, bu göstergelerin aramayı hızlandırmak için kullanıp kullanamayacağı ve nasıl kullanılabileceği.
  2. Bir CNF formülünün tatmin edilebilirliğinin (hatta çözüm sayısının) sadece istatistiksel göstergelerini akıllıca manipüle ederek ortaya çıkarıp çıkartılamayacağını merak ediyorum.

Sorular

  1. Hiç kimse bir CNF formülünün rasgeleliğini ölçmenin bir yolunu önerdi mi?
  2. Hiç kimse bir CNF formülünün yararlı genel özelliklerini incelemek ve hatta mekanik olarak çıkarmak için kullanılabilecek herhangi bir istatistiksel gösterge önermiş midir?

1
bu cevaptaki makaleye bakın ( cstheory.stackexchange.com/questions/4321/… ). Size böyle bir r tanımlamak için bir ipucu verebilir
Marcos Villagra

1
muhtemelen bit dizelerinin rasgeleliğinin ölçülmesi ile ilgili tartışma mathoverflow.net/questions/37518/…
Yaroslav Bulatov

Bir süredir kendi başıma bu konu üzerinde çalıştığım için bunu size söyleyebilirim. SAT'ı düşünürseniz, 1 ve 2 için formüller üsteldir. Öte yandan k-SAT için formül 1 ve 2 için formüller polinomdur. Bu, kimsenin cevaplamak istemediği RANDOM K-SAT SORU'NUN HASSAS TANIMI ile ilgilidir.
Tayfun Pay

@Geekster: Burada bir cevap vermek ister misiniz?
Hsien-Chih Chang 張顯 之

@Geekster: "... 1 ve 2 için formüller üsteldir " ile ne demek istiyorsun ?
Giorgio Camerani

Yanıtlar:


3

"Daha az rastgele" yapıların daha simetrik olduğu için fizik sezgisini ödünç almayı öneririm. CNF için simetri, fonksiyonu değişmez tutan değişkenlerin herhangi bir dönüşümüdür. Bu ölçütlere göre;

x1x2x3.

veya,

(x1x2¬x3)(x1¬x2x3)(¬x1x2x3)(¬x1¬x2¬x3).

mesela daha az rastgele

(x1x2¬x3)(x1¬x2x3)(¬x1¬x2x3).

Genel olarak, sonlu yapılar üzerinde "rastgele" kavramını tanımlamak zordur. Tarihsel olarak, tartışmasız en basit sonlu yapılar olan ikili diziler üzerinde denenmiştir. Örneğin, sezgisel olarak, bir dizi 01010101, örneğin 01001110'dan "daha az rasgele" dir. Bununla birlikte, sonlu rasgele dizinin tutarlı bir biçimsel tanımının olmadığı hemen anlaşılmıştır ! Bu nedenle, herhangi bir sonlu yapı için bir rastgelelik ölçüsü tanımlamak için herhangi bir naif girişimden şüphelenilmelidir.


"Yapı simetrilerin varlığı, oysa rasgelelik simetrilerin olmaması anlamına gelir" sezgisine tamamen katılıyorum . Sözdizimsel simetrilere atıfta bulunuyorsunuz ( semantik simetriler ise işlevi değiştiren, ancak çözelti boşluğunu değiştirmeyenlerdir). Her zaman simetrilerin anahtar olduğuna ikna oldum.
Giorgio Camerani

1
@Walter: Simetriler fikri algoritmalardan ziyade cebirden yararlanma girişimidir: algoritmik karmaşıklık sonlu nesneler için tutarlı tanımlamaya meydan okuyan bir ölçüdür. Ama sonra bir gruba her bir öğeye karmaşıklık ölçüsü
atamalıyız
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.