Bu F # kodu neden bu kadar yavaş?


127

C # ve F # 'de bir Levenshtein uygulaması. C # sürümü, yaklaşık 1500 karakterlik iki dizi için 10 kat daha hızlıdır. C #: 69 ms, F # 867 ms. Neden? Anladığım kadarıyla aynı şeyi mi yapıyorlar? Bir Sürüm veya Hata Ayıklama yapısı olması fark etmez.

DÜZENLEME: Buraya özellikle Mesafe Düzenleme uygulamasını arayan biri gelirse, sorun bozulur. Çalışma kodu burada .

C # :

private static int min3(int a, int b, int c)
{
   return Math.Min(Math.Min(a, b), c);
}

public static int EditDistance(string m, string n)
{
   var d1 = new int[n.Length];
   for (int x = 0; x < d1.Length; x++) d1[x] = x;
   var d0 = new int[n.Length];
   for(int i = 1; i < m.Length; i++)
   {
      d0[0] = i;
      var ui = m[i];
      for (int j = 1; j < n.Length; j++ )
      {
         d0[j] = 1 + min3(d1[j], d0[j - 1], d1[j - 1] + (ui == n[j] ? -1 : 0));
      }
      Array.Copy(d0, d1, d1.Length);
   }
   return d0[n.Length - 1];
}

F # :

let min3(a, b, c) = min a (min b c)

let levenshtein (m:string) (n:string) =
   let d1 = Array.init n.Length id
   let d0 = Array.create n.Length 0
   for i=1 to m.Length-1 do
      d0.[0] <- i
      let ui = m.[i]
      for j=1 to n.Length-1 do
         d0.[j] <- 1 + min3(d1.[j], d0.[j-1], d1.[j-1] + if ui = n.[j] then -1 else 0)
      Array.blit d0 0 d1 0 n.Length
   d0.[n.Length-1]

7
Satır içi kullanımda performans farkı nedir?
gradbot

Yanıtlar:


202

Sorun, min3işlevin genel karşılaştırma kullanan genel bir işlev olarak derlenmiş olmasıdır (bunun sadece kullandığını düşündüm IComparable, ama aslında daha karmaşıktır - F # türleri için yapısal karşılaştırma kullanır ve oldukça karmaşık bir mantıktır).

> let min3(a, b, c) = min a (min b c);;
val min3 : 'a * 'a * 'a -> 'a when 'a : comparison

C # sürümünde, işlev genel değildir (sadece alır int). F # sürümünü tür ek açıklamaları ekleyerek geliştirebilirsiniz (C # ile aynı şeyi elde etmek için):

let min3(a:int, b, c) = min a (min b c)

... ya yaparak min3olarak inline(ki bu durumda, bu kadar uzmanlaşmış edilecektir intkullanıldığında):

let inline min3(a, b, c) = min a (min b c);;

str300 uzunluğunda rastgele bir dizi için aşağıdaki sayıları alıyorum:

> levenshtein str ("foo" + str);;
Real: 00:00:03.938, CPU: 00:00:03.900, GC gen0: 275, gen1: 1, gen2: 0
val it : int = 3

> levenshtein_inlined str ("foo" + str);;
Real: 00:00:00.068, CPU: 00:00:00.078, GC gen0: 0, gen1: 0, gen2: 0
val it : int = 3

1
F # neden min3'ü int alan bir işlev olarak derlemiyor? Bunu yapmak için derleme zamanında yeterli tür bilgisini zaten biliyor. Min3 bir C ++ şablon işlevi olsaydı böyle çalışırdı, bu yüzden F #'ın bunu neden yapmadığı konusunda biraz kafam karıştı.
00

42
F #, mümkün olduğu kadar genel olduğu sonucuna varır, örneğin "karşılaştırmayı destekleyen tüm X türleri için". çağrı sitesine dayalı olarak inlineuzmanlaşan bir C ++ şablonu gibi çalışır int.
Brian

13
C ++ şablonları esasen F # gibi davranır inline. Varsayılan davranışın farklı olmasının nedeni, çalışma zamanı tarafından işlenen .Net jenerikleri üzerine inşa edilmesidir (ve muhtemelen, genel sayısal kod yazmak için çok iyi değildir). Bununla birlikte, F # 'da C ++ davranışını kullanmak kod şişmesine yol açar çünkü F # jenerikleri çok daha fazla kullanır.
Tomas Petricek

4
C ++ şablon semantiği, C ++ 'da bile kod şişkinliğine yol açabilir ve bunu önlemek için bir çalışma zamanı mekanizmasına geçmenin uygun bir yolunun bulunmaması bazen güçlük yaratır. Bununla birlikte, kod şişkinliği korkusu normalde mantıksızdır - genellikle C ++ şablonları iyi çalışır.
Steve314

@ Steve314: Bağımlı bir tür kullanmayan tüm kodların yeniden düzenlenmesiyle de kaçınmak genellikle kolaydır, böylece kod farklı örnekler için çoğaltılmaz.
ildjarn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.