Değişken uzunlukta milyarlarca satır içeren büyük bir sıralanmış dosyam var. Yeni bir satır verilen sıralı dosyaya dahil olsaydı hangi bayt numarasını alacağını bilmek istiyorum.
Misal
a\n
c\n
d\n
f\n
g\n
'Foo' girdisi göz önüne alındığında, çıktıyı 9 alırdım.
Bu, tüm dosyayı inceleyerek yapmak kolaydır, ancak milyarlarca değişken uzunlukta satır olarak, ikili bir arama yapmak daha hızlı olacaktır.
Böyle bir metin işleme aracı zaten var mı?
Düzenle:
Şimdi çalışıyor: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch