Temel, iyi bilinen dize metriklerinin uygulamalarını sağlayan küçük bir kütüphane üzerinde çalışıyorum. Çoğunlukla kendi eğitimim için. Yani biraz boş zamanım olduğunda gelişme olur.
Bu nedenle, çoğu işlemi otomatikleştirdim, böylece çok fazla çaba harcamadan çalıştığım kadar sık bir sürüm yayınlayabilirim. Bununla birlikte, Java belgesini korumak hala bir yüktür çünkü örnekler içerir.
API geliştikçe her örneği tekrar tekrar kontrol etmem gerekiyor. Bunu yapmanın daha iyi bir yolu var mı?
Belgeleri ve örnekleri ayrı bir projeye (örn. Kaliper Eğitimi ) taşımayı düşündüm, böylece normal faktörle birlikte yeniden faktörlü ve derlenebilir. Ancak bu, dokümanları ilgili sınıftan uzaklaştırır.
Yani evet. Pastanı alıp da yemek istiyorum. : D
* <h2>Tokenization</h2>
*
* Tokenization cuts up a string into tokens e.g.
* <code>chilperic ii son of childeric ii</code> is tokenized into
* <code>[chilperic, ii, son, of,
* childeric, ii]</code>. Tokenization can also be done repeatedly by tokenizing
* the individual tokens e.g.
* <code>[ch,hi,il,il,lp,pe,er,ri,ic, ii, so,on, of, ch,hi,il,ld,de,er,ri,ic, ii]</code>
* <p>
*
* <pre>
* <code>
* {@code
* return new StringMetricBuilder()
* .with(new SimonWhite<String>())
* .tokenize(new Whitespace())
* .tokenize(new QGram(2))
* .build();
* }
* </code>
* </pre>
*
* <p>
Yukarıdaki çok soyut ise. Bu bir dokümantasyon örneğidir. Şu anda Tokenizers.createQGram(2)
, yapıcı yöntemini amortismana tabi tutarken , Etkili Java tarafından önerilen statik yapıcıları ekliyorum . Böyle bir şey yaptığımda, yukarıdaki örnek kodu güncellemem ve hala çalışıp çalışmadığını kontrol etmeliyim.