Bir bilgisayar bilimi projesi yapmak zorunda olan 400 öğrencim olduğunu ve tek başına çalışmak zorunda olduklarını varsayalım (hiçbir öğrenci grubu yok). Bir proje örneği "fortran'da hızlı bir fourier dönüşüm algoritması uygulanmasına izin verebilir" (Biliyorum, seksi görünmüyor, ancak sorumu daha basit hale getiriyor). Ben düzelticiyim ve "gerçekten bağımsız olarak yazılamayacak kadar benzer" bir uygulama öneren öğrenci grupları olup olmadığını kontrol etmek için rutinleri göndermek istiyorum.
Bu, kümeler için denetimsiz bir aramadır. Sorunun, hangi kümeleme algoritmasının kullanılacağı yerine hangi niteliklerin kullanılacağı hakkında olduğunu düşünüyorum. İlk yapacağım şey histogram harfiyle bir harftir. İdeal olarak, dolandırıcıların bundan daha akıllı olduğu için, sonunda harflerin histogramının (permütasyon ile) iyi bir eşleşmesinin olup olmadığını görmek için harflerin iyi seçilmiş rastgele permütasyonlarını deneyeceğim. Ayrıca kodun yapısını keşfetmeyenler, sadece harflerin marjinal dağılımını ... ne çözümünüz var? bu probleme adanmış mevcut yazılım veya paketler var mı? (aslında eski günlerimde bilgisayar bilimleri öğretmenleri bu tür araçlara sahip olduklarını iddia ettiler, ancak şimdi çok basit bir şeyleri olduğundan şüpheleniyorum)
Yazılım geliştirmelerinin avukatının da bu tür sorunları var (1000 öğrenciyle değil, 2 büyük kodla ... bu da işleri zorlaştırıyor)?