Steffen'in belirttiği gibi, örnek matris, bir kelimenin bir metinde kaç kez göründüğünü kodlar. Kodlamanın matrise konumu, kelime (matristeki sütun konumu) ve metin (matristeki satır konumu) ile verilir.
Şimdi, karma hile aynı şekilde çalışır, ancak başlangıçta her kelime için sütun konumunu içeren sözlüğü tanımlamanız gerekmez.
Aslında, size olası sütun pozisyonları aralığını (karma fonksiyonu size mümkün olan minimum ve maksimum değeri verecektir) ve matrise kodlamak istediğiniz kelimenin kesin pozisyonunu veren hash fonksiyonudur. Örneğin, "beğeniler" kelimesinin hash fonksiyonumuz tarafından 5674 rakamına hashlendiğini düşünelim, o zaman 5674 sütunu "beğeniler" kelimesine göre kodlamaları içerecektir.
Böyle bir şekilde, metni analiz etmeden önce sözlük oluşturmanıza gerek yoktur. Metin matrisiniz olarak seyrek bir matris kullanacaksanız, matris boyutunun tam olarak ne olması gerektiğini tanımlamanız bile gerekmez. Sadece metni tarayarak, anında, hash fonksiyonu ile kelimeleri sütun konumlarına dönüştüreceksiniz ve metin matrisiniz, hangi belgeyi aşamalı olarak analiz ettiğinize (satır konumu) göre verilerle (frekanslar, yani) doldurulur.