Çok sayıda metin belgesine sahip olmak (doğal dilde, yapılandırılmamış), bazı semantik meta verilerle açıklama eklemenin olası yolları nelerdir? Örneğin, kısa bir belge düşünün:
I saw the company's manager last day.
Ondan bilgi alabilmek için, daha az belirsiz olması için ek verilerle açıklanması gerekir. Bu tür meta verileri bulma süreci söz konusu değildir, bu yüzden manuel olarak yapıldığını varsayın. Soru, bu verilerin daha ileri analizlerin daha rahat / verimli yapılabileceği şekilde nasıl saklanacağıdır?
Olası bir yaklaşım XML etiketlerini kullanmaktır (aşağıya bakın), ancak çok ayrıntılı görünüyor ve belki de bu tür meta verileri metin belgelerinde depolamak için daha iyi yaklaşımlar / yönergeler var.
<Person name="John">I</Person> saw the <Organization name="ACME">company</Organization>'s
manager <Time value="2014-5-29">last day</Time>.