2012-05-07 12 views
7

TREC biçimi'un teknik özelliklerini arıyorum. Çok uğraştım ama bir ipucu bulamadım.TREC formatı nedir?

Herhangi bir bilgiyi nerede bulacağını bilen var mı?

cevap

3

AFAIK TREC NIST Metin Alma Konferansı için bir kısaltmadır. Dizinleyicinin belge sınırlarının dosyaların içinde nerede olduğunu bilmesi için, her belgenin başlangıç ​​belgesine ve son belge etiketlerine sahip olması gerekir. Bu etiketler HTML veya XML etiketlerine benzer ve aslında TREC belgelerinin formatıdır.

TrecParser: Bu ayrıştırıcı TEXT, HL, HEAD, HEADLINE, TTL ve LP alanlarındaki metni tanır.

Kaynak: TREC Wikipedia

Kaynak: Lemur Guide

0

Ayrıca bilgi yutulması

için IBM Watson tarafından kullanılan dosya biçimidir