全文检索(Full Text Retrieval)是以文本数据为主要处理对象,实现内容信息存储与检索的技术。全文检索是根据数据资料的内容,而不是外在的特征来实现的信息检索。它通过提供快捷的数据管理工具和强大的数据检索手段,帮助人们进行大量文档资料的整理和管理工作,使人们能快速、方便地查到他们想要的任何信息。
网络环境下的全文检索技术以机器可读的字符代码形式或图像形式存储文本信息,具有结构化和非结构化的多媒体信息收集、加工和索引功能;具有数据库维护、控制、备份、恢复和管理等功能;能根据内容语义及上下文联系进行布尔检索、语词检索、截词检索、位置检索、字段检索、概念检索和模式检索等;能检索、打印、下载和传递检索结果。
全文检索目前主要通过以下方式实现:对文本内容中的每个检索项进行位置扫描,然后排序,建立以每个检索项的离散码为表目的倒排文档;采用自由指定的检索项(如关键词字符串等)直接与全文文本的数据高速对照,进行检索;采用超文本模型建立全文数据库,实现超文本检索。