Сбор и форматирование терминов
База данных поддерживает таблицы слов (СЛОВА) и терминов (ТЕРМИНЫ). В таблице слов фиксируются основы (без суффиксов и окончаний) всех слов, которые встречаются в документах. В таблицу терминов помещается информация о терминах и ссылках, которые затем попадают в алфавитный и тематический указатели :
Термины представляют собой первичную справочную информацию. К ним относятся :
Отдельные слова, выделенные вручную в таблице слов ( постоянные слова);
Заголовки глав, разделов и подразделов;
Названия Си-программ (раздел, в котором они встречаются) ;
Названия таблиц (раздел, в котором они встречаются) ;
Последовательности слов, выделенные прописными буквами;
Последовательности слов, выделенные жирным шрифтом;
Последовательности слов, выделенные угловыми скобками;
Постоянные слова, встречающиеся в документах;
Отдельные слова, выделенные из многословных терминов.
ССЫЛКИ представляют собой вторичную справочную информацию. Ссылками являются все упоминания терминов во всех документах. При обнаружении ссылки форматер помещает HTML-ссылку на первое слово алфавитного указателя.