Руководство пользователя / CNSearch 1.5.1
3 Работа с системой
Поисковая система CNSearch Pro состоит из модуля индексации и модуля поиска. Индексатор производит анализ сайта (или группы сайтов) и создает индексные файлы (индекс); модуль поиска осуществляет быстрый поиск по созданному индексу.
3.1 Индексация
Для запуска индексации следует выполнить следующие действия:
- Предварительно в файле search.conf необходимо указать условное название задачи (Job) и адрес сайта, на котором будет проводиться индексация:

Рис. 1 Задание параметров индексацииВ данном примере localhost - название задачи, а http://localhost/my_site - адрес Вашего сайта.
- Запустить файл indexer.exe в командной строке, указав следующие параметры:
- Название задачи;
- Имя конфигурационного файла и путь к нему (в случае если файл расположен в другом каталоге).
Пример для Windows:
C:\indexer.exe localhost
или
C:\indexer.exe --config=D:\www\search.conf localhost
Пример для Unix/Linux:
./indexer name_of_task
или
./indexer.exe --config=/home/www/search.conf name_of_task
Для осуществления индексации нескольких сайтов следует в файле search.conf указать адреса данных сайтов в рамках одной задачи:

Рис. 2 Задание индексации нескольких сайтов
В случае если копия Вашего сайта размещена на Вашем компьютере, возможна локальная индексация файлов сайта с последующим переносом индексного файла на сервер (подробнее см. search.conf).
По завершении процесса индексации система создает следующий комплекс индексных файлов:
По завершении процесса индексации система создает следующий комплекс индексных файлов:
- files.cns - описание всех документов сайта;
- index.cns - собственно индексный файл;
- docs.cns - перечень всех текстов сайта;
- fulltxt.cns - полнотекстовый индекс;
- stats.log - статистический отчет (для сохранения полученной информации в базе данных; подробнее см. Статистика).
Примечание: На данный момент в системе реализованы два типа индексации
- HTTP-режим - стандартный метод поиска по сайту, находящемуся непосредственно на веб-сервере. Для запуска HTTP-индексации следует указать URL сайта в конфигурационном файле (подробнее см. search.conf).
- Индексация локального диска - дополнительный вариант, предусмотренный для индексации файлов копии сайта, хранящейся на локальном диске Вашего компьютера. Доступ к сети Internet не требуется. Для запуска локальной индексации следует указать в конфигурационном файле URL и расширения файлов сайта (подробнее см. search.conf).
3.2 Дефрагментация
Для оптимизации процесса поиска по индексным файлам в системе предусмотрена возможность дефрагментации индекса: результаты индексации систематизируются, что позволяет значительно ускорить последующий поиск. Для этого следует скопировать файл idefrag.exe, расположенный в каталоге индексатора, в папку с индексными файлами (index.cns, docs.cns и files.cns) и запустить на исполнение. По окончании процесса файл docs.cns будет заменен файлом results.cns.
Примечание: Дефрагментированные индексные файлы не подлежат изменениям.
3.3 Поиск
Для осуществления поиска по созданному индексу следует выполнить следующие действия:
- Скопировать полученные индексные файлы (см. Индексация) в каталог с модулем поиска. Как правило, это каталог /cgi-bin/ веб-сервера, на котором размещен Ваш сайт ;
- Указать в браузере путь к интерфейсу поиска (к файлу search.exe);
- В открывшейся форме ввести запрос и нажать кнопку Искать; при условии корректно заданного объекта поиска система отобразит список результатов поиска:

Рис. 3 Результаты поиска
Для удобства просмотра списка возможна сортировка результатов поиска по дате или по релевантности.
Настройка интерфейса списка результатов поиска осуществляется с помощью шаблонов (см. Настройка шаблонов).
Файл 'fulltxt.cns' содержит тексты всех индексируемых документов: эта информация позволяет отображать образцы текста, содержащие выделенный поисковый запрос, в результатах поиска. Например:
Однако, файл 'fulltxt.cns' может достигать больших размеров. В этом случае его можно удалить либо отменить его создание при помощи параметра Type (см. search.conf) в процессе индексации; в этом случае результаты поиска будут выглядеть следующим образом (без выделения и цитирования, отображаются только первые 256 символов документа):
Назад | Оглавление | Далее
