Структура конфигурационного файла

Для описание форматов и способов получения данных с поисковых систем используются файлы engine.ini следующего вида (через «;» пишется комментарий к параметру):

[Main] ; секция «Общие сведения»

Order=1 ; порядковый номер поисковой системы, влияет на порядок вывода поисковых систем в программе

EngineName=Alexa ; название поисковой системы, отображаемое в программе

Charset=utf-8 ; кодировка в которой работает поисковая система (обычно windows-1251 или utf-8).

RankName=Alexa Rank ; название показателя авторитетности сайта по версии данной поисковой системы, если есть (служебный параметр, рекомендуется оставить пустым).

RankFunction=GetAlexaRank ; функция для получения показателя авторитетности сайта (служебный параметр, рекомендуется оставить пустым).

[Url] ; секция «Адреса страниц», в адресах страниц все символы «%» должны заменяться на «%%». Параметр «%s» автоматически заменяется программой на поисковой запрос

Search=http://www.alexa.com/search?q=%s&x=0&y=0&count=20
; адрес для обычного поиска

InlinksD=http://www.alexa.com/search?q=linkdomain%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех ссылок на заданный домен

InlinksP=http://www.alexa.com/search?q=linkdomain%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех ссылок на заданную страницу (документ)

SiteIndex=http://www.alexa.com/search?q=site%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех страниц, проиндексированных на заданном сайте

[Regexp] ; секция «Регулярные выражения», символы «/» экранируются следующим образом «\/».

SearchPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора адреса позиции в результатах поиска

SearchNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results[^>]+>
; регулярное выражение для выбора адреса следующей страницы результатов поиска

InlinksPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора адреса позиции в результатах поиска ссылок на сайт

InlinksNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results[^>]+>
; регулярное выражение для выбора адреса следующей страницы результатов поиска ссылок на сайт

InlinksCount= <strong>\d+\s*\s*\d+<\/strong>\s+of\s+about\s+<strong>(.*)<\/strong>\s+for
; регулярное выражение для выбора числа найденных ссылающихся сайтов или документов

SiteIndexPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора адреса позиции в результатах поиска страниц сайта

SiteIndexNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results
; регулярное выражение для выбора адреса следующей страницы результатов поиска страниц сайта

SiteIndexCount=<strong>\d+\s*-\s*\d+<\/strong>\s+of\s+about\s+<strong>(.*)<\/strong>
; регулярное выражение для выбора числа найденных документов на заданном сайте

[Geo] ; секция пока что не используется.