Для описание форматов и способов получения данных с поисковых систем используются файлы engine.ini следующего вида (через «;» пишется комментарий к параметру):
[Main] ; секция «Общие сведения»
Order=1 ; порядковый номер поисковой системы, влияет на порядок вывода поисковых систем в программе
EngineName=Alexa ; название поисковой системы, отображаемое в программе
Charset=utf-8 ; кодировка в которой работает поисковая система (обычно windows-1251 или utf-8).
RankName=Alexa Rank ; название показателя авторитетности сайта по версии данной поисковой системы, если есть (служебный параметр, рекомендуется оставить пустым).
RankFunction=GetAlexaRank ; функция для получения показателя авторитетности сайта (служебный параметр, рекомендуется оставить пустым).
[Url] ; секция «Адреса страниц», в адресах страниц все символы «%» должны заменяться на «%%». Параметр «%s» автоматически заменяется программой на поисковой запрос
Search=http://www.alexa.com/search?q=%s&x=0&y=0&count=20
; адрес для обычного поиска
InlinksD=http://www.alexa.com/search?q=linkdomain%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех ссылок на заданный
домен
InlinksP=http://www.alexa.com/search?q=linkdomain%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех ссылок на заданную
страницу (документ)
SiteIndex=http://www.alexa.com/search?q=site%%3A%s&x=0&y=0&count=20
; адрес для получения списка всех страниц,
проиндексированных на заданном сайте
[Regexp] ; секция «Регулярные выражения», символы «/» экранируются следующим образом «\/».
SearchPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора
адреса позиции в результатах поиска
SearchNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results[^>]+>
; регулярное выражение для выбора адреса следующей страницы
результатов поиска
InlinksPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора адреса позиции в
результатах поиска ссылок на сайт
InlinksNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results[^>]+>
; регулярное выражение для выбора адреса следующей страницы
результатов поиска ссылок на сайт
InlinksCount=
<strong>\d+\s*\s*\d+<\/strong>\s+of\s+about\s+<strong>(.*)<\/strong>\s+for
; регулярное выражение для выбора числа найденных
ссылающихся сайтов или документов
SiteIndexPosition=<a[^>]+href="([^"]+)"[^>]+isData[^>]+true[^>]*>.*<\/a>
; регулярное выражение для выбора адреса позиции в
результатах поиска страниц сайта
SiteIndexNextPage=<a[^>]+href\s*=\s*"([^"]+)"[^>]*>\s*<img[^>]+search_more_results
; регулярное выражение для выбора адреса следующей страницы
результатов поиска страниц сайта
SiteIndexCount=<strong>\d+\s*-\s*\d+<\/strong>\s+of\s+about\s+<strong>(.*)<\/strong>
; регулярное выражение для выбора числа найденных документов
на заданном сайте
[Geo] ; секция пока что не используется.