DataparkSearch

Материал из Википедии — свободной энциклопедии
DataparkSearch
Тип поисковая машина
Разработчик Максим Захаров
Написана на C
Операционные системы FreeBSD, GNU/Linux, Sun Solaris
Последняя версия 4.54 (
2016
)
Репозиторий github.com/Maxime2/datap…
Лицензия GNU General Public License
Сайт www.dataparksearch.org

DataparkSearch Engine

веб-серверах
.

DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многие другие данные, используя внешние парсеры.

Машина готова для индексирования многоязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.

Использует собственную технологию ссылочного ранжирования, основанную на

нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности
, популярности, дате последнего изменения и по важности (произведению релевантности на популярность).

Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.

Ссылки