DataparkSearch
DataparkSearch | |
---|---|
Тип | поисковая машина |
Разработчик | Максим Захаров |
Написана на | C |
Операционные системы | FreeBSD, GNU/Linux, Sun Solaris |
Последняя версия |
4.54 ( 2016 ) |
Репозиторий | github.com/Maxime2/datap… |
Лицензия | GNU General Public License |
Сайт | www.dataparksearch.org |
DataparkSearch Engine —
DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многие другие данные, используя внешние парсеры.
Машина готова для индексирования многоязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.
Использует собственную технологию ссылочного ранжирования, основанную на
Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.
Ссылки
- Официальный сайт проекта
- Страница проекта в Google Code
- Порт FreeBSD
- newslookup.com — новостной сайт, использующий DataparkSearch.