Apache Lucene

Apache Lucene — безкоштовна бібліотека з відкритим кодом для повнотекстового пошуку. Реалізована на Java, підтримується Apache Software Foundation і випускається під ліцензією Apache Software.[1]

Lucene портована на інші мови програмування, зокрема, C#, C++, Python, Ruby, PHP, та ін.

Історія

Початково розроблялась Дагом Каттінгом з 1997 року і названа на честь дружини. Перша версія Lucene побачила світ в 1999 і була доступна для скачування на SourceForge. 2001 року проєкт приєднався до продуктів сімейства  Apache Software Foundation's Jakarta і став самостійним проєктом Apache на початку 2005.[2]

В березні 2010 пошуковий сервер Apache Solr був приєднаний до проєкту Lucene як підпроєкт.

Використання

Lucene підходить до використання в будь-якому проєкті що потребує повнотекстового пошуку. Найчастіше використовується для реалізації пошукових систем інтернет та сайтами для локального пошуку.[3]

Основні властивості

  • Масштабування та швидкісна індексація — має надзвичайну швидкість індексування при малих потребах в оперативній пам'яті
  • Потужний, точний та ефективний пошуковий алгоритм — підтримує різноманітні типи запитів (фрази, шаблони, інтервали), має можливості ранжованого пошуку, пошуку по полях, сортування
  • Кросплатформовість — реалізована на Java, портована на інші мови програмування[3]

Проєкти, що базуються на Lucene

  • Apache Nutch — фреймворк для побудови пошукових систем
  • Apache Solr — пошуковий сервер
  • Elasticsearch — пошуковий сервер
  • Compass — попередник Elasticsearch
  • DocFetcher — пошуковий застосунок для настільних комп'ютерів
  • Swiftype — пошукова система для вебсайтів
  • Lucene.NET — порт Lucene на .NET
  • Ferret — порт Lucene на Ruby
  • RubyLucene — порт Lucene на Ruby
  • KinoSearch - порт Lucene на Perl
  • Apache Lucy — послідовник KinoSearch та Ferret
  • Luke — являє собою графічний інтерфейс для Lucene, має можливості переглядати та редагувати індекси

Підтримка української

У версіях 6.2 та 7.0 додано підтримку української мови — додали аналізатор, що базується на словнику.[4]

Посилання

  1. Apache Lucene. Архів оригіналу за 21 грудня 2017.
  2. Ten years of the Lucene search engine at Apache. Архів оригіналу за 4 березня 2016.
  3. а б Erik Hatcher and Otis Gospodnetic. Lucene in Action. Manning. ISBN ISBN 1-932394-28-1. {{cite book}}: Перевірте значення |isbn=: недійсний символ (довідка)
  4. [LUCENE-7287] New lemma-tizer plugin for ukrainian language. - ASF JIRA. issues.apache.org. Архів оригіналу за 10 серпня 2016. Процитовано 21 червня 2016.
  • п
  • о
  • р
Apache Software Foundation
Основні проєкти
ActiveMQ · Airflow  · Ant · Apache HTTP Server · APR · Apache Beam[en]  · Bloodhound  · Buildr · Camel · Cassandra · Cayenne · Chemistry  · CloudStack  · Cocoon · Commons · Cordova  · CouchDB · CXF · Deltacloud · Derby  · Directory · Excalibur · Felix · Flex  · Forrest · Geronimo · Gump · Hadoop · iBATIS  · Isis  · Jackrabbit · James · Lenya · Lucene · Maven · mod_perl · MyFaces · OFBiz  · OpenEJB · OpenJPA · OpenNLP  · OpenOffice · POI · Qpid · Rave · Roller · Sling · SpamAssassin  · Spark  · Sqoop · Stratos  · Struts  · Subversion  · Tapestry  · Tika · Tomcat · Traffic Server · Tuscany · Velocity · Wicket · XMLBeans[en]
Інші проєкти
Jakarta Project · Apache XML · Apache Incubator
Підпроєкти
BCEL · BSF · Cactus · Chainsaw · HBase · JMeter · Xerces · Batik · FOP · Log4j · XAP · River · ServiceMix · Log4Net · Abdera · Ivy · ODE · JSPWiki · Wink · Solr
Інкубатор
MXNet  · OpenMeetings  · Superset
Колишні проєкти (Attic)
Beehive · Harmony · HiveMind · Slide · Shale  · Wave
Ліцензія: Apache License · Сайт: http://apache.org/
  • п
  • о
  • р
Загальні
Ask.com • blekko[en]Cuil зупинено • DuckDuckGo • Exalead • GigablastGoogleBingQwantYahoo!AltaVista зупинено • AlltheWebЯндекс.Пошук • Aliweb • Lycos
Регіональні
Accoona (Китай / США) • Alleba (Філіппіни) • Ansearch (Австралія / США / Британія / Нова Зеландія) • Daum (Пд. Корея)• Guruji.com (Індія) • Поиск@Mail.Ru (Росія) • Maktoob • META (Україна/Росія) • Miner.hu (Угорщина) • Najdi.si (Словенія) • SAPO (Португалія) • Search.ch (Швейцарія) • Sesam (Норвегія / Швеція) • Seznam.cz (Чехія) • Walla! (Ізраїль)
Лідери
Baidu (Китай) • Naver (Південна Корея) • Yahoo! Japan (Японія)
Метапошук
AskNet • Brainboost • Clusty • Dogpile • EcosiaExcite • FarSEER • HotBot • Info.com • Ixquick • Krozilo • Mamma • Metacrawler • MetaLib[en] • Myriad Search • SideStep • Surfwax • Turbo10 • WebCrawler • GlobalFileSearch
Відкрите/Вільне
DataparkSearch • Egothor • Gonzui • Grub • • locust • Isearch • Lucene • Lemur Toolkit & Indri Search Engine • mnoGoSearch • Namazu • Nutch • OpenFTS • Sciencenet • Wikia Search[en] • Sphinx • SWISH-E[en] • Terrier Search Engine[en] • Xapian[en]YaCy • Zettair