Služby s fulltextovým hledáním - služby databázového typu

Není v lidských silách zjišťovat všechny nové www stránky, udržovat odkazy aktuální, třídit je do katalogové sestavy. Zvláště fáze třídění do kategorií se neobejde bez lidského zásahu. Takže katalogy zdaleka neobsahují vyčerpávající seznamy zdrojů na dané téma. A tak vznikly automatizované sběrače dat typu search engines - vyhledávací stroje. Ty dokážou zmapovat desítky milionů stránek, neboť se obejdou bez lidské práce. Využívají programů nazývaných roboti, poutníci,kteří automaticky brouzdají Internetem. Získané informace o obsahu dokumentů mohou být využity různými způsoby.

Jedním ze způsobů využití informací získaných roboty je vybudování databází, které pak umožňují uživatelům prohledávání Webu pomocí klíčových slov. Víme-li, jaké klíčové slovo by měl dokument obsahovat, použijeme vyhledávání v takto vzniklé netříděné databázi. Nad kvalitou takto nalezeného dokumentu a jeho zařazením si však budeme lámat hlavu sami.

Služby, jež umožňují hledání v těchto databázích, se nazývají vyhledávací služby databázového typu v anglickém světě je nazývají přímo search-engines[1] .

Každý, kdo se dosud pracně probojovával k danému tématu, je těmito službami zprvu nadšen, není to skvělé, nechat si vybrat ze všech dokumentů na světě své jmenovce, recepty na pomazánku nebo akordy k oblíbeným písničkám ? Základním rysem databázových vyhledávacích služeb je však to, že výsledek hledání stojí a padá s naším zadáním klíčového slova. Pro zúžení hledání se užívají booleovské a proximitní operátory (viz dále).

Nejznámějšími databázovými službami (search engines) jsou: AltaVista, Kompas, Infoseek, Excite , HotBot, Lycos , Atlas, Magellan.

Někdy, přestože jde o službu databázovou, je doplněna tématickou nabídkou, ovšem tato nabídka se týká jen malé části vybraných recenzovaných stránek registrovaných v dané databázi. Pokud tedy budeme v této podnabídce vyhledávat, budou výsledky hledání v tomto případě užší. Je zřejmé, že schopnost vyhledat rozumnou odpověď na zadaný dotaz, závisí na způsobu, jakým dotaz položíme, a nejen na kapacitě databáze.

Dále záleží na tom, jakým způsobem je konkrétní databáze sestavována z údajů, které roboti najdou. Jinak řečeno, zda se indexují údaje jen v záhlaví www stránek, v prvních 20 slovech stránky, nebo v plném textu stránky (tzv.fulltextové hledání).