Charakteristika a vývoj internetových vyhledávačů - SEO - díl 1.

Tagy: SEO, vyhledávače, optimalizace, web, fulltext, katalogy, seznam, google

Sponzorované odkazy

Články v sérii

Charakteristika a vývoj internetových vyhledávačů - SEO - díl 1.
Optimalizace On Page faktorů - SEO - díl 2.
Optimalizace Off Page faktorů a podvodné techniky - SEO - díl 3.
Analýza výsledků optimalizace pro vyhledávače - SEO - díl 4.
Praktické řešení optimalizace webu - SEO - díl 5.

Charakteristika a vývoj internetových vyhledávačů - SEO - díl 1.

Připravil jsem si pro vás seriál článků o vyhledávačích a optimalizaci webu pro vyhledávače, které vám mohou pomoci při optimalizaci vašeho webu a dosáhnout tak lepších umístění ve vyhledávačích na relevantní klíčová slova.

Cílem těchto článků je seznámit čtenáře s fungováním vyhledávačů od jejich historického vývoje, až po optimalizaci webu pro vyhledávače, která bude předvedena na vlastních praktických příkladech. Budu se snažit tuto oblast popsat podrobně tak, aby čtenářům nabídla i nové informace, které nenaleznou v běžně dostupných zdrojích, proto budu čerpat informace i ze svých vlastních zkušeností.

Historický vývoj vyhledávačů

Historicky první vyhledávač existoval již v prosinci 1990, neprohledával však weby, ale soubory uložené na ftp. Tento vyhledávač se jmenoval Archie a vyvinul ho Alan Emtage z univerzity McGill v Montrealu. Archie dokázal prohledávat názvy souborů na několika ftp serverech najednou.

První robot se objevil až v roce 1993, kdy se začíná rozvíjet World Wide Web. Jmenoval se World Wide Web Wanderer a naprogramoval ho Matthew Gray. Původní zaměření tohoto robota bylo počítat stránky a monitorovat tak rozvoj internetu, později byl rozšířen a ukládal i URL stránek.

První robot WebCrawler, který indexoval celý obsah stránky, vznikl 20. dubna 1994, vymyslel ho Brian Pinkerton z University of Washington. Postupně vznikaly další vyhledávače. Počet internetových stránek velmi rychle rostl a vyhledávače měly problém udržet vysokou relevanci vyhledávání.

Tento problém se v roce 1998 rozhodli vyřešit Larry Page a Sergey Brin a založili vyhledávač Google. Google jako první začal používat Page Rank, což je hodnocení webu na základě počtu a kvality zpětných odkazů. Díky započítání těchto off page faktorů se výrazně zvýšila relevance vyhledávání a popularita Google rychle rostla. V současnosti je Google celosvětově nejpoužívanější vyhledávač. Nejvíce se mu snaží konkurovat Yahoo! a Microsoft.

Historie nejznámějšího českého vyhledávače seznam.cz začíná na jaře roku 1996, kdy ho založil Ivo Lukačovič. Seznam byl ze začátku jen katalog internetových stránek, který se pravděpodobně inspiroval u katalogu Yahoo!. Umožňoval vyhledávat v názvech stránek, jež se nacházely v katalogu, a zájemce o fulltextové hledání přeposílal na fulltext Altavista. První český fulltext Seznam.cz spustil až v roce 1997, kdy ho naprogramoval Ivo Lukačovič a Štěpán Škrob. Tento historicky první český fulltextový vyhledávač se jmenoval Kompas. Kompas indexoval všechny české weby, které nalezl, a uměl vyhledávat správně i s diakritikou.
zdroj: přednáška Iva Lukačoviče „Seznam jsem založil vlastně náhodou“ konaná dne 4.12.2007 na VŠB

Katalogy

Katalog je seznam webových stránek různého zaměření, které jsou v něm setříděny podle kategorií. V jednotlivých kategoriích mohou být weby řazeny abecedně nebo podle ranku (S-Rank, JyxoRank, GTPR). S příchodem fulltextových vyhledávačů nemají katalogy v dnešní době už takový význam, jejich obliba klesla. Nevýhoda katalogů oproti fulltextovým vyhledávačům je ta, že třídění webů do kategorií nemusí být vždy jednoznačně jasné a procházení kategorií trvá déle, než zadání dotazu ve fulltextovém vyhledávači. Některé katalogy sice umožňují i hledání, ale množina informací, v kterých mohou hledat, je značně omezena. Katalogy mohou prohledávat jen názvy, popisky a URL adresy webů, které jsou v daném katalogu zaregistrovány. V dnešní době mají katalogy pro majitele webových stránek význam spíše jako možné získání zpětného odkazu (viz budování zpětných odkazů). Mezi nejznámější české katalogy patří např. http://odkazy.seznam.cz nebo http://katalog.centrum.cz.

Fulltextové vyhledávače

Fulltextový vyhledávač vyhledává ve svém indexu. Robot (crawler) prochází webové stránky, které jsou uloženy v databázi vyhledávače. Jestliže nalezne odkaz na stránku, kterou ještě nezná, tak přidá adresu této stránky do databáze URL. Na rozdíl od katalogů má tak fulltextový vyhledávač mnohem více možností, aby mohl zobrazit relevantní výsledek vyhledávání.

Podíl domácích vyhledávačů

Informace o podílech vyhledávačů na trhu potřebujeme znát, aby jsme věděli, které vyhledávače jsou pro nás důležité.

zdroj: toplist.cz, hodnoty za březen 2008

V současné době u nás stále vévodí vyhledávač Seznam, který má velký náskok před Googlem. Na světě jsou jen čtyři země, kde nemá Google většinu, je to Korea, Čína, Rusko a Česká republika. Podíl Morfea a Jyxa postupně klesá. Centrum již brzo přestane používat svůj vlastní fulltext Morfeo.

Podíl světových vyhledávačů

zdroj: http://www.comscore.com/…/release.asp?…, hodnoty za únor 2008

Ve světě je nejpoužívanější vyhledávač Google a stále si zvětšuje svůj náskok.

Popis současného stavu vyhledávače Seznam

Popis současného vyhledávače Seznam jsem již podrobně popsal ve svých dvou článích a proto ho zde nebudu znova psát. Doporučuji si tyto dva články pozorně přečíst: Seznam Fulltext – přednáška Štěpána Škroba – Díl 1.
Seznam Fulltext – přednáška Štěpána Škroba – Díl 2.

Slovník pojmů

Pro plné pochopení článků o optimalizaci pro vyhledávače doporučuji prostudovat si tento slovník pojmů:

SEO – Search Engine Optimization – Optimalizace pro vyhledávače.
SEM – Search Engine Marketing – Marketing ve vyhledávačích (Sklik, Adwords).
PPC – Pay per Click – Platba za proklik. PPA – Pay per Action – Platba za akci (konverzi).
CPM – Cost per Mile – Cena za 1000 zobrazení.
CTR – Click–through rate – Míra prokliku, vyjadřuje poměr kliknutí k počtu zobrazení.
SERP – Search engine results page – Stránka s výsledky vyhledávání.
Adwords – PPC reklamní systém od společnosti Google.
Sklik – PPC reklamní systém od společnosti Seznam.
URL – Uniform Resource Locator – Internetová adresa webové stránky.
Tagy (elementy) – Značky, které se používají při psaní (x)html kódu.
Sémantika – Stylistická pravidla pro správné využití (x)html elementů.
Zpětné odkazy – Back links – Zpětný odkaz je odkaz, který vede na web z jiného webu. Množství a kvalita zpětných odkazů ovlivňuje off-page faktory webu. Odkazy mají největší vliv na hodnotu ranku vyhledávačů.
ROI – Return on Investment – Návratnost investice. Jedná se o poměr zisku a investované částky.
Metadata – Informace uložené v hlavičce webu.
Copywriting – Psaní textu pro web.
Keyword – Klíčové slovo.
PR – Page Rank – Jedná se o interní hodnotu vyhledávače Google, podle které Google určuje kvalitu webu. Vyhledávače předpokládají, že na kvalitnější weby se bude více odkazovat a tak webu, na který směřuje hodně kvalitních zpětných odkazů, přiřadí vysokou hodnotu PR. PR je jedna z mnoha veličin, podle které Google řadí výsledky vyhledávání. Na rozdíl od GTPR je aktualizován průběžně.
GTPR – Google Toolbar Page Rank – Jedná se o výstupní hodnotu vyhledávače Google. GTPR je aktualizován jednou za 3 – 6 měsíců. Protože skutečný PR nejde zjistit, tak se GTPR používá jako jedna z veličin, podle které se odvíjí cena zpětných odkazů.
Srank – Rank, který používá vyhledávač Seznam.
Anchor text – Viditelný text u odkazu. Cílový web tím posiluje pozici ve vyhledávači na klíčové slovo obsažené v anchor textu.
Mapa webu – Jedná se o hierarchicky seřazený seznam všech stránek webu. Pomáhá vyhledávači najít stránky, které jsou umístěné hluboko ve stromové struktuře webu.
TLD – Top Level Domain – Domena první úrovně (např .cz).
CSS – Cascading Style Sheets – Kaskádové styly.
Black Hat SEO – Nepovolené praktiky SEO, které vyhledávače postihují.
Google Toolbar – Toolbar v prohlížeči od společnosti Google, který je využíván k hledání ve vyhledávači Google, nebo pro zjištění GTPR webu.
Keyword stuffing – Nesmyslné nadměrné používání klíčových slov v textu webu. Patří mezi nepovolené praktiky SEO a vyhledávače mohou takovéto weby penalizovat.
Long Tail – Dlouhý ocas – Často vyhledávaná slova tvoří jen malou část z celkových dotazů ve vyhledávači. Většina vyhledávaných frází je hledána třeba jen jednou nebo málokdy. Většinu dotazů ve vyhledávači tvoří právě málo vyhledávané fráze.
Navigační dotaz – Navigational query – Hledání webu pomocí vyhledávání doménového jména ve vyhledávači.
UIP – Počet návštěvníků s unikátní IP adresou za určité období.
Visit – Návštěva – Většina počítadel započítává jednu návštěvu jednoho návštěvníka max. jednou za 30 minut. Impression – Imprese – Udává počet zobrazení (např. počet zobrazení reklamního banneru).
Click fraud – Neplatné kliknutí – Podvodné klikání partnera u PPC obsahové sítě.
Validita – Aby byl web validní, musí dodržovat předepsané standarty (např. W3C).
W3C – World Wide Web Consortium – Mezinárodní konsorcium, které vyvíjí webové standarty.
Fulltext – Vyhledávání v indexu stránek.
Katalog – Seznam webů uspořádaných do kategorií.
Description – Meta tag description by měl obsahovat stručný popis dané stránky webu.
ODP – Open Directory Project – http://www.dmoz.org katalog webových stránek
Konverze – Provedení určité akce na webu – např. nakoupení zboží, přihlášení se k odběru novinek apod.
Subdoména – Doména 3., nebo nižšího řádu.
Traffic – Návštěvnost.
Volná shoda – Veškeré dotazy ve vyhledávačích, které obsahují dané klíčové slovo.
Přesná shoda – Patří sem veškeré dotazy ve vyhledávačích, které jsou hledány pomocí přesného znění hledané fráze.

Článek Charakteristika a vývoj internetových vyhledávačů - SEO - díl 1. byl publikován 24. listopadu 2008 v 06.00 v rubrice Technologie. Autorem článku je Marek Maťovka. Pro diskusi slouží komentáře (0).

Líbí se Vám tento článek? Ano / Ne