Ranky - škálové hodnocení webů

Model náhodného surfaře:

Lawrence Page a Sergey Brin - zakladatelé Google - začali třídit výsledky vyhledávání podle modelu náhodného surfaře . Tento model předpokládá, že surfař zcela náhodně kliká na odkazy na stránce bez ohledu na obsah odkazu. Pravděpodobnost, že se náhodný surfař prokliká na určitou URL je poté znázorněna Page Rankem.

Vzorec pro výpočet Page Ranku

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

  • PR(A) je PageRank stránky A,
  • PR(Ti) je PageRank stránek Ti, které odkazují na A,
  • C(Ti) je počet odchozích odkazů na stránce Ti
  • d je faktor útlumu (damping factor), který je mezi 0 a 1.

Tedy slovně vyjádřený vzorec Page Ranku je:

PageRank stránky A = (1- faktor útlumu ) + faktor útlumu ( PageRank stránky Ti odkazující na A / počet odkazů na stránce Ti + ... + PageRank stránky Tn odkazující na A / počet odkazů na stránce Tn )

Z výše uvedeného plyne, že web, který má velké množství příchozích odkazů a zároveň má malé množství odchozích odkazů získává vyšší ranky.

Příkladem nám může být Facebook, který jako jeden z mála webů má toolbarový PR 10/10. Facebook.com je často citovaná a často odkazovaná doména. Odkazy umístěné uživateli na Facebook.com jsou převáděné na JavaScriptový odkaz, kterému vyhledávací roboti nerozumí. Nepoznají, že se jedná o odkaz. Ze stránky podle robota neodchází žádné odkazy a tedy neunikají ani žádné ranky. Facebook.com si tak ranky bere jen pro sebe.

Model inteligentního surfaře

Tentokrát Matthew Richardson a Pedro Domingos přišli s modelem, jak obohatit stávající PageRank o tématičnost. Inteligentní surfař nekliká na vše co vypadá jako odkaz, ale vybírá si odkazy podle klíčového slova, které ho zrovna zajímá. Pokud inteligentí surfař hledá matrace , tak bude na stránce vyhledávat odkazy na matrace i dál. Pokud se prokline na stránku, kde není nic o matracích, tak se vrací na původní stránku, nebo odchází jinam. Model je vázán na konkrétní klíčová slova.

Vypočítávání ranku webu podle tohoto modelu má mnohá úskalí. U méně frekventovaných slov dochází velmi brzo k odchodu. Model by také mohl zvýhodňovat stránky s automaticky generovanými klíčovými slovy. Také výpočet takovéhoto ranku by byl časově několikanásobně delší.

Určitým řešením je přesunout vliv z klíčového slova na témata. S tímto nápadem přišel Tahera Haveliwala ve svém modelu Topic-sensitive PageRank.

Topic-sensitive PageRank

Haveliwala navrhl vybrat stránky s určitou autoritou, sám zvolidl Open Document Project - katalog webových stránek, a podle této autority příjmout třídění témat a klíčových slov. Například sekce "Dům a zahrada" tak může obsahovat řadu klíčových slov, kterým je přiřazena hodnota podle kategorie v které se nachází. Pokud tedy hledám matrace, tak i stránka s povlečením bude považovaná za vhodnou a proto ji bude přiřazen topic-sensitive PageRank.

Vzorec pro výpočet Topic-sensitive Page Ranku

PR(A) = E(A) (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Rovnice tedy zůstává skoro stejná jako u modelu náhodného surfaře. Navíc přibude jen proměnná E .

  • E je hodnocení tématické příbuznosti
  • PR(A) je PageRank stránky A,
  • PR(Ti) je PageRank stránek Ti, které odkazují na A,
  • C(Ti) je počet odchozích odkazů na stránce Ti
  • d je faktor útlumu (damping factor), který je mezi 0 a 1.

Tématický PageRank a linkbuilding

Jak jsme se dočetli výše, tak existuje několik modelů, které zvažují vliv tématu na PageRank. Současný skutečný algorytmus, který Google používá k vyhledávání není znám. V praxi likbuildingu je ovšem zcela běžné vyměňovat odkazy s tématickými weby - tedy minimálně sitewide odkazy ( odkazy v šabloně webu ). Je experimentálně prokázané, že vyhledávače přikládají význam textu odkazu ( anchor ). Pokud použité klíčové slovo navíc tématicky zapadá do obsahu stránky, tak lze předpokládat, že si takový odkaz ponese větší "náboj" jak zcela netématický odkaz. Taktéž je více pravděpodobné, že i lidé budou ochotněji klikat na odkazy, které tématicky zapadají do obsahu stránky. Proto je vhodné provádět linkbuilding s rozvahou a nevyměňovat odkazy živelně padni komu padni.

Toolbarový PageRank

PageRank ukazatel

Toolbarový PageRank známe jak z Google Toolbar, tak i jako ikonku na webu.

Toolbarový PageRank není skutečný PageRank. Toolbarový PageRank dosahuje hodnot 0 až 10, přičemž 0 je nejnižší hodnota a 10 je maximální ocenění, které mají jen velmi významné weby. Toolbarový PageRank se podle mého sledování i sledování SEO komunity přepočítává asi tak jednou za 3 měsíce. U nových webů trvá minimálně půl roku, než naskočí toolbarový PageRank. Nové dosud nehodnocené stránky jsou označované ? , ale častěji se vyskytuje ne zcela přesné přiřazení PageRank 0

S-rank - hodnocení oblíbenosti stránky vyhledávačem Seznam.cz

S-rank funguje na obdobném principu jako PageRank. S-rank můžeme zjistit jak pomocí webových služeb, tak i různých toolbarů. V případě, že si chcete zhotovit script na zjišťování S-ranku, tak Vás bude zajímat stránka na blogu fulltextu Seznam.cz