Blog
Kvalita obsahu, Google Panda a obsahové farmy (MFA)
Google Panda update je způsob boje Google s obsahovými farmami a nekvalitním obsahem.
Google se snaží svým návštěvníkům, kteří používají jeho vyhledávání, zobrazovat co nejlepší výsledky. Proto má zájem rozpoznat weby, jejichž obsah nemá hodnotu a penalizovat je tak, aby se nezobrazovaly ve výsledcích vyhledávání.
Co jsou to obsahové farmy a proč vznikají
Google, AdSense a obsahový spam
Do vzniku obsahových farem je potažmo zapojen i samotný Google. Jeho AdSense reklamní systém umožňuje vydělávat majitelům webů, kteří si reklamy od AdSense vloží na své stránky. Na základě rozpoznání tématu stránek zde pak Google umísťuje relevantní reklamy.
Pokud má takový web vysokou návštěvnost, může to být pro majitele webu finančně velice zajímavé. Firmy jako například Demand Media měly díky tomuto stylu reklamy obrat v letech 2008 a 2009 téměř 200 milionů dolarů.
To by bylo všechno v pořádku, pokud by byl obsah pro návštěvníky hodnotný. Problém obsahových farem je ale ten, že jejich články nemají téměř žádnou hodnotu. Obsah obsahových farem je napsaný buďto velice levně a rychle, jen aby byl a aby jej bylo co nejvíc, nebo je dokonce roboticky generován a to tak „chytře‟, aby byl optimalizován pro vyhledávače. Návštěvník po zhlédnutí takových MFA (Made For AdSense / Vytvořeno Pro AdSense) stránek bývá znechucen a klikne raději na některou z reklam, nebo se musí vrátit a hledat dál. Tyto gigantické weby/farmy získávaly hodně návštěvníků právě ze samotného Google. Na kvalitu obsahu MFA stránek se můžete podívat na obrázcích níže. Často se dá narazit i na weby, které jednoduše jen zkopírují na své stránky výsledky vyhledávání z Google nebo Seznamu, nebo texty z jiných webů.
obr 1: konkrétní příklad jedné podstránky obsahové farmyobr 2: příklad podstránky MFA webu (AdSense)
Netvrdím, že zrovna dva uvedené příklady jsou farmy, které dobře vydělávaly (celkem o tom pochybuji), ale jednoznačně nikoho nalezení tohoto typu stránek ve výsledcích Google či Seznamu nepotěší.
Obsahové farmy se soustřeďují na získání návštěvnosti z long tailu, neútočí na vysoce konkurenční klíčové fráze, neboť jsou nerentabilní. Long tailových dotazů je ovšem většina, více jak 70% ze všech dotazů, které jsou vyhledávačům pokládané.
Co je to MFA web
MFA web může využívat i jiné reklamní systémy než AdSense: etarget, Sklik partner, různé partnerské provizní programy (affiliate) nebo jiné. Takže MFA můžeme chápat ve významech:
- vytvořeno pro AdSense (Made for AdSense) - provize z prokliku na inzerát
- vytvořeno pro inzeráty (Made for Ads) - provize z prokliku na inzerát
- vytvořeno pro reklamu (Made for Advertise) - provize z prokliku na inzerát
- vytvořeno pro provizní program (Made for Affiliate) - provize z realizovaného prodeje
Společným znakem MFA je levný/nekvalitní obsah, jehož účelem je obelhat vyhledávače, přivést co nejvíc návštěvníků a vydělat na zobrazené inzerci. Přičemž majitel MFA stránek dostává provizi z každého kliknutí na reklamu, kterou na svém webu zobrazuje.
Týká se Panda update i nás v Česku?
24. 2. 2011 Google oznámil vylepšení svého algoritmu, které má penalizovat stránky s méně kvalitním obsahem. Toto vylepšení bylo v té době funkční pouze v USA. Později se tato změna algoritmu začala označovat jako Panda (Google Farmer/Panda Update). Algoritmus tehdy ovlivnil výsledky vyhledávání u téměř 12 % anglických dotazů. Přehled, jak byly nějvětší obsahové farmy dotčeny Google Panda algoritmem uvádí Seomoz v tomto článku.
12. 8. 2011 Google aplikoval Panda vylepšní globalně, tedy i v Česku. Očekává se, že ovlivní výsledky vyhledávání u 6 - 9 % dotazů, které návštěvníci Google kladou.
Proč název Panda?
Protože Panda je jméno klíčového Google inženýra, který na algoritmu hodnocení kvality obsahu pracoval.
Jak Google Panda algoritmus funguje?
Jedná se o samoučící se algoritmus (machine learning). Tato „umělá inteligence‟ se učí na vzorku dodaném lidskými testery/hodnotiteli. Algoritmus vyhodnocuje různé faktory a porovnává je se vzorovým hodnocením, cílem je pak získat co nejpodobnější výsledky. Pro získání učebních vzorků tedy Google používá lidi, kteří hodnotí vzorek stránek. Samozřejmě Google přesný algoritmus neprozradí, ale z následujících otázek můžeme pochopit o co Google jde při hodnocení kvality obsahu:
- Důvěřovali byste informacím na této stránce?
- Je článek napsán expertem na dané téma?
- Má stránka opakující se články se stejným obsahem a jen malou změnou klíčových frází v různých článcích?
- Svěřili byste stránce přístup k vaší kreditní kartě?
- Obsahuje text gramatické a stylistické chyby?
- Je to zajímavý obsah, nebo jen vygenerovaný text pro získání návštěvníků z vyhledávačů?
- Jedná se o originální obsah, výzkum, zprávu nebo analýzu?
- Je obsah stránky přínosem v porovnání s jinými stránkami ve výsledcích vyhledávaní na daný dotaz?
- Je obsah důsledně redigován?
- Obsahuje článek objektivní pohled na věc z obou stran?
- Je web autoritou na dané téma?
- Jedná se o masově generovaný obsah na velkém množství webů a stránek bez kvalitního zpracování?
- Je článek narychlo splácán?
- Kdyby se jednalo o stránku o zdraví, důvěřovali byste informacím na ní?
- Máte pocit už z názvu webu, že je kvalitním zdrojem informací/autoritou?
- Nabízí článek kompletní popis problematiky?
- Obsahuje článek zajímavé informace, které nejsou zjevné/obecně známé?
- Přidali byste si tuto stránku do záložek nebo ji doporučili přátelům?
- Obsahuje článek rušivé množství reklamy tak, že se i hlavní obsah ztrácí?
- Očekávali byste článek s tímto obsahem v tisku, encyklopedii nebo knize?
- Jsou články na webu příliš krátké a neobsahují užitečné informace?
- Jsou stránky na webu vytvořené pečlivě, nebo nebyla věnována dostatečná pozornost detailu?
- Mohou být uživatelé, kteří stránky navštíví nespokojeni?
Aktualizace hodnocení stránek Panda algoritmem se provádí pouze jednou za čas, přibližně každé dva měsíce. Weby a stránky mají potom až do dalšího spuštění hodnotícího algoritmu přidělenou neměnnou hodnotu. A to i když by byl po aktualizaci výsledků obsah stránky zkvalitněn a vylepšen. Stránka bude muset na přehodnocení počkat až do dalšího spuštění - aktualizaci Panda algoritmem. Proto se změna kvality obsahu stránek projeví až po delším časovém intervalu.
Doposud byly výsledky hodnocení Panda algoritmem aktualizovány asi pětkrát. Stejně jako na všech svých algoritmech, i na algoritmu hodnocení kvality obsahu Google neustále pracuje, mění jej a vylepšuje.
Existuje seznam výjimek (whitelist), které Google Panda nesprávně vyhodnotil jako málo kvalitní obsah a potom jim byla ručně přidělená výjimka. Díky tomu i přes nedokonalost algoritmu nejsou takto označené weby penalizovány. Panda algoritmus je sice přemyšlený a propracovaný, ale není zatím dokonalý a může uškodit i některým nevinným a naopak, jiný nekvalitní obsah nedokáže správně rozpoznat. Je to pouze stroj a může dělat chyby. Z globálního hlediska si je Google jistý, že díky Pandě budou jeho výsledky vyhledávaní kvalitnější. Dostat se na manuálně vytvořený seznam výjimek bude skoro nemožné. Proto je lepší položit si výše vypsané otázky a pracovat na tom, aby weby o které pečujete prošli, pokud možno na výbornou.
Co všechno může Google Panda vyhodnocovat, jak se vyhnout penalizaci Pandou
Rušivé množství reklamy na stránce.
Obsahové farmy se živí reklamou (AdSense, Sklik Partner, atd.). Nepřinášejí žádnou užitečnou informaci svým návštěvníkům, ale mají na každé stránce velké množství reklamy, na kterou zoufalý návštěvník může kliknout. Doporučuje se, aby poměr množství reklamy a obsahu na stránce nebyl větší než 40 % reklamy k 60 % obsahu.
Hluboké odkazy (deep links)
Spekuluje se i o vlivu hlubokých odkazů, které vedou z jiných webů na vaše podstránky. Hluboké (deep links) proto, že nevedou na homepage, ale do nitra vašeho webu - do zanořených podstránek. Bylo by to přirozené, protože nekvalitní obsah asi externí linky nepřitáhne. Ale je to zatím nepotvrzená spekulace, i když zní celkem logicky.
Texty, multimédia a bohatý obsah
Vliv na hodnocení kvality stránky má i to, jestli se na stránce vyskytují videa či obrázky, jestli má stránka hezké formátování, úpravu a obsahuje tedy pro návštěvníky poutavé prvky a je uživatelsky přívětivá. To jsou všechno aspekty, na které tento učící se algoritmus bere ohled.
Kvalita designu
Atraktivní stránky si vedou lépe oproti "ošklivým" stránkám.
Duplicitní obsah
Duplicitní, kradený nebo kopírovaný obsah je jednoznačně negativním faktorem.
Externí odkazy
Pokud odkazujete na weby s kvalitním obsahem, je pravděpodobnější, že i vaše stránka má větší hodnotu, než když neodkazujete nikam, nebo naopak na "nekvalitní" stránky.
Návštěvníky generovaný obsah (UGC - user generated content)
UGC je obsah, který na vaše stránky napíšou vaši uživatelé. Komentáře, dotazy, recenze a tak dále. Na dotazy pak přibudou i vaše odpovědi a tak uživatelé pomáhají generovat váš kvalitní obsah.
Co ještě
Neví se přesně jaké jsou faktory, které Google Panda vyhodnocuje při označení obsahových farem a nekvalitního obsahu, ale dobrou strategií je mít jednoduše na webu kvalitní obsah. Určitě je to těžká úloha například pro e-shop se statisíci výrobky, které byly masově naimportované od dodavatele. Ale pokud vám na vašem webu záleží, je potřeba dbát i na kvalitní obsah a to ne jen pro Pandu, ale především pro návštěvníky.
Další zajímavé zdroje informací o Google Pandě v angličtině:
Jak se Google panda projevila - kdo byl postižen a komu návštěvnost stoupla?
http://www.seomoz.org/blog/googles-farmer-update-analysis-of-winners-vs-losers
Rozhovor s Vanessa Fox, bývalou zaměstnankyní Google: na co se zaměřit pokud vám kvůli Pandě nedávno klesla návštěvnost webu:
http://www.webpronews.com/a-holistic-look-at-panda-with-vanessa-fox-2011-07
Jak Google Panda změnila nejlepší SEO praktiky navždy - SEOMOZ video
Google Panda je více hodnotícím faktorem, než vylepšením algoritmu - Danny Sullivan
http://searchengineland.com/why-google-panda-is-more-a-ranking-factor-than-algorithm-update-82564
"Tradiční" kritika Google a jeho Pandy od Aarona Walla na SEOBOOK.COM
http://www.seobook.com/google-panda-algorithm-exploit
Jak porazit Pandu, 5 největších chyb - SEOMOZ
[editováno 22.8.2011 ]
http://www.seomoz.org/blog/beat-google-panda
Pošlete svůj komentář