Arhiva za ‘Google Webmaster Tools’ tag
Google Webmaster Tools sada sadrži Index Status
Juče je Google Webmaster Tools pokrenuo Index Status (dostupan pod sekcijom Health tj. Zdravlje) koji putem grafikona prikazuje broj indeksiranih stranica za vaš sajt tokom prošle godine.
Google navodi da je računanje ukupno indeksiranih stranca precizno. Ako vaš sajt sadrži dosta duplih URL-ova (zbog stvari kao što je praćenje parametara) i stranice uključuju kanonski atribut ili je Google na neki drugi način identifikovao i grupisao te duplirane adrese, računaće se samo kanonska verzija, a ne duplikati . Ove podatke takođe možete da dobijete submit-ovanjem XML Sitemaps, ali ćete samo videti ukupan broj indeksiranih stranica ako je vaš Sitemaps sveobuhvatan.
Napredna opcija nudi dodatne detalje:
Da bi vam ovi podaci imali smisla najbolji pristup je da se isključi Ever Crawled (Uopće indeksirano) i da se ostale mogućnosti gledaju zasebno a to su:
-
ukupano indeksirano (total indexed)
-
nije odabrano (not selected)
-
blokiran od strane robots.txt (blocked by robots)
Zbir ova tri broja tri daje je vam broj URL adresa koje Google trenutno razmatra. U gornjem primeru, Google gleda 252,252 URL adrese. Od toga 22.482 blokirano je od strane robots.txt, što je prilično realno s obzirom da se ovo uglavnom poklapa sa brojem blokiranih URL adresa pod Blocked URLs . Nažalost, sada je znatno teže pogledate listu tih URL adresa s obzirom da izveštaj o blokiranim URL adresama više nije dostupan u korisničkom interfejsu već samo API-ja. Kada izuzmemo blokirane URL adresa ostaje nam 229,770 URL adresa, što znači 74% URL-ova nije izabrano za indeks. Pitate se zašto je to tako, da li je to loše? Problem je u tome što se ovi brojevi gledaju bez konteksta pa je teško prosuditi. Ovaj problem je teško rešiti bez mnogo drugih podataka koji bi obezbedili kontekst. Google ističe da postoji mnogo razloga zašto neka URL adresa ne može biti izabrana za indeksiranje, Neki od razloga su:
-
URL radi preusmeravanje na drugu web stranicu
-
URL ima rel=”canonical” na drugu stranicu
-
Google algoritam je otkrio da je sadržaj na URL adresi suštinski slični drugoj URL adresi pa je uzet drugi URL da predstavlja taj sadržaj
Pitate se šta je sa Ever Crawled (Uopće indeksirano)? Ovaj podatak treba gledati odvojeno od ostatka jer se radi o ukupnom broj tj. broju svih ikada indeksiranih stranica. Na primer, indeksirano je 1,5 miliona URL adresa ali Google trenutno razmatra samo 252,252 URL adrese. Šta se dešava sa preostalih 1,2 miliona? U ovaj broj uključene su 404 stranice, sve koje su se vremenom pojavljivale, URL adrese koje više ne postoje, a možda čak i stvari kao što su CSS i JS fajlovi.
U svakom slučaju, veoma je teško dobiti kvalitetan uvid sa brojkom koju obezbeđuje Ever Crawled (Uopće indeksirano). Ako je ovaj broj znatno manji od veličine vašeg sajta, onda je ovaj broj zaista vrlo korisna jer je to pokazatelj da definitivno postoji neki problem koji bi trebalo da istražite. Međutim, kod do sada testiranih sajtova ovaj broj je znatno veći od veličine sajta.
Određivanje veličine sajta nije jednostavno, međutim oni koji imaju dobar osećaj za to mogu zaključiti da li je većina njihovih stranica indeksirana ili ne?
Google promjenio način izračunavanja prosječne pozicije rangiranja u pretraživanju
U pokušaju da pruži više točnosti o tome gdje je vaš web sajt rangiran za upite pretraživanja, Google je izvjestio mijenja način na koji izračunava prosječnu poziciju u izvješću upita za pretraživanje u Google Webmaster Tools i izvješću o optimizaciji pretraživanja u Google Analytics.
Nova definicija će sada uzimati samo prosjek najvišeg rangiranja vašeg sajta za sve upite pretraživanja, dok je Google prethodno izviještavo o prosječnoj poziciji rangiranja stranica na vašem web sajtu koje su se pojavljivale u Google-ovim rezultatima pretraživanja za određeni upit. Ranije bi u obzir uzimali sve pozicije vašeg rangiranja a potom i njihov prosjek, dok će sada uzimati samo najviše pozicije.
Primjer za ovu promjenu bi izgledao ozprilike ovako:
Recimo da neka osoba pretražuje na primjer “hotel” i da su se URL-ovi sa vašeg web sajta pojavili na pozicijama 3, 6 i 12. Neka druga osoba također pretražuje “hotel”, ovaj put URL-ovi sa vašeg web sajta su se pojavili na pozicijama 5 i 9. Ranije bismo imali prosjek svih ovih pozicija zajedno i Average Position (prosječna pozicija) bio nam bila 7. Sa ovom promjenom u izračunavanju prosječne pozicije, u obzir će biti uzete samo najviše pozicije na kojima se vaš sajt pojavio u svakom od pretraživajna. U slučaju prve osobe to je pozicija 3 a u slučaju druge to je pozicija 5, što dovodi do toga da je prosječnu pozicija 4.
U budućnosti će Google koristiti ovaj novi način izračun za utvrđivanje vaš prosječnog položaja.
Prosječna pozicija u Google Analytics
Prosječna pozicija u Google Webmaster Tools
Google će vas od sada upozoravati na duplirani sadržaj
Danas je Google Webmaster Tools lansirao novu poruku upozorenja kako bi vlasnici web sajta znali kada se pojedini URL ne pojavljuje jer ga Google vidi ga kao duplikat URL-a na drugom domenu. Na Google Webmaster Central blogu pružene su pojedinosti o tome kako Google prepoznaje duple klastere sadržaja i odabire "canonical" verziju tog klastera za prikaz u rezultatima pretraživanja.
Kada otkrijemo skupinu stranica sa dupliranim sadržajem, koristimo algoritme za odabir jednog reprezentativnog URL-a za taj sadržaj. Skupina stranica može sadržavati URL-ove sa istog sajta ili sa različitih sajtova, navodi se na Google blogu.
U slučajevima kada više URL-ova sadrži isti sadržaj (na primjer, zbog infrastrukture konfiguracije, dodatnih parametara ili internacionalizacije), postoji nekoliko opcija sa kojima vlasnici web sajta mogu Google-u ukazati koja je verzija "canonical".
Međutim, u nekim slučajevima, vlasnik web sajta ne iskoristi ove opcije za određivanje preferirane verzije ili se pak desi da Google odabere neku drugu verziju od one koju je vlasnika web sajta odredio.
Ova nova značajka upozorava vlasnike web sajta kada je "algoritam odabrao neki drugi URL, umjesto jednog od njegovih web stranica." Najčešćih razloga za to može biti:
-
Specifikacija od strane vlasnika sajta – ako ste preselili svoje domene ili ste implementirali rel=canonical atribut da ukazuje na to da je stranica na drugom domenu canonical, onda je to upozorenje jednostavna potvrda da je Google indeksirao to kao što ste naveli.
-
Regionalni web sajtovi – ako imate isti sadržaj na više regionalnih sajtova (na primjer, isti engleski sadržaj na domenima .com, co.uk i com.au), Google može indeksirati samo jednu verziju u slučaju ako niste konfigurirali regionalne informacije.
-
Pogrešna “canonicalization“ – stranica nehotice može koristiti atribut rel=canonical za specifiranje druge stranice kao canonical.
-
Loše konfiguriran server – loše konfiguriran hosting (posebno se događa sa djeljenim hostingom) može uzrokovati dva različita domena na kojima se prikazuje isti sadržaj.
-
Hakirani sajt – sajtovi su ponekad hakirani kako bi ukazivali na neke druge domene.
-
Ukradeni sadržaj – na blogu se navodi da "u rijetkim situacijama", Google može odabrati URL web sajta koja ima sadržaj ukraden od vas.
Google Webmaster Tools sada tretira poddomene kao unutarnje linkove
Google je promijenio način na koji se odnosi prema reporting linkovima unutar Google Webmaster Tools. Umjesto da smatraju poddomenske linkove kao vanjske linkove, sada će ih smatrati kao interne tj. unutarnje linkove.
Google je ovo objavio na svom Google Webmaster Blog-u, objašnjavajući da to vrijedi i za ne-WWW i WWW verziju kao i ostale poddomene u nazivu domena.
Većina ljudi smatra primjer.com i www.primjer.com za isti sajt, tako da smo se mi sa ovim promjenama prilagodili tome, tako da sada i u slučaju primjer.com i www.primjer.com, linkovi sa www i ne www verzije domena će biti kategorizirani kao interni linkovi. Također smo proširiti ovu ideju i na druge poddomene, budući da mnogi ljudi koji posjeduju vlastite domene posjeduju i njegove poddomene pa će tako linkovi sa na primjer honda.primjer.com ili mazda.primjer.com biti kategorizirani kao unutarnji linkove za www.primjer.com,
navodi Google u pojašnjenju.
Ono što ne može da se sazna iz ove objave i što za sada ostaje nejasno jeste kako će Google tretirati poddomene koji se pojavljuju u Google-ovim rezultatima pretraživanja i kako će Google-ov algoritam za linkove tretirati linkove sa poddomenama vašeg domena, tj. na koji način će određivati njihovu težinu?
Nedavno je Google također objavio da Sitelinks ostaju i da će se prikazivati 12 njih u rezultatima pretraživanja. Inače, Sitelinks su linkovi na specifične delove sajta. Oni se pojavljuju za upite koji nisu dovoljno precizni za Google pretraživač pa on ne može tačno da odredi na koji dio sajta korisnik treba da ide.