Tag Archive for 'duplicate content'

De tijd staat stil in de Reyerslaan

Ik ben een verwoed lezer van de nieuws website van de VRT : DeRedactie.be.
Bij gebrek aan beter wel te verstaan.

Nu kijk ik al weken naar de economie pagina die al die tijd dezelfde grafiekjes toont voor de olieprijs, de dollarkoers en de rente koersen.
Klaarblijkelijk blijft er iets hangen want die zijn al die tijd exact hetzelfde gebleven. Maar ik zou dan toch verwachten dat dat werd opgemerkt op de redactie maar klaarblijkelijk gebeurt dat niet. Ondanks de heel vele miljoenen die in het internet project werden gepompt.

Screenshotje :
Screenshot economie koersen DeRedactie.be

Maar dat is niet alles, wanneer ik zoek naar"DeRedactie.be" zie ik dat op Sporza.be (de sport afdeling van de VRT) Exact dezelfde economie pagina te vinden is.
Duplicate content dus.

Verder volgde ik op dat Sporza met belangstelling hoe men de Olympische Spelen ging integreren. Vooral omdat een dag voor de Olympische Spelen begonnen er op Sporza zelf eigenlijk amper iets over te vinden was. Maar het was uiteraard aan mezelf te wijten. Ergens heel ver in een hoekje stond toch wel een link naar de Olympische Spelen afdeling.
De Olympische Spelen begonnen en nog steeds zag ik op de reguliere Sporza.be amper nieuws over de Olympische Spelen. Allicht weer niet goed gekeken.
Langzaamaan echter begon er toch wat meer te verschijnen, allicht omdat er nogal veel mensen last hadden om de Olympische Spelen Sporza internet versie te vinden.
En na een 5-tal dagen speelde men het zelfs klaar om af en toe een berichtje over de Olympische Spelen in het Sporza overzicht te laten verschijnen.

Mooi zo! Alhoewel ik van mening ben dat elk Olympische Spelen nieuwtje daar behoort te komen. Sport is sport zou ik zeggen.

Zouden ze bij de VRT eens niet wat gaan nadenken over hoe bezoekers en zoekmachines reageren op een website?
Ik denk dat het daar dringend tijd voor is.

UPDATE : En kijk, blijkbaar lezen ook de mensen van deRedactie.be deze blog … Alles werkt weer zoals het hoort.
Ga ik nu van de VRT een cheque mogen verwachten? 🙂

 

Google stapt af van toegevoegde zoekresultaten

Google kondigt via de Google webmaster blog aan dat ze zijn afgestapt van de toegevoegde zoekresultaten(=supplemental results).
Eind juli stond er al te lezen dat ze er aan werkten om de supplemental index te herwaarderen en de pagina’s in de supplemental index vaker te spideren en betere mogelijkheden tot ranken te geven.

Nu kondigt men dus aan dat men na het verwijderen van het label ook volledig afstapt van deze supplementaire index die eerder was gecreeerd om meer pagina’s te kunnen opnemen in de zoekindex. De pagina’s die in de supplementals terecht kwamen hadden wel een handicap ten opzichte van de pagina’s die in de reguliere index zaten.

Dit systeem was misschien redelijk nuttig voor de Engelse taal maar bij kleinere talen gaf het vaak problemen en belandden de relevantere pagina’s niet op de plaats waar ze volgens relevantie zouden moeten ranken. Dit door een gebrek aan sterkte vooral(of duplicate content).

De supplemental index kwam er als ik het mij goed herinner in het heetst van de strijd tussen Yahoo! en Google om het meeste pagina’s in de index te hebben.

Als Google daadwerkelijk de supplemental index opheft dan is dat waarschijnlijk een goede zaak. Minder sterke pagina’s gaan nu meer kans hebben om op de plaats te belanden die ze verdienen. Doch wordt er hier en daar gemeld dat er nu ook pagina’s zijn die niet langer meer in Google’s index zitten.

Een goede zaak dus op voorwaarde dat Google hier de waarheid vertelt want daar is bij sommige mensen in de zoekmachine optimalisatie wereld nogal wat twijfel over.

 

De meest gemaakte SEO fouten bij bedrijfswebsites

Wanneer je zo een beetje rond surft op het wereldwijde web en je bekijkt de websites van bedrijven dan kom je soms tot verrassende vaststellingen omtrent de zoekmachine vriendelijkheid van die websites.

Enkele van de meest gemaakte fouten :
1) Het ontbreken van een degelijke html sitemap.
2) Een niet geoptimaliseerde url structuur.
3) Een slecht gebruik van de titel tag en de meta description en keywords.
4) Het gebruik van frames allerhande.
5) Duplicate content binnen de eigen site door op verschillende manieren naar urls te verwijzen.
6) Een gebrek aan promotie qua zoekmachine optimalisatie. Beter gezegd te weinig inkomende linken.
7) Verwaarlozing interne link structuur.
8) De site enkel gebruiken als visitekaartje.
9) Het klakkeloos verwijderen van oude pagina’s terwijl er nieuwe worden aangemaakt die op hun beurt weer zullen worden verwijdert.
10) Een overmatig gebruik van flash objecten binnen de site.
11) Anoniem willen blijven of het niet goed presenteren van het bedrijf.

Dit zijn stuk voor stuk punten die op vele websites worden verwaarloost terwijl het perfect mogelijk is om uit deze dingen voordeel te halen.
We lichten even toe :
1) Een html sitemap is absoluut nodig. Een zoekrobot moet zo snel mogelijk zo veel mogelijk pagina’s kunnen bereiken bij zijn bezoek aan uw site. De sitemap verdeelt ook interne pagerank over de pagina’s wat deze pagina’s meer sterkte geeft en meer kans op succes om te scoren in de SERP‘s.

2) De url structuur van een website kan het praktische ook aan het nuttige koppelen. Sleutelwoorden in de url tellen mee in de zoekmachine algoritmes. Urls die eindigen op index.cfm?c=4355Ykgk&m=frtkhlk zijn niet echt behulpzaam, /zoekmachine/google/ bijvoorbeeld is dat wel. Zowel voor de zoekmachine rankings als voor de bezoeker. Urls zijn vaak bewerkbaar via .htaccess op linux servers met mod_rewrite en op windows servers met ISAPI_rewrite.

3) De titel tag verschijnt helemaal linksboven in de browserbalk en is tevens een zeer belangrijk factor bij zoekmachine optimalisatie.
De meta description verschijnt dan weer vaak bij de presentatie op SERP’s van uw pagina/site en is dus het eerste advertentie blok waar u bezoekers mee kan lokken.
De meta keywords tag is minder belangrijk maar het is een kleine moeite om deze even mee te nemen als u toch bezig bent.
In de meta description kunt u best enkele sleutelwoorden gebruiken maar hou er vooral rekening mee dat dit uw lokkende tekst wordt die zoekmachine bezoekers te zien krijgen.
De titel tag is uitermate belangrijk, u houdt deze best vrij kort en verwerkt er de belangrijkste sleutelwoorden in.
Maar er is meer, u moet deze factoren ook per pagina zo uniek mogelijk maken. Anders loopt u het risico door een duplicate content bestraffing te worden achteruit gesteld.
Voor het bepalen van duplicate content kijkt Google bv als eerste naar deze 3 dingen(title, description en keywords).
Bovendien handelt elke pagina vermoedelijk wel over iets anders dus is het aan te raden deze sterke algoritme factor maximaal te benutten.

4) Het gebruik van frames is sterk af te raden. Google leest enkel de broncode van een pagina, bij gebruik van frames staat daar enkel een verwijzing naar de locatie van het frame. Yahoo heeft hier iets minder last mee maar het uiteindelijke gevolg is toch altijd dat de frame pagina’s zonder navigatie en de rest van de (bedoelde) zichtbare pagina in de zoekmachine indexen belanden.
Dat houdt vooral in dat er geen linken staan naar uw homepagina of andere elementen binnen uw site. Zeer gebruiksonvriendelijk voor de lezer EN de zoekrobotten.

5) Binnen de eigen site hebt u soms verschillende urls die dezelfde content weergeven. Zo kan je deze blog bereiken via de gebruikelijke domeinnaam deinternetmarketeer.be maar ook via deinternetmarketeer.be/index.php en mocht ik er geen mouw hebben aangepast ook via www.deinternetmarketeer.be en www.deinternetmarketeer.be/index.php.
Dat zijn dus 4 mogelijke urls die hetzelfde voorschotelen. Dat kan leiden tot een duplicate content probleem maar ook verdeelt het de sterkte bedoelt voor 1 pagina over 4 pagina’s(wanneer men naar de verschillende versies linkt). U hebt liever 1 sterke pagina dan 4 kwartsterktes die hetzelfde presenteren maar minder scoren?
Vaak wordt deze fout gemaakt door designers van websites. Is het niet via de navigatie dan gebeurt het wel door de link die achter het logo van het bedrijf zit.

6) Het is niet zo dat wanneer u uw site aanmeldt bij zoekmachines dat deze automatisch wordt opgenomen. Het is zelfs niet zo dat u zeker gaat worden opgenomen. Een zoekmachine bekijkt na een aanmelding enkel uw link en weegt deze om te zien of ze wel genoeg bruikbaar en nuttig is voor zoekers.
Uw site moet een zekere sterkte krijgen op allerlei gebied vooraleer u daadwerkelijk in aanmerking komt om te worden opgenomen. Nog belangrijker wordt dit allemaal om de rankings te bepalen. U wilt toch ook zo hoog mogelijk staan in de zoekresultaten?
Er zijn 2 relatief belangrijke factoren die bijdragen tot sterkte van een site.
Trust : Een soort van geloofwaardigheidsscore van uw site. Hierbij speelt leeftijd van het domein/de site een rol net als de externe linken die u plaatst in uw website en tevens de externe linken naar uw site.
Pagerank : Een soort van kwaliteitsscore op basis van linken op het hele internet. Des te hoger de kwaliteit van de site waarop iemand een link naar u plaatst, des te meer gewicht brengt deze link naar uw site. Dit geldt deels ook binnen uw site.
Zorg ook voor goede linkteksten(zichtbare gedeelte van een link) aangezien de woorden hier gebruikt ook een belangrijke factor zijn voor zoekmachines om het onderwerp van uw pagina te bepalen.
Merk op dat de toolbar pagerank die zichtbaar is gemaakt door Google niet representatief is voor echte pagerank.

7) Heel veel sites vergeten dat ze binnen de site ook kunnen linken. Deze linken tellen uiteraard ook mee. Interne linken moeten op 3 manieren worden gebruikt :
– Om linktekst toe te wijzen aan een pagina
– Om diepe pagina’s zo snel mogelijk vindbaar te maken voor zoekrobotten
– Om de toegewezen kracht van een website te verdelen over alle pagina’s binnen die site waarvan u wenst dat die pagina’s goed scoren.

8) Gebruik uw site niet louter als een visitekaartje. Als u dan toch actief bent op het internet schrijf dan wat pagina’s over uzelf, over uw kennis van het onderwerp of gewoonweg pagina’s om bezoekers te lokken. Websites als visitekaartje is mooi maar waardeloos op seo gebied. U laat een heel gebied onontgonnen.

9) Verwijder geen pagina’s omdat er een nieuw seizoen is aangebroken of dergelijke. Als u pagina’s toch verwijdert doe er dan via .htaccess een 301 redirect op naar de meest relevante pagina binnen uw site zodat de sterkte van de pagina niet verloren gaat.
Indien u bijvoorbeeld telkens er een nieuw seizoen is oude pagina’s verwijdert en nieuwe toevoegt dan gaat de net opgebouwde kracht van die pagina’s verloren terwijl de nieuwe pas tegen volgend seizoen dezelfde kracht terug hebben opgebouwd.
Niet doen! Organiseer uw website op zulk een manier dat u een geraamte hebt dat altijd dienst kan doen en telkens maar weer sterker kan worden. Bv : reizen, verdeel uw website in landen secties. Verdeel die op hun beurt in regio secties enzoverder.
Op die manier verliest u zo weinig mogelijk van de reeds opgebouwde sterkte versus telkens terug opnieuw te moeten gaan bouwen vanaf 0.

10) Flash objecten op uw site kunnen een toegevoegde waarde betekenen. Doch is het belangrijk er rekening mee te houden dat deze objecten niet leesbaar zijn voor zoekmachines. Informatie ingebouwd in flash objecten gaat verloren voor de zoekmachines.
Tevens wordt het al snel druk op een website met vele bewegende of kleurrijke objecten. Hou het sober, vermoei uw kijkers niet opdat ze zonder probleem(oogvermoeidheid) door uw site kunnen waden.

11) Stel uzelf voor, wees informatief. Maak een “Over ons bedrijf” pagina waar u de medewerkers voorstelt, de sector waarmee u zich bezig houdt en zo verder. Mensen weten graag bij wie ze terecht komen.

Tips :
– Optimaliseer niet voor zoektermen die geen bezoekers lokken of steek er zo weinig mogelijk tijd in(prestige is soms ook een factor voor een zoekterm)
– Hou uw lezers op de hoogte van het reilen en zeilen binnen uw bedrijf via een weblog. U kan hier telkens de laatste nieuwtjes vermelden en kan eventueel hier en daar wat pagina’s extra kracht meegeven door er een linkje naar te plaatsen
– Zet geen publiek bekijkbare teller op uw site die belangrijke gegevens vermeldt. Uw concurrentie kan zonder probleem de gegevens van uw site optimaliseren voor eigen gebruik.
– Huur een seo consultant in als u niet zeker bent van uw stuk

 

Copyscape

Copyscape is een uitstekend tooltje om te bekijken of de inhoud van je website elders wordt gebruikt.

Indien andere websites uw inhoud overnemen kan dat een gevaar voor uw rankings opleveren owv een duplicate content probleem.

Zoekmachines hebben een filter zitten die controleert of de inhoud van deze pagina origineel is. Als dat niet zo is zal de website minder goed ranken. U kan daarmee ook een probleem krijgen omdat het algoritme(waar de filter deel van uitmaakt) de kopierende site als de originele beschouwt.

Copyscape controleert het web op zoek naar kopieen van uw eigen site en geeft u, indien die er zijn, de locatie van de kopies.

Website : Copyscape

 

Toegevoegde zoekresultaten

De toegevoegde zoekresultaten zijn beter gekend met de Engelse term, supplemental results.

Toegevoegde zoekresultaten? Waar?

De toegevoegde zoekresultaten zijn te herkennen in de Google pagina’s. In het groen staat bij elk resultaat de url en de grootte van het bestand. Wanneer daarachter de melding toegevoegde zoekresultaten verschijnt bevindt deze zich in de 2e db van Google.
www.site.nl/?pagina=11 – 41k – Toegevoegde zoekresultaten –

Wat zijn nu de toegevoegde zoekresultaten?

Google opereert grofweg met 2 grote databases waaruit het de zoekresultaten haalt alvorens deze aan de gebruiker getoond worden. De hoofdindex bevat de belangrijkste resultaten en de toegevoegde resultaten eerder de, in Google’s ogen, minder belangrijke resultaten.

Toekomst en verleden toegevoegde zoekresultaten?
Vroeger (en momenteel nog grotendeels van toepassing) kwam men vooral in de toegevoegde resultaten terecht vanwege duplicate content, gedupliceerde of te sterk op elkaar gelijkende pagina’s.
Er zijn nog tal van andere redenen natuurlijk en momenteel wordt deze db met resultaten alsmaar sneller door Google aangesproken om de pagina’s van sites in op te bergen. Dit is wellicht een overgangsfase voor deze db die wellicht ergens dit jaar zijn nieuwe functie volwaardig zal opnemen.
Momenteel worden de toegevoegde resultaten niet zo snel aangesproken. Er zijn vermoedens dat ze pas in beeld komen wanneer er bij een zoekopdracht minder dan 1000 resultaten in de hoofdindex te vinden zijn. Wanneer dit gebeurt neemt Google ook een kijkje in de toegevoegde resultaten en voegt deze bij de resultaten uit de hoofdindex.

Het heeft er echter alle schijn naar dat Google in de toekomst de 2 databases dichter bij elkaar gaat brengen. Dit is momenteel al het geval op 1 datacenter waar men allicht eerst mee test alvorens de toekomstige veranderingen definitief door te voeren. Wanneer dit werkelijkheid wordt zal Google de hoofdindex dus gebruiken om de allerbelangrijkste resultaten te herbergen, de andere db zal meer gebruikt worden als volwaardige 2e index.
Dit zou kunnen te maken hebben met een reorganisatie voor het opbergen van de informatie die ze vinden op het internet. Door het steeds groeiende aanbod aan websites zien zij zich genoodzaakt om maatregelen te nemen om dit op te vangen. Dat zal dan waarschijnlijk uitdraaien op het zo fris mogelijk houden van de hoofdresultaten en het ietsje minder intensief updaten van de toegevoegde zoekresultaten.

Oorzaken om in de toegevoegde resultaten te belanden?

Duplicate content : te sterk op elkaar lijkende pagina’s of gekopieerde inhoud
– Te onbelangrijke pagina : een pagina die amper links heeft en bijgevolg als niet belangrijk wordt beschouwd door Google
Overtreding regels : pogingen tot spammen in het verleden of andere overtredingen tegen de Google regels
– Pagina’s bestaan niet langer : oudere pagina’s die inmiddels zijn verwijdert maar nog steeds in de db van Google zitten
SEO onvriendelijke urls : dynamische urls met veel parameters in de url. Google heeft nog steeds problemen met het indexeren van zulke urls.
– Andere oorzaken …

Mogelijke oplossingen?

– Bij duplicate content oorzaken is het belangrijk er voor te zorgen dat de titel en inhoud zo uniek mogelijk zijn voor elke pagina
– Bij het in het verleden overtreden hebben van de Google regels moet u ervoor zorgen dat elke inbreuk tegen de regels opgelost wordt
– Pagina’s die niet langer bestaan kunnen best via een 301 redirect worden doorverwezen naar een soortgelijke pagina

Maar in alle gevallen moet u er tevens voor zorgen dat u nieuwe kwaliteitsvolle en relevante links naar uw pagina laat verwijzen. De interne linkstructuur moet tevens zo goed als mogelijk de waarde van de site over de hele website verspreiden.
Bij het zoeken naar links is het tevens zeer bevorderlijk deeplinks naar de bewuste pagina’s te verkrijgen.