Analyser en masse le contenu de page web

Analyser en masse le texte des pages web

Que ce soit pour découvrir le vocabulaire d'un domaine donné, pour analyser les termes utilisés par la concurrence ou pour analyser sémantiquement un site face à son principal concurrent, L'outil Scorpus vous propose simplement et gratuitement une solution. Cette vidéo vous propose de faire vos premiers pas avec l'outil avec la bonne méthodologie.

Comment analyser le texte de pages web ?

Pour tester ou utiliser l'outil : http://www.xtendo.fr/scorpus/

Pourquoi analyse en masse le texte de page web ?

Fréquemment, lors de la rencontre avec un nouveau client pour un besoin de référencement naturel, je suis confronté à des domaines que je ne connais pas et dont parfois le client ne maîtrise pas la totalité de la sémantique employée dans son secteur d'activité. Exemple : le vocabulaire pro VS le vocabulaire grand public.

Bien sûr, sans outils, je pourrais prendre mon temps, surfer de page en page et noter, me familiariser, apprendre de ce nouveau domaine. Mais le temps dans nos métiers manque souvent et il coûte cher, voilà pourquoi un tel outil.

Peu d'outils d'analyse sémantique il y a 10 ans

Il y a bientôt une dizaine d'année que j'utilse Scorpus, développé par mes soins, il me permettait enfin de me passer d'outils desktop, certes performants, mais susceptibles (encodage...) et mal adaptés à mon usage.

Aujourd'hui la donne est différente et quelques services en ligne répondent à ce besoin. Néanmoins, cet outil interne continue d'évoluer en parallèle à l'évolution de mon travail et de mes méthodes. La version présentée ici est assez différente de celle que j'utilise en production personnellement, mais l'essentiel est là. Bref, il y a 2 ou 3 ans, je mettais en partage la version limitée que voici.

SEO : Comment cet outil peut-il vous aider ?

Un exemple, rien ne vous empêche de comparer le corpus du site à promouvoir avec ceux des principaux concurrents qui trustent les premières places. Pour cela, même méthode : 

  • Récupérez les urls via la commande "site:" du site A
  • Lancez l'analyse, puis affichez les résultats.
  • Dans une autre fenêtre, récupérez les urls via la commande "site:" du site B
  • Lancez l'analyse, puis affichez les résultats.
  • Etc...
  • Et enfin comparez !

Souvent des choses importantes apparaissent, l'absence de certains termes, la marque trop présente, un volume de texte faible... Avec l'habitude, c'est un moyen efficace pour se construire l'image globale du site, pour évaluer points forts et faibles.

Fonctionnement de la version gratuite de Scorpus : 

  • Dans cette mouture, Scorpus supprime automatiquement les stops-words les plus communs, normalise les encodages, élimine certains éléments. L'analyse est ainsi assez bien préservée du "bruit" lié à la conception des sites internet.
  • Les liens ne sont pas analysés.
  • Seul le texte faisant parti du "corps" est intégré pour analyse.
  • Le nombre maximum d'adresses (urls) pour constituer les corpus est de 25.
  • Les PDS, DOC, vidéos ne sont pas pris en charge.
  • La gestion des corpus et analyses est désactivée.

Bonnes analyses de corpus et à bientôt ! 


Pour continuer votre lecture sur la thématique Référencement naturel

Partager l'article sur :

Lien permanent :

Tags : Référencement naturel, Rédaction de contenus, SEO référencement,

Commenter et noter cet article

Les commentaires pour cet article