Regex et le referencement naturel (SEO) une astuce moderne

par | Oct 20, 2022 | Seo | 0 commentaires

Prenez le contrôle de vos données et filtrez ce qui ne vous aide pas à améliorer votre stratégie de recherche. Apprenez comment avec ce guide sur les regex pour le référencement.

Débloquez et accédez à vos données SEO les plus précieuses

Texte du lien

 

 

Vous avez peut-être entendu parler de regex mais vous ne savez pas trop comment elle peut être utilisée dans le référencement ou si elle s’intègre dans votre propre stratégie.

Les expressions régulières, ou ‘regex’, sont comme un langage de programmation en ligne pour les recherches de texte qui vous permettent d’inclure des chaînes de recherche complexes, des correspondances partielles et des caractères génériques, des recherches insensibles à la casse et d’autres instructions avancées.

Vous pouvez les considérer comme la recherche d’un modèle plutôt que d’une chaîne de texte spécifique.

Par conséquent, ils peuvent vous aider à trouver des ensembles complets de résultats de recherche qui, à première vue, peuvent sembler avoir peu en commun les uns avec les autres.

Les expressions Regex sont un langage à part entière et la première fois que vous en voyez un, il peut sembler assez étranger.

Mais ils sont assez faciles à apprendre et peuvent être utilisés avec JavaScript , Python et d’autres langages de programmation, ce qui en fait un outil de référencement polyvalent et puissant.

Dans ce guide, vous apprendrez les opérateurs regex courants, comment utiliser des filtres regex plus avancés pour le référencement, comment utiliser regex dans Google Analytics et Google Search Console, et plus encore.

Vous trouverez également des exemples de regex au travail de différentes manières dans le référencement.

À quoi ressemble Regex ?

Une expression régulière comprend généralement une combinaison de texte qui correspondra exactement dans les résultats de la recherche, ainsi que plusieurs opérateurs qui agissent davantage comme des caractères génériques pour obtenir une correspondance de modèle plutôt qu’une correspondance de texte exacte.

Cela peut inclure un caractère générique à caractère unique, une correspondance pour un ou plusieurs caractères, ou une correspondance pour zéro ou plusieurs caractères, ainsi que des caractères facultatifs, des sous-expressions imbriquées entre parenthèses et des fonctions « ou ».

En combinant ces différentes opérations ensemble, vous pouvez construire une expression complexe qui peut atteindre des résultats très étendus, mais très spécifiques.

A lire  Apprenez à trouver de puissants domaines expirés étape par étape

Opérateurs Regex communs

Voici quelques exemples d’opérateurs regex courants :

. Une correspondance générique pour n’importe quel caractère unique.

.* Une correspondance pour zéro ou plusieurs caractères.

.+ Une correspondance pour un ou plusieurs caractères.

d Une correspondance pour tout chiffre numérique unique compris entre 0 et 9.

? Inséré après un caractère pour en faire une partie facultative de l’expression.

| Une ligne verticale ou un caractère « tuyau » indique une fonction « ou ».

^ Utilisé pour indiquer le début d’une chaîne.

$ Utilisé pour indiquer la fin d’une chaîne.

( ) Utilisé pour imbriquer une sous-expression.

\ Inséré avant un opérateur ou un caractère spécial pour « l’échapper ».

Certains langages de programmation, tels que JavaScript, autorisent l’inclusion de « drapeaux » après le modèle de regex lui-même, et ceux-ci peuvent encore affecter le résultat :

g Renvoie toutes les correspondances au lieu de la première seulement.

i Renvoie des résultats insensibles à la casse.

m Active le mode multiligne.

s Active le mode ‘dotall’.

u Active la prise en charge complète d’Unicode.

y Recherche la position de texte spécifique (mode ‘collant’).

Comme vous pouvez le voir, ensemble, ces opérateurs et indicateurs commencent à se constituer en un langage logique complexe, vous donnant la possibilité d’obtenir des résultats très spécifiques sur de grands ensembles de données non ordonnés.

Comment utiliser Regex pour le référencement ?

Regex peut être utilisé pour explorer les requêtes utilisées par différents segments d’utilisateurs, quelles requêtes sont communes à des zones de contenu spécifiques, quelles requêtes génèrent du trafic vers des parties spécifiques de votre site, etc.

Boostez votre contenu avec l’analyse de l’intention des mots clés
Avec la métrique d’intention de mots clés de Semrush, il n’a jamais été aussi facile d’aligner rapidement vos mots clés avec le bon public et le bon contenu.

Dans cet article , Hamlet Batista a montré comment utiliser regex en Python pour analyser les fichiers journaux du serveur, par exemple.

Et dans celui-ci , Chris Long vous a montré comment utiliser regex pour extraire la position, l’élément et le nom des fils d’Ariane associés à chaque URL de votre site dans le cadre d’un processus évolutif de recherche et de segmentation de mots clés.

Google encourage les professionnels du référencement à partager des exemples d’utilisation de regex sur Twitter en utilisant le hashtag #performanceregex .

Voici quelques conseils de SEO Twitter (vous remarquerez que c’est un hashtag assez silencieux – ajoutez vos propres exemples si vous en avez !) :

A lire  Citation Building pour un SEO Local Efficace : Concept

Utiliser Regex sur Google Analytics

L’une des utilisations les plus courantes de regex pour le référencement est dans Google Analytics , où les expressions régulières peuvent être utilisées pour configurer des filtres afin que vous ne voyiez que les données que vous souhaitez voir.

En ce sens, l’expression est utilisée pour exclure des résultats, plutôt que pour générer un ensemble de résultats de recherche inclusifs.

Par exemple, si vous souhaitez exclure des données des adresses IP sur votre réseau local, vous pouvez filtrer 192.168.*.* pour supprimer la plage complète de 192.168.0.0 à 192.168.255.255.

Filtres SEO Regex plus avancés

Comme exemple plus complexe, imaginons que vous ayez deux marques : regex247 et regex365.

Vous pouvez filtrer les résultats qui correspondent à n’importe quelle combinaison d’URL contenant ces noms de marque, comme regex247.biz ou www.regex365.org.

Une façon de le faire est d’utiliser une expression « ou » assez simple :

.*regex247.*|.*regex365.*

Cela supprimerait toutes les URL correspondantes de vos données Analytics, y compris les chemins de sous-dossiers et les URL de pages spécifiques qui apparaissent sur ces noms de domaine.

Un mot d’avertissement

Il convient de noter que, comme pour votre fichier robots.txt, une expression regex mal écrite peut assez facilement filtrer la plupart ou la totalité de vos données en incluant une correspondance générique illimitée.

La bonne nouvelle est que dans de nombreux cas de référencement, le filtre n’est appliqué à vos données qu’au stade du rapport, et en modifiant ou en supprimant votre expression regex, vous pouvez restaurer une visibilité complète sur vos données.

Vous pouvez également tester des expressions régulières sur un certain nombre d’outils de test en ligne, afin de voir si elles atteignent le résultat escompté, ce qui vous permet de « sandboxer » vos expressions regex avant de les lâcher sur l’ensemble de votre ensemble de données.

Pour créer des filtres regex sur Google Analytics, accédez d’abord au type de rapport que vous souhaitez créer (par exemple, Comportement > Contenu du site > Toutes les pages ou Acquisition > Tout le trafic > Source / Support ).

Sous le graphique, en haut du tableau de données, recherchez la zone de recherche et cliquez sur avancé pour afficher les options de filtre avancées.

Ici, vous pouvez inclure ou exclure des données en fonction d’une dimension ou d’une métrique particulière. Dans la liste déroulante après avoir sélectionné votre dimension, choisissez Matching RegExp , puis saisissez votre expression dans la zone de texte.

A lire  Web Crawler Online

‘Ou’ Et ‘Et’ Dans Google Analytics Regex

Pour créer une expression « ou » dans Google Analytics, incluez simplement le caractère pipe (le | symbole de trait vertical) entre les segments appropriés de votre expression.

Les expressions régulières de Google Analytics ne prennent pas en charge les instructions « et » dans une même expression régulière ; cependant, vous pouvez simplement ajouter un autre filtre pour y parvenir.

Sous votre première expression régulière, cliquez simplement sur Ajouter une dimension ou une métrique et entrez votre prochaine expression régulière. De cette façon, vous pouvez empiler autant d’expressions que vous le souhaitez et elles seront traitées comme une seule instruction « et » logique lors du filtrage de vos données.

Utilisation de Regex dans la console de recherche Google

En 2021, Google Search Console a commencé à prendre en charge la syntaxe Re2 de regex, permettant aux webmasters d’inclure et d’exclure des données dans l’interface utilisateur.

Vous trouverez tous les métacaractères pris en charge par Google Search Console dans cette référence de syntaxe RE2 regex sur GitHub.

Au moment de la rédaction, il y a une limite de caractères de 4096 caractères (ce qui est généralement suffisant…).

Les exemples que vous pouvez utiliser dans la Search Console peuvent être le filtrage des requêtes contenant une marque spécifique et les variantes que les utilisateurs peuvent saisir, comme Facebook :

.*facebook.*|face*book.*|fb.*|fbook.*|f*book.*

Filtrez les utilisateurs qui trouvent votre site Web à l’aide de termes d’intention « commercial » :

.*(meilleur|top|alternatif|alternatif|vs|contre|examen*).*

Pourquoi Regex est-il important pour le référencement ?

Enfin, pourquoi tout cela est-il important ?

Eh bien, il s’agit de prendre le contrôle de vos données et de filtrer les parties qui ne vous aident pas à améliorer votre référencement – qu’il s’agisse de pages ou de parties particulières de votre site Web, du trafic provenant d’une source ou d’un support spécifique, ou de votre propre site local. données du réseau.

Vous pouvez créer des expressions régulières assez simples pour obtenir un filtre « inclure » ​​ou « exclure » ​​de base, ou écrire des expressions plus longues qui fonctionnent de manière similaire au code de programmation pour obtenir des résultats complexes et très spécifiques.

Les meilleurs logiciels pour créer des tunnels de vente B2B

Les meilleurs logiciels pour créer des tunnels de vente B2B

Naviguer dans le monde du marketing B2B peut souvent ressembler à une traversée en haute mer sans carte ni boussole. Heureusement, les tunnels de vente sont là pour nous guider vers des eaux plus calmes, transformant les prospects en précieux partenaires commerciaux....

Neuronwriter est-il meilleur que SurferSEO ? Notre avis

Neuronwriter est-il meilleur que SurferSEO ? Notre avis

Dans l'univers en constante évolution du référencement (SEO) et de la création de contenu, une nouvelle étoile montante capte l'attention des experts et des novices: Neuronwriter. Cet outil promet de révolutionner la manière dont nous approchons le SEO et la rédaction...

SGE Google Search : Révolutionner la Recherche en Ligne

SGE Google Search : Révolutionner la Recherche en Ligne

Le Search Google Engine (SGE) représente un pilier fondamental dans l'écosystème numérique actuel. En tant qu'outil dominant de recherche en ligne, Google SGE façonne la manière dont l'information est consultée, analysée et partagée par les internautes du monde...

Comprendre et mettre en l’attribut rel=canonical pour le SEO

Comprendre et mettre en l’attribut rel=canonical pour le SEO

L'Importance de rel=canonical dans la prévention du contenu dupliqué Les pages dupliquées sur un site web peuvent sérieusement compromettre son **optimisation pour les moteurs de recherche**. En conséquence, le site peut perdre son classement dans les résultats de...

Automatiser votre SEO sur WordPress avec Squirrly SEO

Automatiser votre SEO sur WordPress avec Squirrly SEO

Lorsque j'ai commencé à utiliser WordPress, j'ai vite réalisé l'importance d'une bonne gestion du SEO. Avec des sites web complexes, bourrés de galeries et de contenus divers, il est facile de se perdre dans un océan de permaliens. Ces derniers, s'ils ne sont pas...