« Voulez-vous dépenser de l’argent en publicités ou résoudre cette boîte noire? »
Cette question (grossière) a aidé à déterminer le chemin de ma carrière il y a plus de 10 ans pour devenir le SEO que je suis aujourd’hui.
J’ai choisi cette voie parce que j’aime travailler sur les défis et chercher sous le capot ce qui fait que quelque chose se passe.
Cherchant à résoudre la réponse à la vie, à l’univers et à tout ce qui est donné avec l’aide de Google Deep Throat en tant que 42, puis en vérifiant que j’avais la bonne question (spoiler: c’est six fois neuf) est ce qui me passionne avec le référencement.
Et ce qui m’a amené à travailler sur cet article a été une excellente discussion sur Jeff FergusonMessage de si nous avions les calculs pour décoder l’algorithme de Googleet si oui, de quoi l’industrie avait-elle besoin?
Les deux choses nécessaires
Donc, pour ceux qui me connaissent, vous ne serez pas surpris de voir que je suis contre l’idée qu’une analyse de corrélation de base, même avec l’utilisation du coefficient de Spearman, est suffisante pour analyser l’algorithme de Google.
Publicité
Continuer la lecture ci-dessous
Depuis mon Présentation SMX East 2011, J’ai publiquement préconisé l’utilisation de régressions multi-linéaires comme minimum pour la façon dont on devrait analyser ce qui compte.
D’autres méthodes statistiques avancées, que ce soit l’apprentissage automatique ou les réseaux de neurones, ont leur rôle à jouer.
Mais pour cet article, je me concentre sur les régressions.
Une mise en garde importante à l’utilisation de méthodes statistiques est qu’un outil en lui-même ou ajouté à la fin ne constitue pas en soi une bonne étude.
C’est là qu’entre en jeu les bonnes compétences en analyse de données avec une expérience en référencement.
Comme on l’a vu à plusieurs reprises avec les analyses COVID-19, le simple fait d’avoir une expérience d’analyste de données n’est pas suffisant pour affirmer que l’on peut résoudre des problèmes dans un message Medium ou Twitter par rapport à des experts en épidémiologie.
Et tandis que quelques peut sembler aider à fournir des idées précieuses à partager, la majorité prédominante se passe une forte prudence avec humilité permettre à la désinformation de se répandre.
Dois-je rappeler à l’industrie ce qui se passe quand La désinformation SEO se répand dans l’actualité par des non-spécialistes de la recherche?
Publicité
Continuer la lecture ci-dessous
Le « Je ne suis pas un statisticien, mais … »
OK, alors qu’est-ce qui me donne le droit de pointer dans la direction des statistiques avancées pour les études?
Une maîtrise en relations internationales avec une concentration en économie internationale où j’ai appris l’économétrie et j’ai eu le plaisir de déchirer des articles d’économétrie sur l’économie chinoise.
Il y a une raison pour laquelle vous me trouverez sur Twitter en train de déchirer les études de corrélation SEO à mesure qu’elles sortent.
Alors, pourquoi des régressions?
Avant tout, il ne s’agit plus d’analyser une seule mesure de manière isolée.
Au lieu de cela, il s’agit de plusieurs mesures qui peuvent également interagir les unes avec les autres sur ce qui peut avoir un impact sur les classements.
Cela nécessite l’utilisation d’une régression multilinéaire au minimum sur ce seul point.
Au-delà de cela, s’éloigner de la concentration sur des métriques uniques et au lieu de parler des multiples facteurs poussent les référenceurs à penser plus largement à un ensemble complet de métriques sur lesquelles travailler pour améliorer le classement.
Et d’un autre côté, cela donne la priorité au travail, car 1000 métriques peuvent sembler décourageantes, mais si plus de 900 personnes déplacent à peine l’aiguille de 0,1%, la certitude sur laquelle travailler accélère les tâches d’optimisation.
En outre, l’utilisation de séries chronologiques avec des analyses de régression (où l’on analyse les facteurs sur une période de temps donnée plutôt qu’à un moment précis) peut aider à lisser les changements quotidiens ou hebdomadaires pour se concentrer sur les domaines clés, tout en fournissant un aperçu des quelles mises à jour majeures d’algorithme ont changé.
Et pour les agences qui cherchent à gagner en crédibilité, se tournent vers les domaines scientifiques pour savoir comment elles exécutent des analyses de régression sur des domaines complexes. Par exemple:
Et bien que rares, des soumissions spécifiques pour Documents de recherche SEO montez pour entrer.
De bonnes compétences d’analyse comptent
Logiquement, donner à quelqu’un un outil sans la bonne formation ne signifie pas que cela conduira automatiquement à de bons résultats.
Et c’est pourquoi avoir le bon état d’esprit curieux prêt à approfondir (comme un utilisateur expérimenté) et à mettre les données à travers la sonnerie complétera l’outil statistique avancé.
Publicité
Continuer la lecture ci-dessous
Cet état d’esprit fonctionnera pour déterminer:
- Quelles données collecter.
- Qu’est-ce qui a une qualité directionnelle.
- Ce qu’il faut supprimer avant même de commencer une analyse.
C’est une norme fondamentale qui nécessite une certaine expérience du référencement, en particulier pour reconnaître à l’avance quelles métriques peuvent être la cause sous-jacente et comment éviter les biais autour de la démographie, de la saisonnalité, de l’intention de l’acheteur, etc.
Et avoir cette expérience de référencement signifie également que l’analyse a de meilleures chances d’inclure effets d’interaction à analyser, en particulier lorsqu’une optimisation isolée peut ne pas être considérée comme du spam à moins qu’elle ne soit associée à d’autres tactiques. (Par exemple, du texte blanc dans un grand paragraphe sur un fond blanc sans moyen pour l’utilisateur de le voir)
De plus, sachant que Google n’utilise pas un seul algorithme monolithique, toute analyse devra inclure des catégories ou des groupes, que ce soit par:
- Intention des mots clés.
- Volume de recherche.
- Classement des positions.
- Les industries.
- Etc.
Publicité
Continuer la lecture ci-dessous
Raison de plus pour examiner le nuage de points des données pour vous assurer qu’il n’y a pas de problèmes tels que:
- Hétéroscédasticité: Données qui ventilent vers l’extérieur en raison de la variabilité inégale.
- Paradoxe de Simpson: Deux populations différentes montrant la même tendance qui, combinées ensemble, aboutissent à la tendance opposée.
Ainsi, les nuages de points ou les graphiques à moustaches sont indispensables dans ces analyses pour montrer que l’étude a évité les problèmes statistiques courants.
Avec les résultats, fournir un format de résultat de régression standard aide ceux qui ont des antécédents statistiques à examiner rapidement et facilement les conclusions sans avoir à exécuter séparément la régression juste pour revérifier la revendication des résultats.
Parce qu’une partie cruciale d’une étude statistique, et un échec commun au cours de nombreuses études SEO promues publiquement, les interprétations sont loin d’être raisonnables.
Trop souvent, les allégations crédules sont utilisées comme linkbait plutôt que comme éclaircies pour la communauté SEO.
Je me demande souvent quand je fouille dans ces études:
Publicité
Continuer la lecture ci-dessous
- L’ensemble de données exclut-il les valeurs aberrantes potentielles telles que Wikipedia ou Amazon?
- Comment l’étude gère-t-elle l’endogénéité lorsque le classement a un impact sur le CTR si la revendication est un CTR a un impact sur le classement?
- Une affirmation fantastique de classement ayant un impact direct sur le trafic a-t-elle l’extraordinaire preuve pour l’étayer?
- Pourquoi les classements sont-ils affichés sur l’axe X? Ok, ce dernier est plus ma bête noire.
Et c’est là qu’intervient l’examen par les pairs.
C’est une chose de revérifier son propre travail pour des inexactitudes.
L’examen par les pairs l’amène à un autre niveau en aidant à trouver les angles morts, à remettre en question les hypothèses formulées, à améliorer la qualité de l’étude et à établir l’adéquation du travail à la communauté SEO dans son ensemble.
Tout cela en une seule fois?
Dans un monde idéal, oui!
En réalité, il faudra probablement quelques étapes (et faux pas) pour y arriver.
Et moi, et de nombreux référenceurs à l’esprit statistique, ne demandons pas à suivre un seul exemple.
Pour générer des idées de modèles, jetez un œil à:
Publicité
Continuer la lecture ci-dessous
Voir Hulya Cobanl ‘article sur comment rédiger une étude de régression ainsi que utiliser Python pour exécuter un modèle de régression linéaire.
C’est là que l’industrie du référencement doit aller si nous voulons vraiment comprendre ce qui se passe dans l’algorithme de Google, construire une base solide de confiance dans les études et arrêter la désinformation.
Qu’en est-il de cette étude qui …
OK, ça dépend.
Ou plus précisément, il existe des exceptions acceptables et certaines contre-points de Russ Jones cela devrait être pris en compte lorsque les études de corrélation et les mesures logicielles ont de la valeur.
Je n’ai rien contre l’utilisation privée des études de corrélation pour faire un cas d’utilisation interne.
Ayez à lui.
Le temps est précieux dans le monde des affaires, alors utilisez ce que vous pouvez et acceptez-le en cas d’échec.
Publicité
Continuer la lecture ci-dessous
Dans le domaine public, les quelques études valables ont été bien pensées en utilisant le bon cadre analytique avec les bons soins écrits ou en mettant l’accent sur les changements d’une année à l’autre dans les SERPs de Google.
Et les articles mettant en évidence la méthodologie avec la transparence des données nécessitent des éloges bien mérités pour leur ouverture.
Par ailleurs, il existe des études de test en direct SEO via des outils tels que SearchPilot.
Celles-ci sont plus structurées mathématiquement et j’ai travaillé avec des développeurs pour les construire en interne et j’ai présenté publiquement leur valeur depuis 2011.
Ainsi, les travaux de ces études de utilisation des titres PPC pour le référencement à la expériences réalisées sur Pinterest sont un excellent tremplin si vous avez l’immense trafic nécessaire.
Allons vers le haut
En dehors de cela, les méthodes statistiques avancées et de solides compétences en analyse de données avec une expérience en référencement sont indispensables pour ce que l’industrie doit réaliser.
Et il y a suffisamment de référenceurs statistiquement prêts à aider, à examiner et à fournir des suggestions pour que les études deviennent faisant autorité.
Publicité
Continuer la lecture ci-dessous
Oui, il y a beaucoup de critique lourde dans les fils Twitter par ces référenceurs chaque fois qu’une nouvelle étude sort, mais c’est du souci de la réputation de l’industrie pour éviter que le point d’une étude ne soit mal interprété, poussant un mauvais référencement et le désir pour les autres d’apprendre à mieux analyser un système compliqué.
Et tandis qu’un le modèle de régression multilinéaire n’est pas parfait étant donné la nécessité de s’appuyer sur des données historiques et la quantité de maintenance au fil du temps qui peut autrement créer un biais dans les résultats, il s’agit toujours d’un pas dans la bonne direction pour l’industrie du référencement qui devient plus statistiquement orientée.
En bref…
Si vous disposez de l’immense quantité de données (ainsi que du temps et des ressources) nécessaires pour faire ce droit et que vous souhaitez devenir la première agence de référencement, consultant, etc., à le faire dans l’industrie, voici ce qui sera nécessaire:
- Un modèle statistique avancé comme les régressions multilinéaires.
- Un état d’esprit curieux avec une expérience SEO.
- Un grand ensemble de métriques, de taille réduite par celles de qualité directionnelle.
- Métriques d’interaction.
- Groupes et catégories de données.
- Une période de temps supérieure à une semaine.
- Endogénéité, hétéroscédasticité et autres biais examinés.
- Les données aberrantes, le cas échéant, supprimées.
- Méthodologie expliquée.
- Travail présenté avec des nuages de points et des formats de données de régression.
- Réclamations appuyées par une quantité suffisante de preuves.
- Données et analyses examinées par des pairs.
Publicité
Continuer la lecture ci-dessous
Plus de ressources: