Télécharger cette fiche conseil au format PDF
1. Pourquoi segmenter sa base de données ?
Les bases de données clients sont de plus en plus volumineuses. Face à ce flot d’informations, il devient difficile de bâtir des campagnes de marketing efficaces et rentables. L’entreprise ne peut se différencier et accroître sa compétitivité qu’en améliorant la connaissance qu’elle a de ses clients et de ses produits. Le but de l’analyse client est d’en acquérir davantage, de les satisfaire et de les fidéliser.
De fait, l’analyse d’une base de données est un élément essentiel lorsqu’il s’agit de construire une stratégie de gestion de la relation client.
A ce jour, la seule façon efficace d’analyser une base de données, c’est de la segmenter.
Les avantages d’une relation client personnalisée :
– réduire la déperdition donc le coût des opérations promotionnelles par des offres ciblées et répondant directement aux besoins des différents types de consommateurs.
– améliorer le mix magasin avec un assortiment et un marketing adaptés à chaque implantation
– affiner et renforcer les primes à la fidélité, donc augmenter le panier moyen et la fréquentation
– au-delà des avantages économiques, instaurer une relation de plus grande proximité avec le client, donc favoriser les facteurs de différenciation
Encore aujourd’hui, les critères de segmentation empirique des clients sont d’ordre socio-démographique. En effet, on considère naturellement que les besoins et les comportements de consommation des clients sont étroitement liés à leur âge, leur sexe, leur profession, leurs revenus, etc. De plus, ces critères sont factuels et donc plus faciles à obtenir.
Or cette approche présente des risques importants (et croissants). En effet, on se rend compte et de plus en plus, que les caractéristiques socio-démographiques ne s’appliquent souvent pas. Un téléphone portable ou une voiture bas de gamme ne sont pas toujours achetés par les plus pauvres mais aussi par des personnes plus aisées qui accordent peu d’importance à la valeur image du produit et privilégient sa valeur d’usage. De même, certains types de vêtements de marque ou de produits de luxe (alimentaires, technologiques…) sont achetés par différentes couches de la population.
D’autres modes de segmentation sont donc nécessaires. Il s’agit de la définition des groupes de clients non pas à partir de ce qu’ils sont mais plutôt de ce qu’ils font.
2. Qu’est ce qu’une segmentation comportementale ?
« Segmentation » fait partie de ces termes fréquents dans l’univers du marketing, qui font référence à plusieurs notions parfois très différentes. Par exemple, la segmentation de marché. Celle-ci est réalisée généralement de manière empirique, sur la base de la connaissance par l’entreprise de son activité et de son environnement. Elle est issue de la réflexion stratégique et vise à définir un positionnement et une stratégie marketing. Cette démarche ne correspond donc pas à des techniques statistiques particulières.
La segmentation de base de données fait appel à une réflexion marketing en amont puis à des techniques statistiques pour découper les clients en groupes homogènes.
La segmentation comportementale est une méthode particulière de segmentation basée sur des comportements d’achats ou de consommation.
Ce découpage de la clientèle en groupes homogènes permet de discerner les facteurs de différenciation les plus importants pour le consommateur et de décider quels sont les clients sur lesquels il faut mettre davantage de moyens. Ensuite, il s’agira d’anticiper leur comportement en utilisant les techniques de scoring. Conçus à partir d’outils statistiques ou de data mining, les scores permettent de calculer des probabilités d’appétence, de rétention ou de capacité à acquérir un produit en analysant les correspondances entre le profil du client analysé et les clients détenant déjà le produit.
3. Comment faut-il procéder ?
L’algorithme de segmentation : méthode puissante mais peu opérationnelle
La segmentation opère un découpage de l’échantillon sur un critère unique qu’il faut spécifier en amont. Il peut s’agir de la rentabilité, du renouvellement de l’achat, ou de tout autre critère que l’on cherche à expliquer. L’algorithme de segmentation cherche alors à classer les variables explicatives que l’on prend en compte dans l’analyse, en fonction de leur pouvoir discriminant par rapport à cette variable à expliquer.
Schématiquement, la méthode fonctionne de la manière suivante :
On commence par choisir la variable que l’on souhaite expliquer (produit acheté, par exemple) et les variables susceptibles d’entrer en jeu (variables signalétiques, par exemple).
L’algorithme de segmentation calcule la répartition des individus sur la variable à expliquer (par exemple, le nombre de personnes ayant acheté chacun des produits).
Chaque variable explicative est “testée” : l’algorithme divise l’échantillon global en plusieurs échantillons correspondant aux modalités de la variable explicative si elle est qualitative ou à différentes tranches si elle est numérique. La répartition des individus sur la variable à expliquer est recalculée pour chacun des sous-échantillons. La variable permettant la répartition la plus différenciée est sélectionnée comme premier indicateur.
Le processus est ensuite reconduit sur chacun des sous-échantillons issus de ce découpage.
Le résultat final s’exprime sous la forme d’un arbre de décision. Cet arbre permet de prédire le comportement de n’importe quel individu nouveau (pour lequel les variables explicatives sont connues), par rapport aux différentes modalités de la variable à expliquer.
Comme on peut le constater, et malgré la puissance et l’intérêt de cette méthode, le résultat ne correspond pas tout à fait à la notion de segmentation telle qu’on l’entend de manière opérationnelle.
L’analyse typologique
La typologie correspond également à une méthode de découpage d’échantillons. Comme on va le voir, son fonctionnement et ses résultats se rapprochent davantage de ce que l’on attend généralement lorsqu’on parle de segmentation.
Contrairement à la segmentation qui privilégie une seule variable à expliquer, la typologie prend en compte toutes les variables choisies pour l’analyse, sur le même plan.
Ces variables sont utilisées pour découper le groupe d’individus initial en sous-groupes aussi différents que possible les uns des autres et avec des individus aussi semblables que possibles à l’intérieur de chacun des groupes, ce qui est exactement ce que l’on recherche lorsqu’on évoque ordinairement la notion de segmentation. La méthode la plus couramment utilisée est la classification hiérarchique ascendante.
Schématiquement, l’algorithme de la typologie fonctionne de la manière suivante : l’utilisateur indique le nombre de groupes qu’il souhaite obtenir et choisit les variables qui doivent participer à la composition de ces groupes. Généralement, les variables utilisées sont numériques (même si les algorithmes peuvent, en théorie, prendre en compte des variables qualitatives, en partant d’un tableau de similarité au lieu d’utiliser les valeurs des variables).
L’algorithme commence par effectuer un tirage aléatoire d’un individu pour chacun des groupes à constituer. Ces individus sont considérés comme étant les centres provisoires des classes à constituer.
L’algorithme s’intéresse ensuite à chacun des autres individus qu’il rattache au centre de la classe dont il est le plus proche. L’arrivée d’un individu dans chaque classe modifie le barycentre (qui est donc mobile) et permet au fur et à mesure, d’affiner les groupes.
L’algorithme continue à affecter puis à réaffecter les individus aux différents groupes, jusqu’à ce qu’il n’y ait plus de réaffectation possible.
Cet algorithme a des variantes qui interviennent notamment lors du processus de sélection des individus initiaux. Ainsi, la méthode des “nuées dynamiques” remplace l’individu initial sélectionné aléatoirement pour chaque groupe par un “noyau” de plusieurs individus. En réduisant ainsi les biais possibles, la qualité de l’analyse est améliorée.
Quel que soit l’algorithme utilisé, l’analyse typologique fournit au final, un tableau indiquant le nombre d’individus présents dans chaque classe et la variance interne à chaque classe. Cette variance intra-classe renseigne sur l’homogénéité du groupe ainsi obtenu. La somme des différentes variances intra-classe donne une indication de la pertinence du découpage obtenu.
Quelles variables choisir ?
Généralement, on s’attend à ce que les segments que l’on obtient puissent être décrits de manière claire dans des termes comme : “Les clients du segment 1 sont des jeunes actifs, de CSP +, avec enfants. Ils fréquentent notre magasin une fois par semaine, généralement le soir et ont un panier moyen de 100 euros”. Le néophyte qui part de ce type de description pour réaliser sa segmentation (ou plutôt sa typologie) aura tendance à vouloir intégrer, dans les critères de calcul, l’âge, la CSP, le nombre d’enfants, la fréquentation, le moment de la visite et le panier moyen.
Plus généralement, étant donné qu’on peut chercher à décrire le comportement des segments pour toutes les variables disponibles dans les fichiers, on n’aurait qu’à les sélectionner toutes dans l’analyse.
Ce n’est bien sûr pas comme cela que l’on procède. Il est conseillé de sélectionner au départ un petit nombre de variables importantes, censées caractériser globalement le client. Il s’agit généralement de variables numériques caractérisant l’importance du client pour la société : volume d’achat sur une période, moyenne par achat, potentiel, etc.
On peut aussi y adjoindre des éléments liés à des niveaux de satisfaction.
Comment choisir une typologie ?
Il faut savoir que l’algorithme de typologie n’aboutit généralement pas, s’il est lancé plusieurs fois, à un résultat identique. Le regroupement opéré dépend du choix des individus initiaux, même si les algorithmes de calcul cherchent à réduire les écarts et à aboutir à des résultats stables.
Généralement, les logiciels évolués permettent d’enchaîner plusieurs typologies pour s’arrêter sur celle qui semble la plus pertinente.
Le choix s’opère sur deux éléments : la comparaison de la somme des variances intra-classe déjà évoqué mais aussi, la logique opérationnelle des classes obtenues, qui doit être appréciée par l’homme de marketing.
Comment caractériser les groupes ?
A l’issue du calcul d’une typologie, on obtient généralement pour chaque groupe les valeurs moyennes (et d’autres indices statistiques) pour les différents critères qui ont été sélectionnés dans le calcul.
Cette première caractérisation permet de nommer les groupes. On peut ainsi étiqueter les “Gros acheteurs”, les “Poids morts”, etc.
Un second niveau de caractérisation est obtenu en croisant les groupes par les autres variables disponibles. Il peut s’agir notamment de variables qualitatives et signalétiques.
On peut ainsi déterminer le profil de chaque groupe et arriver à une description du type de celle évoquée plus haut, concernant le choix des variables.
Afin de valider une segmentation, on la définit sur un échantillon d’apprentissage. La robustesse de cette segmentation est mesurée sur un échantillon de validation indépendant au sens statistique de l’échantillon d’apprentissage.
4. C’est quoi une bonne segmentation ?
Une segmentation est pertinente si elle présente à la fois une grande homogénéité au sein de chaque segment, et la plus forte hétérogénéité possible entre tous les segments. En effet, segmenter revient certes à regrouper des personnes ou des entreprises qui ont des besoins en commun. Mais, pour que cela vaille la peine de créer une offre, qui leur soit spécifique, encore faut-il que leurs attentes soit suffisamment différentes de celles des autres segments.
Il faut trier, classer, privilégier certains segments et ne pas hésiter à en rejeter d’autres. Cela permet de réaliser des économies, de rationaliser les offres… Et de préserver le fonds de commerce. Car une offre inadéquate peut indisposer le prospect. Malheureusement, de nombreux responsables marketing hésitent à pratiquer cette méthode. En effet, si un responsable est habitué à obtenir des rendements de 1% et qu’il rejette ceux qui n’ont aucune chance de réagir à l’offre, le rendement, calculé en valeur relative, sera le même en pourcentage. Pourtant il aura diminué le budget de son opération.
Un segment est opérationnel s’il est volumineux, mesurable et accessible. Volumineux au sens qu’il doit comporter suffisamment de consommateurs pour que leurs achats amortissent les frais fixes de conception et mise en place du plan-mix qui leur est dédié. Ce critère s’estime selon trois axes complémentaires : nombre de personnes/entreprises concernées, leur budget disponible, et la croissance attendue sur ce marché. Mesurable, car tout business plan nécessite de savoir où l’on va. Enfin, un segment doit être accessible : le “ticket d’entrée” ne doit pas être trop coûteux pour s’y lancer.
Quel est le nombre maximum de segments que l’on peut isoler ?
Pas plus d’une dizaine, sinon, il est impossible de les gérer. De plus, il ne faut pas confondre segmentation de gestion et de communication. La première utilisation de la segmentation, c’est de se faire une image de sa clientèle et de prendre des décisions d’investissement. Après cette étape, il n’y a pas de limites pour la communication. On peut ensuite intégrer des variables attitudinales ou psycho-graphiques pour affiner les profils en étant conscient des limites de l’hypersegmentation. A trop segmenter, on se noie dans les données.
5. La seule limite : le rendement
Jusqu’où peut-on aller dans la segmentation ? Au niveau technique, presque jusqu’à l’infini, pour les entreprises qui disposent de beaucoup de données lorsqu’on segmente dans le but de mener une action commerciale, le budget alloué et l’analyse des retours en déterminent les limites.
6. Pérenniser l’approche
La segmentation est un processus dynamique. Les besoins et comportements des clients évoluent. Il est donc utile de chercher, dès la première démarche de segmentation, à se donner les moyens de reproduire cette démarche très régulièrement (une fois par an, par exemple), à défaut de pouvoir l’automatiser complètement.
Le suivi de la segmentation dans le temps permet de :
– anticiper/comprendre les raisons de la montée ou descente en grade des clients
– mesurer la valeur de son portefeuille client dans le temps.