Mettre l’APL à la mode
Par Jocelyne Lopez
(Un peu de pragmatisme dans un monde de rêve)
Je vous invite - ça ne me coûte presque rien - à un petit voyage dans le temps. Nous restons en France, à cette époque pas très lointaine où l’analyse des données ne s’appelait pas encore " Data Mining " et suscitait chez nos universitaires nationaux un bouillonnement intellectuel digne du plus grand intérêt.
De l’université à l’usine :
Parallèlement à ce qui se passait dans les labos et centres de calcul des universités, les " sciences de l’ingénieur " connaissaient une importante évolution. Les impératifs sans cesse croissants de rentabilité, de rapidité, de qualité, rendaient nécessaire une surveillance beaucoup plus systématique des processus de fabrication afin de réagir vite et efficacement en cas de problème ... et même d’anticiper dans la mesure du possible la " non-qualité " ou la casse.
Le suivi de production était déjà devenu une tâche ordinaire intégrée dans tout protocole d’élaboration. Selon des échéanciers précis, dans des conditions déterminées, des quantités de contrôles incluant des relevés de mesures et des vérifications de tous ordres étaient faits. On consignait par écrit la provenance des composants, les conditions matérielles de travail, et/ou les éventuels incidents survenus. Ces chiffres et renseignements descriptifs venant immanquablement échouer au bureau d’étude ... le plus souvent à fin de simple archivage.
En cas de pépin, on pouvait toujours se plonger dans des tonnes de paperasses et de bordereaux de contrôle et y passer quelques nuits blanches pour identifier la ou les causes à incriminer et trouver la manière de remédier au problème.
Dès lors que les entreprises (les plus importantes d’abord, comme le secteur militaire, la métallurgie, l’aéronautique et la construction automobile ... par exemple) purent accéder à des moyens informatiques et se doter des ressources en matière grise pour les faire tourner, les études théoriques des chercheurs cités plus haut purent commencer à épanouir dans le monde industriel leur puissance et leur pertinence.
Comment déterminer, lors de la fabrication d’une canette de soda, ce qui fait que dans la plupart des cas tout va bien, mais que parfois ... les petits conteneurs d’aluminium ou d’acier ne sont pas rigoureusement cylindriques, mais très légèrement ovalisés et donc destinés au rebut.
Pourquoi lors du processus final de l’élaboration de fils d’acier, plus précisément quand les spires successives viennent se placer en un rouleau, il arrive qu’elles s’entremêlent, rendant leur utilisation pour l’acheteur des plus problématiques.
Les techniques d’analyse statistiques des données ont très vite intéressé les bureaux d’étude. Décryptage de processus complexes faisant varier de manière simultanée plusieurs des multiples paramètres pouvant influer sur le comportement de tel ou tel matériau ou matériel et influencer la perfection finale du produit.
Et de l’usine vers les boutiques :
D’une manière soigneusement distincte ... ne mélangeons pas les torchons et les serviettes ... se développait simultanément les prémisses de l’âge d’or du marketing. Avide de chiffres, grand consommateur de sondages d’opinion, de panels, d’enquêtes, cette discipline s’affairait laborieusement ( et ce n’est pas fini) à " sociotyper " et à " cibler " les consommateurs de toutes plumes et de tous poils. Son but : anticiper les besoins pour réaliser la quadrature du cercle : l’adéquation du produit à vendre au marché (ou l’inverse ?), et, partant, garantir le profit du BON fabriquant et/ou du BON vendeur : celui qui aurait tout compris.
Et se trouvèrent quelques personnes, au confluent de ses trois mondes : 1/3 chercheurs, 1/3 industriels, 1/3 préoccupés de réussite commerciale, mais surtout 100% curieux, audacieux et imaginatifs qui se dirent qu’après tout :
Le temps de se poser ces problèmes métaphysiques, et la micro-informatique commençait à fourmiller dans les PME avec une nouvelle définition de l’ergonomie et ... un langage fabuleux capable d’inverser des matrices de grande taille sur un Macintosh SE30 en quelques secondes. Brasser des tableaux compilant chaînes de caractères et données numériques de quelques milliers de lignes dans tous les sens ne laissait guère plus de temps libre aux programmeurs APListes pour peaufiner leurs algorithmes alors qu’ils traitaient en vraie grandeur leurs premières analyses des performances de vente d’une collection de prêt-à-porter.
On en a fini avec l’introduction ! ! !
La problématique :
Tous les 6 mois (collection printemps/été, puis automne/hiver), les chefs de produits textiles parient leur place dans telle ou telle société de fabrication ou de distribution. Ils choisissent, ou conçoivent et mettent sur le marché une collection qui va être soumise à la sanction de la clientèle. Il y aura des best-sellers, des laissés pour compte qui resteront longtemps dans les rayons, et des références au succès moyen.
Et chaque 6 mois, dans un bel ensemble, anticipant la phase de créativité et de design de la collection, ces professionnels fréquentent les salons de matières premières (innovation technologique) , écoutent avec intérêt les cabinets de style qui dévoilent leurs " tendances ", ils s’étourdissent d’influences éminemment abstraites et volatiles. Bien entendu, ils se soucient de minimisation des coûts de production (en composant éventuellement avec quelques menus contentieux d’ordre sociaux ou humanitaires), et s’interrogent sur les attentes de LEUR clientèle (celle qu’ils souhaiteraient toucher ou celle qui fréquente leurs magasins ?).
Des prototypes sont réalisés à grands frais, parfois présentés aux forces de vente ou à des consommateurs qui s’expriment sur leur ressenti, leurs préférences, doivent disséquer leurs attirances et leur désintérêt pour ce qu’on leur montre. Exercice difficile, coûteux, à l’efficacité douteuse. Les critères de choix exprimés sont souvent d’une subjectivité certaine et les données recueillies d’une pauvreté consternante. Questions mal formulées, panels mal choisis, caractère essentiellement inconscient de l’acte d’achat, déjà difficile à démystifier par des professionnels de l’étude du comportement humain, et a fortiori par le sondé lui-même.
Approche d’une solution :
Revenons à notre idée de départ et formalisons un peu plus le rapprochement du mystère de la consommation aux techniques avérées du contrôle-qualité :
En résumé :
Présentation rapide du processus de traitement :
Les données :
Un tableau de données comptant autant de lignes qu’il y a de références produits en rayons, autant de colonnes que de points de description plus une : celle des scores de vente, et notre logiciel d’analyse pour traiter tout ça.
Les variables sont de différentes natures : nom du coloris principal, mesure du tour de hanches, de la longueur, prix de vente, mode d’entretien, composition en % de différentes fibres, mode de présentation en magasin, gamme de déclinaison coloris, taille ou pointure mini, maxi ... On transforme tout d’abord les questions à réponse numérique (variables continues) en un ensemble de classes successives et exclusives de valeurs afin de se retrouver face à un tableau de nombres entiers comparables indépendants de tout système d’unité.
On passe ensuite à un tableau de contingence qui donnera le nombre d’occurrences simultanées d’un type d’individu avec l’un des paramètres qui le décrit ( pour nous, par exemple : nombre de fois où une jupe très bien vendue présente un boutonnage intégral de haut en bas).
L’analyse : construction et repérage de l’espace de référence :
Puis est réalisée l’analyse factorielle des correspondances de ce tableau. Disons simplement que les avantages de ce type d’analyse la rendent parfaitement adaptée au cas qui nous intéresse : comme en analyse en composantes principales, on cherche à décrire les proximités entre les points lignes d’une part et les points colonnes d’autre part. Mais ici, la distance utilisée est un Chi deux : elle permet d’éviter de faire jouer à une ligne ou colonne un rôle excessif. De plus, elle possède la propriété " d’équivalence distributionnelle " qui permet de
rassembler en une seule deux colonnes du tableau vis-à-vis desquelles l’ensemble des éléments du nuage des lignes ne présentent aucune différence. On peut donc réduire la dimension de l’espace sans modifier la distance entre les éléments de l’ensemble des profils lignes.Nous avons en ligne les modalités descriptives, en colonne les classes de performances. Cette matrice va être diagonalisée dans le but de rechercher les axes principaux d’inertie. Les points qui expliqueront le mieux les axes seront les points qui afficheront les plus fortes contributions absolues.
Dans notre cas précis ... puisque la variable à expliquer (ventes) est unique et continue, il est possible de se ramener toujours dans le même schéma de structuration de l’espace multidimensionnel avec un axe 1 qui va discriminer au mieux les très fortes ventes des très mauvaises, un axe 2 qui poursuivra cette discrimination de manière plus fine en classant les produits aux ventes moyennes, etc ...
4 dimensions nous suffisent pour structurer l’espace de manière satisfaisante. Selon le processus utilisé, le " cordon des ventes " va se dessiner suivant une courbe multidimensionnelle harmonieuse très particulière qui servira de repère et de " maître étalon " afin de décrire précisément l’espace.
Analyse d’impact des modalités descriptives :
Les profils des modalités descriptives sont projetés comme des variables supplémentaires (passives) et leurs points représentatifs viennent se positionner en des localisations très précises de l’espace selon leur fréquence d’implication dans la définition de produits plus ou moins bien vendus. En se référant à notre cordon des ventes, on va pouvoir dresser un hit-parade des critères d’échec ou de réussite de la collection.
A ce stade de l’analyse, chacune des modalités est valorisée de manière indépendante des autres et chacune a le même poids. J’excuse la moue dubitative ... donner le même poids dans l’acte d’achat d’une chemise d’homme au prix et à la forme des pointes du col, ça peut surprendre. Livrées à l’état brut, ces informations semblent souvent un peu frustrantes. Toutefois, avec un petit rien de mise en forme et ce qu’il faut de ce bon sens que donne le recul de l’auditeur externe, on peut faire des merveilles : le fait de dire que des talons de plus de 6 cm de haut pour des modèles de chaussures de femme " ville / vie active " est un frein aux ventes semble une totologie ... mais quand on assortit cette assertion du pourcentage des modèles mis en collection qui possèdent ce critère, il arrive (souvent) que l’on crée un choc. Il en va de même pour l’étendue de la déclinaison en coloris des modèles proposés. Il est bien rare que le chef de produits (créatif dans l’âme) résiste à la tentation d’une palette variée qui lui garantira une vitrine attractive ... mais lorsqu’on lui aura montré que 90% de ses ventes se font dans 3 coloris basiques, il pourra éventuellement revoir sa copie.
Le processus d’audit peut faire un pas de plus :
Utiliser l’espace de référence pour la prospective :
Revenons à notre nuage de points, et plus spécialement à son centre de gravité. Aux environs de celui-ci, nous retrouvons les modalités communes à la grande majorité des articles (100% coton pour des T-shirts enfants) ou celles qui sont présentes dans peu d’articles aux scores de vente très différents (paillettes très appréciées sur une petite robe de réveillon, mais rédhibitoire dans la plupart des bureaux). On va effectuer un travail de filtrage : sont éliminées les modalités dites " neutres " qui n’influent pas sur le comportement d’achat et celles dites " à risque ". Sont conservées celles que l’on dira " explicatives des ventes ", elles se situent dans le voisinage de la courbe des ventes et sont bien typées comme corrélées à une certaine tranche de performances.
La validation de cette étape fondamentale de sélection se fait de la manière suivante : les articles de la base de données ne sont plus décrits que par les modalités " explicatives ", la performance de vente qu’ils ont réussi est occultée. Les profils restreints sont projetés en passif (supplémentaire) et leur positionnement relativement au cordon des ventes donne une mesure estimative de la performance. On procède au rapprochement des valeurs réelles et de celles que l’on a estimées, le coefficient de corrélation donne la mesure de la validité de nos modalité explicatives pour suffire à expliquer le comportement d’achat de la clientèle. Classiquement : le coefficient de corrélation est de .80 dans les plus mauvais cas, pour des échantillons assez disparates mais trop petits pour être segmentés, ou pour des collections d’articles basiques trop homogènes.
De la même manière dont les articles ont pu être valorisés en aveugle, des prototypes virtuels (qui n’ont pas coûté plus que le temps passé à les imaginer et à les décrire suivant la grille des modalités explicatives) peuvent donner lieu à des estimations de performance qui sauront être une aide précieuse pour éviter de faire réaliser des modèles qui n’auraient aucune chance.
Bâtir l’architecture de la future collection en exploitant des " filières gagnantes " :
Du tableau décrivant les articles au travers des seules modalités explicatives, on extrait 2 sous-tableaux : celui des best-sellers, et celui des plus mauvaises ventes. On réalise sur chacun d’entre eux une classification ascendante hiérarchique qui va agréger les deux articles aux profils les plus proches, puis rapprocher ce groupe d’un autre article ou doublet d’articles de description voisine ... jusqu'à construire un arbre dont les branches maîtresses correspondront à des " filières " caractérisées par les modalités communes aux produits qui les composent et au caractère de celles-ci à marginaliser la filière du reste de la population. Chaque filière pourra être qualifiée par un chiffre d’affaire moyen à l’article, il pourra être choisi de la développer la saison suivante. Citons par exemple une filière gagnante regroupant : " les robes à forte valeur ajoutée esthétique au prix élevé ", révélatrice d’une élasticité-prix, elle va intéresser le marketing qui pourra repositionner son image de marque en typant une plus grande partie de la collection en haut de gamme, elle va passionner l’équipe créative qui pourra jouer la carte de la sophistication sans trop regarder le coût de réalisation.
En guise de conclusion :
Je ne sais pas si ces longues pages auront su justifier à vos yeux l’enthousiasme que j’ai mis depuis 10 ans à travailler sur ce projet original et ambitieux. Tout d’abord pour de la programmation et de la recherche alors que les " moteurs d’analyse " tournaient sur 3 pattes. Nous avons optimisé les réglages, ajusté et perfectionné les algorithmes, fiabilisé les calculs en les passant à l’épreuve du feu sur des échantillons rebelles et avec des clients/partenaires dont l’exigence a su aussi bien nous stresser que nous pousser vers l’excellence.
Je suis ensuite passée de l’autre côté de la (mince) barrière, évoluant avec timidité d’abord, puis en pleine confiance dans la peau d’un consultant (je vous jure que ça aide de savoir ce qu’il y a dans la boîte noire). Chargée de venir édicter des règles de conduite et des axes directeurs pour des créateurs, presque des artistes que le simple mot d’ordinateur faisait frémir d’horreur et qui ne concevaient le mariage de la hi-tech et de la mode que sur les traces de Paco Rabanne. J’ai laissé pendant ce temps-là les collègues faire progresser grandement l’ergonomie des interfaces qui relevaient plus de l’âge préhistorique que de l’ère de la communication.
Et puis, bébés et besoins de sédentarité aidant, je suis revenue à mes premiers amours et, entre autres développements autour de la filière d’audit, je continue ma mission de " mère technique adoptive " du logiciel en APL. Je ne l’ai pas conçu, mais j’ai accompagné ses premiers pas, et je reste attentive à ce qu’il vive et prospère. Et les pistes ne manquent pas sur lesquelles le faire évoluer afin de le rendre plus souple, plus intelligent, plus bavard parfois, plus concis en d’autres circonstances ... J’aime toujours le pousser hors des sentiers battus pour découvrir ses limites (il est toujours là pour me montrer les miennes), savoir quand dire non à des études dont les résultats seraient forcément décevants vu la teneur des données proposées. Et je pense parfois à d’autres stratégies, d’autres plate-formes, pour que dans le futur, il puisse évoluer de manière autonome directement entre les mains de clients sensibilisés à l’art de ne pas le traiter en outil presse-bouton mais en assistant dans les processus décisionnels.
Et je ne devrais pas vous soûler davantage de paroles pour vous convaincre de la magnifique adéquation de l’APL au raisonnement statisticien qui est l’âme de ce logiciel ... et aux audaces dont il me vient parfois l’envie.