Aller au contenu principal

Combiner plusieurs sources de données

Croiser les données pour des analyses plus riches

Les analyses les plus puissantes naissent du croisement de plusieurs sources. Ventes + CRM, budget + réalisé, web analytics + conversions — c’est en combinant ces fichiers que vous découvrez des insights invisibles dans chaque source isolée.

Uploader plusieurs fichiers

ChatGPT accepte plusieurs fichiers dans une même conversation :

Voici 3 fichiers :
1. ventes_q1_2026.xlsx — les transactions de vente
2. clients_crm.csv — la base clients avec secteur et taille
3. objectifs_2026.csv — les objectifs par région et par mois

Je vais te demander de les croiser pour une analyse complète.

Uploadez les fichiers un par un ou tous ensemble. ChatGPT les charge tous dans son environnement Python et vous pouvez les manipuler librement.

Fusionner les tables (jointures)

La jointure : le coeur du croisement

La jointure combine deux tables sur une colonne commune :

Fusionne le fichier ventes avec le fichier clients
en utilisant la colonne "id_client" comme clé de jointure.
Affiche un aperçu du résultat et signale les ventes
sans client correspondant.
Type de jointure Comportement Quand l'utiliser
Inner join Garde uniquement les correspondances Analyse stricte, pas de données incomplètes
Left join Garde toutes les lignes de la table principale Enrichir les ventes avec les infos clients (même si client inconnu)
Outer join Garde toutes les lignes des deux tables Identifier les écarts entre deux sources

Vous n’avez pas besoin de connaître le jargon technique — décrivez simplement ce que vous voulez :

Je veux enrichir mes ventes avec les infos clients.
Garde toutes les ventes, même celles dont le client
n'est pas dans le CRM (mets "Inconnu" dans ce cas).

ChatGPT choisit le bon type de jointure automatiquement.

Comparer budget vs réalisé

Un cas classique de croisement multi-sources :

Croise le fichier des objectifs (colonnes : region, mois, objectif_ca)
avec le fichier des ventes agrégées (region, mois, ca_realise).
Calcule l'écart en euros et en pourcentage pour chaque combinaison.
Surligne les cases où l'objectif n'est pas atteint.

Enrichir avec des données externes

Ajouter un référentiel

Voici un fichier de référence avec les codes postaux
et les régions administratives françaises.
Ajoute la colonne "region" à mes données de ventes
en utilisant le code postal comme clé.

Combiner données web et ventes

Fichier 1 : trafic web par page produit (page_url, visites, taux_rebond)
Fichier 2 : ventes par produit (produit, ca, quantite)

Croise les deux fichiers sur le nom du produit.
Calcule le taux de conversion (ventes / visites) par produit.
Quel produit a le meilleur ratio visites → ventes ?

Gérer les incohérences entre sources

Les sources de données ont rarement le même format. Les problèmes courants :

Noms différents pour la même chose

Dans le fichier ventes, la colonne s'appelle "client_id".
Dans le CRM, elle s'appelle "identifiant_client".
Fais la jointure en mappant ces deux colonnes.

Formats de dates différents

Les ventes utilisent le format JJ/MM/AAAA.
Les objectifs utilisent le format AAAA-MM.
Harmonise les deux sur le mois (AAAA-MM) avant de croiser.

Valeurs catégorielles non alignées

Dans les ventes, les régions sont en majuscules (ILE-DE-FRANCE).
Dans le CRM, elles sont en minuscules (Île-de-France).
Normalise les deux avant la jointure.

Demandez toujours un contrôle après la fusion :

Après la jointure, combien de lignes ont été perdues ?
Combien de lignes n'ont pas trouvé de correspondance ?
Montre 5 exemples de non-correspondances.

Analyse croisée multi-dimensions

Une fois les sources fusionnées, vous pouvez croiser des dimensions qui étaient séparées :

Maintenant que j'ai les ventes enrichies avec les infos CRM :
1. CA par secteur d'activité du client ET par catégorie de produit
2. Panier moyen selon la taille de l'entreprise (TPE, PME, ETI, GE)
3. Top 10 des combinaisons (secteur × produit) les plus rentables

Ces analyses croisées seraient impossibles avec un seul fichier.

Points clés à retenir

  • Uploadez plusieurs fichiers dans la même conversation pour les croiser
  • Décrivez la logique de jointure en langage naturel — ChatGPT choisit la méthode technique
  • Harmonisez les formats (dates, noms, majuscules) avant de fusionner
  • Vérifiez toujours le nombre de lignes avant/après la jointure
  • Le croisement multi-sources révèle des insights invisibles dans chaque source isolée