Depuis des années que j'utilise Excel (et je donne même des cours), je rencontre toujours ce problème stupide :
j'ai des données réelles, et j'aimerais faire un graphique de répartition.
Je ne dis pas que je ne sais pas le faire, je le fait régulièrement... Mais je voudrais bien connaitre la méthode idéale.
Exemple, tous les appels à un webservice depuis 1 an, et j'aimerais faire la courbe de charge horaires.
Autre exemple, la liste de tous les paniers clients, et une courbe de répartition des prix des paniers.
En math, c'est facile, on va mettre les différentes valeurs en ordonnée, et en abscisse le nombre d'éléments qui ont cette valeur, pour obtenir une jolie courbe bien lisse.
En pratique, c'est plus difficile, parce que globalement, tous mes appels à mon webservice sont à des heures différentes, globalement, je n'en ai pas 2 pareils. (essentiellement du au fait que j'ai un timestamp qui va au centième de seconde : 9h28m32,765s)
Niveau 1 : Mon graphique de répartition, réalisé connement, est donc une succession de 1. (top-moumoute !)
Alors, il suffit de créer des catégories !
Niveau 2 : On tronque à la seconde 9h28m32s, on crée une catégorie par seconde. Résultat, mon graphique, c'est verdun. Loin d'être une jolie courbe, le hasard a voulu que 514appels soient réalisés à 7h32m43s, faisant un grand pic, alors que c'est plutôt une plage horaire calme d'habitude. Et puis, de toute façon, mon graphique est juste un grand tas de pics pas plus lisible
Alors, il faut agrandir les catégories !
Niveau 2 bis : on tronque à la minute, résultat, on obtient encore des pics, mais moins grand.
Niveau 3 : on fait des catégorie de 30minutes voir 1heure. Plus de pics, notre graphique est à peu près lisse. Tant qu'à faire, on fait un graphique en barre du coup (en faisant des barres qui prennent tout l'espace). Voilà, on a un joli graphique présentable, c'est généralement ce que je fais.
Pour les paniers clients, on va arrondir à l'euro près, c'est déjà plus gênant, puisque l'on a perdu pas mal d'information.
-> Alors, déjà, créer des catégories (à moins d'ajouter une colonne à nos données avec la catégorie qui va bien), cela demande une étape de recalcul, c'est long à faire.
Mais en plus, on est parti d'une information très détaillée (mais avec un nombre insuffisant de valeurs, sachant qu'il en faudrait des dizaines de millions pour augmenter la précision, ca devient lourd sur Excel ...), et on obtient une information très brute, pas très détaillée.
Comment améliorer le truc, pour détailler un peu plus, sans perdre en finesse ?
On crée une moyenne mobile ? Souvent, si on le fait directement, cela décale les valeurs vers la droite (le pic de 12h30 se retrouve à 12h45 ... A ma grande honte, j'ai déjà retouché un graphique sous powerpoint pour recaler les ordonnées, paye ton bricolage ...)
Donc on se retrouve à le calculer à la main en prenant un peu des valeurs avant, un peu des valeurs après.
Pour les paniers, on est un peu ennuyé pour les valeurs avant 0, il faut donc trouver une astuce.
Mais ca devient l'enfer ... On ne va pas passer 3h pour créer un pauvre graphique de répartition !
Du coup ...
Vous faites comment pour avoir un résultat simple propre et rapide ?
(en pièce jointe d'ici 30minutes, mon graphique de répartition avec moyenne mobile et correction de l'artefact à 0€)
Message édité par Peuwi le 09-11-2015 à 11:57:03