Ask Data – What did you expect ?
Depuis le 13 Février dernier, Tableau vous permet d’interroger directement vos données en langage naturel grâce à Ask Data, sa nouvelle fonctionnalité à base de NLP (Natural Language Processing).
Ceci constitue, selon nous, une première étape franchie dans le cadre de la démocratisation de l’analytique. Jusqu’à présent, il était question d’avoir parmi ses équipes un expert en analyse de données ou data scientist, «métier le plus sexy du XXIe siècle» selon la Harvard Business Review. Grâce à cette nouveauté, nul besoin d’un tel titre ou d’être un fin technicien. Dorénavant vous êtes capables d’obtenir une analyse en quelques mots.
Cela signifie exploiter un jeu de données grâce à une question, un énoncé ou encore des mots clés. Nul besoin d’un vocabulaire technique, le langage courant vous suffit. Ainsi vous obtiendrez des analyses visuelles spontanées et adaptées pour répondre de manière précise à votre demande.
Simple vous ne trouvez pas?
Au-delà de la finalité et l’aisance d’obtention de résultats, quelques éléments doivent être respectés pour utiliser de manière optimale la fonctionnalité Ask Data. C’est ce que nous allons essayer de vousexpliquer à travers cet article.
1. Préparer ses données
1.1. Sélectionner vos champs
Pour utiliser Ask Data, la publication d’une source de données est nécessaire. Vous pouvez donc utiliser cette fonctionnalité sur Tableau Server et/ou Tableau Online uniquement (pas d’usage possible avec Tableau Desktop directement).
A noter également tous les éléments d’une source de données non pris en compte par Ask Data.
1.2. Utilisation du langage naturel
Comme nous l’avons dit auparavant, pour utiliser Ask Data, il suffit de poser une question, suggérer un énoncé. Dans cet énoncé vous allez pouvoir utiliser une ou plusieurs expressions analytiques propre à Tableau.
Les mots clés à connaître pour un énoncé efficace sont les suivants:
- Agrégations: Par agrégations nous entendons l’usage de «sum», «average», «median», «count», «minimum» ou encore «maximum». Sachez que vous pouvez également utiliser des synonymes à la place de ces termes comme «mean» pour average ou «cnt» pour count.
- Grouper: Grouper se traduit par l’usage du terme «by» («By Region»).
- Trier: Si vous souhaitez utiliser un tri, alors votre énoncé doit être similaire à «sort shops in alphabetical order». Trois possibilités de tries s’offrent à vous: «Ascending», «Descending» ou «Alphabetical».
- Filtres numériques: Pour utiliser convenablement les filtres, vous devez utiliser les termes «At Least», «At most» ou «Between». De plus, vous devez savoir que le moteur Ask Data est à même de vous proposer une valeur numérique en fonction de votre énoncé. Si par exemple vous souhaitez afficher un prix minimum (en utilisant donc les mots clés «price» et «at least»), sachez que la barre de recherche vous proposera la valeur minimum disponible dans votre jeu de données
- Limites numériques: vous devez comprendre par limite numérique, la possibilité d’afficher un «Top» ou un «Bottom». Des termes comme «high», «low», «highest» et «lowest» sont aussi compris dans le langage Ask Data.
- Filtres textuels: Afin de filtrer vos données de type dimensions vous pourrez utiliser
- Is
- Is not
- Starts with
- Ends with
- Contains
- Does not contains
- Filtres Chronologiques: le dernier type de filtre pris en compte concerne les champs date. Pour cela vous pourrez utiliser les termes suivants:
- In
- Previous
- Last
- Following
- Next
- Between
- Starting at
- Ending at
Ci-dessous une synthèse du langage à employer dans vos démarches Ask Data.
2. Mettre en forme votre source de données
Dans lasuite de cet article, nous allons vous donner quelques conseils pratiques afin de publier un jeu de données propre, clair et concis. Ainsi, vos utilisateurs finaux pourront obtenir toutes réponses à leurs questions.
2.1. Préparer les données
Pour optimiser vos données et préparer une source de données performante, vous devez anticiper les questions des utilisateurs finaux. En ayant préparer des énoncés et des questions types, vous saurez mieux cerner le contenu de votre source de données.
C’est pourquoi nous préconisons de simplifier cette source de données en ne gardant que les champs nécessaires. Inutile de conserver des champs sans importances ou même cachés. Une attention particulière devra également être donnée à la convention de nommage de vos champs afin que ces derniers soient uniques et facilement identifiables par tous les utilisateurs.
Par ailleurs, il ne faut pas oublier de donner les accès aux utilisateurs finaux sans quoi, Ask Data ne sera pas exploitable.
2.2. Paramétrage des types de données et leurs formats
Chaque champ de votre source de données doit être préalablement paramétrer avant d’être utilisé via Ask Data. Cela signifie que vous devez déterminer si vos dimensions sont des chaînes, des nombres, des localisations ou encore des dates. En ce qui concerne les mesures, vous devez préparer la fonction d’agrégations (somme pour des ventes par exemple). Cela optimisera de manière conséquente l’obtention de résultats significatifs pour vos utilisateurs.
En termes de format et dans le but de faciliter les énonciations, il vous est recommandé de choisir les bons formats de nombre afin de répondre à tous les types de besoins (minimum/maximum vs moins cher/plus cher). Également prêter attention aux unités de votre source de données (€, K€, M€).
2.3. Organiser vos données sous formes de hiérarchies
Cela s’applique particulièrement aux données dates (Années, Mois, Jour) ou de géolocalisation (Pays, Régions, Villes). Il en est de même pour les dimensions fonctionnellement dépendantes (catégorie et sous catégories par exemple). L’utilisateur final aura ainsi accès au drill-down au sein de chaque visualisation.
2.4. Créer des «bin fields»
Ces champs sont intéressants lorsqu’il s’agit de transformer une mesure en dimension. Prenons l’exemple d’une mesure tel que l’âge. Ce champ numérique initialement, pourrait être analysé sous forme de graphique. Donc nous allons créer une copie de ce champ et le transformer en dimension pour effectuer des analyses avec cette dimension, comme l’illustre l’image ci-dessous.
2.5. Contrôle des noms et identifications géographiques
Afin de ne pas tromper votre utilisateur final et faciliter une bonne expérience, il faut contrôler la plupart de vos intitulés et libellé. Cela est relativement important dans le cadre de données géographiques. Un simple caractère peut parfois changer l’interprétation d’une valeur. Pour les champs avec un intitulé raccourci, ne pas hésiter à mettre un libellé plus complet. Ayez en tête que les utilisateurs finaux n’ont pas forcément le même vocabulaire (exemple: «CustID» peut devenir «Customer ID»). D’ailleurs nous vous recommandons d’utiliser des synonymes (méthodologie donnée ultérieurement), pour anticiper l’utilisation d’autres termes afin d’afficher une dimension ou mesure spécifique.
En revanche, il est déconseillé d’utiliser des noms trop techniques ou précis pour une donnée. Exemple «ventes en 2015». Cela peut compromettre les chances de résultats. Pour obtenir ce résultat, il est possible par exemple d’utiliser une agrégation de type somme et un filtre date sur votre mesure «ventes».
Enfin, Tableau propose un champ standard du type «number of xxx». Pour optimiser l’expérience utilisateur, n’hésitez pas à renommer ce champ afin donner plus de précisions sur le contenu de votre jeu de données.
De manière générale Ask Data anticipe votre énoncé et vous fera des propositions parmi les champs contenant un terme similaire, et l’utilisation d’une agrégation ou d’un filtre adéquat.
2.6. Création de champs calculés
L’utilisation d’Ask Data ne permet pas de créer des champs calculés en direct. C’est pourquoi nous vous recommandons d’anticiper leur création afin d’enrichir votre source de données et donc cerner un maximum d’énoncés et/ou questions des utilisateurs finaux. Il s’agit par exemple de calculer des taux et ratios (taux de marge, % CA) ou encore des montants TTC si vous n’avez que le HT. Bien sûr, n’ajoutez pas des champs calculés à tout bout de champs, il faut que votre base soit saine et spécifique.
2.7. Agrémenter votre dictionnaire de synonymes
L’utilisateur n’aura sans doute pas le même vocabulaire que vous. Pour pallier à ça, vous avez la possibilité de renforcer le langage en ajoutant des synonymes. Cela vous permettra d’afficher des réponses optimales et surtout cohérentes en fonction des différentes demandes. En termes de mode opératoire, il vous suffit de cliquer sur la flèche noire d’un champ spécifique de votre jeu de données, puis cliquer sur «edit synonyms». Vous pouvez en ajouter autant que vous le souhaitez tant que vous les séparer d’une virgule!
Conclusion:
Vous l’avez compris, Tableau introduit une nouvelle aire dans l’analytique et l’analyse de données grâce à Ask Data. Cet outil n’est pas simplement utile pour répondre à des questions, mais aussi pour créer des visualisations pour vos dashboards, par une simple demande.
À date seul l’anglais est supporté mais Ask Data gérera très bientôt de nouvelles langues dont le français. La reconnaissance vocale n’est, en revanche, pas disponible.
Etes-vous prêt à passer à la BI Intelligente?
MeltOne Advisory par le biais de ses experts Data & Analytics peut vous accompagner du cadrage à la mise en oeuvre de Tableau. Si vous avez des questions n’hésitez pas à nous contacter par email : jsaccona@meltone.com.