Pouvez-vous nous parler de la genèse des projets Actuvisu et Dataveyes ?
J’avais envie de travailler sur le journalisme de données dans le cadre d'un travail de fin d'étude en master management des médias. Je faisais à ce moment-là des veilles sur les nouveaux modèles éditoriaux, économiques et organisationnels dans les rédactions alliés à toutes les transformations qu’a pu engendrer le développement du numérique. Or, je me suis vite rendue compte que ça allait être difficile si je n’avais pas de prototype ni de regard technique. J’ai donc ouvert le blog Actuvisu pour porter le sujet et j’avais fait une petite annonce pour trouver des collaborateurs au profil plus technique. C’est ainsi que j’ai rencontré Benoit Vidal qui était en fin de parcours à l’Hetic (Ecole des Hautes Etudes des Techniques de l'Information et de la Communication). Nous avons monté une équipe de dix profils différents : un webdesigner, un architecte de l’information, trois développeurs, un informaticien. Des rédactions ou des agences de communication ont commencé à nous demander de travailler pour eux. A partir de là, nous nous sommes rendus compte qu’on avait trouvé un créneau.
J’avais envie de travailler sur le journalisme de données dans le cadre d'un travail de fin d'étude en master management des médias. Je faisais à ce moment-là des veilles sur les nouveaux modèles éditoriaux, économiques et organisationnels dans les rédactions alliés à toutes les transformations qu’a pu engendrer le développement du numérique. Or, je me suis vite rendue compte que ça allait être difficile si je n’avais pas de prototype ni de regard technique. J’ai donc ouvert le blog Actuvisu pour porter le sujet et j’avais fait une petite annonce pour trouver des collaborateurs au profil plus technique. C’est ainsi que j’ai rencontré Benoit Vidal qui était en fin de parcours à l’Hetic (Ecole des Hautes Etudes des Techniques de l'Information et de la Communication). Nous avons monté une équipe de dix profils différents : un webdesigner, un architecte de l’information, trois développeurs, un informaticien. Des rédactions ou des agences de communication ont commencé à nous demander de travailler pour eux. A partir de là, nous nous sommes rendus compte qu’on avait trouvé un créneau.
Quels sont les différents modes de visualisation de données ?
En général j'en distingue trois types : celles qui présentent des résultats (ou des scores), celles qui présentent des tendances (ou des histoires) et les autres des contenus. Il est possible de les classer aussi en fonction de leurs formes. A la différence des graphiques traditionnels (diagrammes, courbes…), la visualisation interactive de données utilise ces formes mais les intègre dans des représentations plus vastes et inventives, qui font appel à la fois à l'intelligence visuelle et à l'intelligence de l'action. Souvent, la visualisation fait appel à des métaphores visuelles que le public est susceptible de reconnaître afin de faire passer un message par analogie.
Et comment intégrez-vous l'expérience utilisateur ?
Face à une visualisation, l'internaute n'a pas forcément de but défini au départ. Il peut l'explorer, y passer du temps, et définit ses buts de navigation au fur et à mesure, réajuste ses objectifs en fonction de ce qu'il voit, se laisse surprendre. Ce domaine de l'expérience d'information a pour conséquences sur le plan ergonomique : la règle des trois clics ne se justifie plus et on évite le scroll. Elle permet aussi de révéler des histoires derrières les données (le storytelling) avec un parcours de lecture modulable et évolutif. Elle joue ainsi sur des effets visuels comme les transitions, les navigations dans le temps avec des barres de progression, les différentes vues etc.
Quel est l'enjeu ?
Amener l'internaute à explorer la base de données, à entrer dans le contenu et à y rester en rebondissant sur d'autres questions qu'ils ne s'étaient jamais posées. La visualisation de données travaille sur trois modes d'engagement dans l'information. La vue : l'information doit être attractive et esthétique par sa forme. La manipulation : avec un travail sur la cinétique et l'interaction. En manipulant lui-même la visualisation, l'internaute mémorise plus facilement l'information que s'il était passif. La locomotion : par ce parcours d'information, l'internaute a une vue globale puis il explore, reconfigure l'application. Des chemins de parcours qui lui permettent de mémoriser l'information.
Éprouviez-vous des difficultés au départ pour récolter des données exploitables ?
Le problème ne vient pas forcément d’un manque de données, mais du fait qu'elles ne sont pas forcément propres et faciles à utiliser. Comme toute activité, dés qu'il y a un écosystème autour, des synergies, cela devient beaucoup plus simple. A partir du moment où il y a des mouvements d'opendata, il y a plus de données propres à structurer et à visualiser, il y a plus de personnes qui s'y intéressent et ensuite les médias s'y mettent et c'est un cercle vertueux. En France j’ai l’impression que ça commence à s’amorcer, même si des problèmes persistent au niveau du format des données afin qu'elles soient facilement exploitables par des machines.
En général j'en distingue trois types : celles qui présentent des résultats (ou des scores), celles qui présentent des tendances (ou des histoires) et les autres des contenus. Il est possible de les classer aussi en fonction de leurs formes. A la différence des graphiques traditionnels (diagrammes, courbes…), la visualisation interactive de données utilise ces formes mais les intègre dans des représentations plus vastes et inventives, qui font appel à la fois à l'intelligence visuelle et à l'intelligence de l'action. Souvent, la visualisation fait appel à des métaphores visuelles que le public est susceptible de reconnaître afin de faire passer un message par analogie.
Et comment intégrez-vous l'expérience utilisateur ?
Face à une visualisation, l'internaute n'a pas forcément de but défini au départ. Il peut l'explorer, y passer du temps, et définit ses buts de navigation au fur et à mesure, réajuste ses objectifs en fonction de ce qu'il voit, se laisse surprendre. Ce domaine de l'expérience d'information a pour conséquences sur le plan ergonomique : la règle des trois clics ne se justifie plus et on évite le scroll. Elle permet aussi de révéler des histoires derrières les données (le storytelling) avec un parcours de lecture modulable et évolutif. Elle joue ainsi sur des effets visuels comme les transitions, les navigations dans le temps avec des barres de progression, les différentes vues etc.
Quel est l'enjeu ?
Amener l'internaute à explorer la base de données, à entrer dans le contenu et à y rester en rebondissant sur d'autres questions qu'ils ne s'étaient jamais posées. La visualisation de données travaille sur trois modes d'engagement dans l'information. La vue : l'information doit être attractive et esthétique par sa forme. La manipulation : avec un travail sur la cinétique et l'interaction. En manipulant lui-même la visualisation, l'internaute mémorise plus facilement l'information que s'il était passif. La locomotion : par ce parcours d'information, l'internaute a une vue globale puis il explore, reconfigure l'application. Des chemins de parcours qui lui permettent de mémoriser l'information.
Éprouviez-vous des difficultés au départ pour récolter des données exploitables ?
Le problème ne vient pas forcément d’un manque de données, mais du fait qu'elles ne sont pas forcément propres et faciles à utiliser. Comme toute activité, dés qu'il y a un écosystème autour, des synergies, cela devient beaucoup plus simple. A partir du moment où il y a des mouvements d'opendata, il y a plus de données propres à structurer et à visualiser, il y a plus de personnes qui s'y intéressent et ensuite les médias s'y mettent et c'est un cercle vertueux. En France j’ai l’impression que ça commence à s’amorcer, même si des problèmes persistent au niveau du format des données afin qu'elles soient facilement exploitables par des machines.
Et qu'en est-il des licences permettant d'exploiter ces données ?
Il faut que l’auteur de la base de données autorise la ré-exploitation de ses données. Au niveau juridique, cela paraît assez évident quand on parle de données d’entreprises privées, mais cela devient assez flou lorsqu'on parle de scraping de pages web (l’extraction automatisée d’informations). Le Droit d’auteur français qui s’applique aux bases de données est assez gênant dans le sens où il accorde des droits à tout producteur à partir du moment où il fournit un effort substantiel en termes de conception et de travail de collecte de ces données. Il faut donc respecter ses droits patrimoniaux et moraux, ne pas dégrader la base de données, payer des droits...
Et dans les faits ?
On est amené à faire du scraping, une activité qui est considérée comme illégale. On va par exemple lancer un robot qui va nous permettre de récupérer toutes les informations contenues dans les fiches où figurent les coordonnées de députés sur le site du parlement et qui ne sont pas facilement récupérables manuellement puisqu'il faut ouvrir une fenêtre différente à chaque fois. Mais si on veut faire un service utilisateur ou vendre une visualisation de données, on préfère obtenir des autorisations.
Il faut que l’auteur de la base de données autorise la ré-exploitation de ses données. Au niveau juridique, cela paraît assez évident quand on parle de données d’entreprises privées, mais cela devient assez flou lorsqu'on parle de scraping de pages web (l’extraction automatisée d’informations). Le Droit d’auteur français qui s’applique aux bases de données est assez gênant dans le sens où il accorde des droits à tout producteur à partir du moment où il fournit un effort substantiel en termes de conception et de travail de collecte de ces données. Il faut donc respecter ses droits patrimoniaux et moraux, ne pas dégrader la base de données, payer des droits...
Et dans les faits ?
On est amené à faire du scraping, une activité qui est considérée comme illégale. On va par exemple lancer un robot qui va nous permettre de récupérer toutes les informations contenues dans les fiches où figurent les coordonnées de députés sur le site du parlement et qui ne sont pas facilement récupérables manuellement puisqu'il faut ouvrir une fenêtre différente à chaque fois. Mais si on veut faire un service utilisateur ou vendre une visualisation de données, on préfère obtenir des autorisations.
Où les trouvez-vous ?
Il y a énormément de sources de données qui vont des instituts de statistiques comme Eurostat, l'Insee, la Banque Mondiale, les réseaux sociaux, des données d’entreprises, du texte transformé en données... On peut tout mettre en données. Les ordinateurs ont les capacités de traitement, de stockage et la rapidité de calcul à des coûts assez faibles pour qu’on puisse appréhender énormément de choses par les données avec des gros volumes à gérer. Et si notre paysage informationnel est chargé en données, tout le monde ne dispose pas des outils pour en extraire des informations. Nous pouvons faire appel à des informaticiens, statisticiens pour traiter ces données mais ensuite, comment faire pour les rendre lisibles et accessibles à un public cible ? Il y a là un vrai enjeu. Nous n'avons ni les outils ni les réflexes de représentation pour que ça se fasse aussi facilement qu'avec les textes.
Il y a énormément de sources de données qui vont des instituts de statistiques comme Eurostat, l'Insee, la Banque Mondiale, les réseaux sociaux, des données d’entreprises, du texte transformé en données... On peut tout mettre en données. Les ordinateurs ont les capacités de traitement, de stockage et la rapidité de calcul à des coûts assez faibles pour qu’on puisse appréhender énormément de choses par les données avec des gros volumes à gérer. Et si notre paysage informationnel est chargé en données, tout le monde ne dispose pas des outils pour en extraire des informations. Nous pouvons faire appel à des informaticiens, statisticiens pour traiter ces données mais ensuite, comment faire pour les rendre lisibles et accessibles à un public cible ? Il y a là un vrai enjeu. Nous n'avons ni les outils ni les réflexes de représentation pour que ça se fasse aussi facilement qu'avec les textes.


Fil d'info



















Sur les sites de PQR, "les vidéos qui marchent ne sont pas toujours celles qu’on croit"







