l’utilisation du Big Data en entreprise

Mardi dernier se tenait la 4e edition du colloque Action-TI organisé par la section Mauricie-Centre-du-Québec. Sous le thème « Les TI…et si on les abordait sous toutes leurs formes », on y a présenté une vingtaine de conférences de qualité qui touchaient à un bon nombre de secteurs d’activités – allant de la gestion de projet aux infrastructures technologiques.

Nous avons eu la chance d’y donner une présentation sur l’utilisation du Big Data en entreprise, un concept actuellement éloigné de la réalité des organisations mais qui ne tardera pas à devenir un incontournable – compte tenu des nombreux défis que doivent  relever les entreprises qui sont plus que jamais sous pression de la concurrence.

Résumé de la conférence

On produit une quantité astronomique de données – envrion 5 exabytes à tous les 2 jours.

L’entreprise qui saura extraire, transformer et utiliser l’information est une entreprise qui détient du pouvoir – une longueur stratégique sur ces concurrents.

Toutefois, il est difficile d’y voir clair – considérant que le volume de données à traiter est gigantesque.

L’utilisation du Big Data, qui permet de réunir et de traiter une grande quantité d’information afin d’en obtenir des résultats concrets devient donc une alternative à considérer.

On remarque 3 phases dans une stratégie d’utilisation du Big Data:

  1. Le stockage : qui se fait maintenant de manière semi-structuré via notamment des bases de données noSQL telles que Cassandra ou MongoDB.
  2. Le traitement : le principal framework de développement est Hadoop – un projet issu de Apache. Son architecture de traitement distribué sur plusieurs ordinateurs permet de traiter une grande quantité de données rapidement et efficacement via l’algorithme MapReduce.
  3. La visualisation des données : un domaine en soit – mais qui vise à représenter de manière simple et clair les résultats de l’analyse effectuée. De nombreux outils existent à ce sujet, notamment Tableau Software ou Statwing. Les données peuvent également être réintégrés dans les CRM ou les outils d’intelligence d’affaires traditionnels tels que Pentaho ou Jaspersoft.

Bien évidemment – on ne le répètera jamais assez – l’organisation qui souhaite  se doter d’une telle infrastructure doit impérativement procéder à une analyse complète de ses besoins et de ses capacités. Parmi les principaux points à regarder, mentionnons :

  • Les coûts
  • La pertinence des données
  • La fidélité des informations
  • La pérennité
  • La conservation
  • Etc.

Finalement, les bénéfices à utiliser le big data sont nombreux. Le fait de pouvoir compter sur un outil d’aide à la décision rapide et optimisé est de loin l’avantage le plus important. Toutefois, une entreprise qui saura correctement intégrer ce nouvel aspect dans l’analyse de son environnement pourra bénéficier :

  • D’une vue globale de ses activités
  • De valeur ajoutée à ses données internes
  • D’une synthèse  de l’ensemble de ses informations
  • … et plus encore!

Nous profitons de cette tribune pour lever notre chapeau à toute l’équipe d’Action TI et particulièrment la dynamique équipe de Nmédia Solutions qui ont su faire de cet événement un succès. Bravo à tous!

Quelques outils de géocodage

La semaine dernière, j’ai rencontré le directeur marketing d’une entreprise possédant plusieurs points de service. Sur le mur, la typique carte routière parsemée de punaises…

-C’est la localisation de vos succursales, j’imagine…
-Celles en rouge. Les bleues, ce sont les bannières concurrentes.

Le géocodage – l’opération qui consiste à attribuer une position géographique (longitude/latitude) à une adresse – a souvent été une opération manuelle et fastidieuse réalisée de manière un peu aléatoire. Pourtant, rien de plus facile! De nombreux sites Internet permettent aujourd’hui de faire le travail en quelques clics. Voici une liste – très sommaire – de quelques-uns de ces outils qui vous permettront d’obtenir des résultats plus précis que vous pourrez aisément partager avec vos collègues et collaborateurs.

http://batchgeo.com/

  • Un des sites les plus populaires, réputé pour son interface simple.
  • Permet de géocoder plusieurs adresses incluant des informations supplémentaires (ex. type de client, coordonnées, site web, etc.)
  • Permet de visualiser les points par regroupements (thématique par couleur)
  • Version payante permettant notamment l’exportation de la carte en pdf, l’intégration avec Google Street View, l’impression en haute-résolution et l’accès multi-usager.

batchgeo


https://www.geocoderpro.com/

  • Il s’agit d’une application « desktop » que vous devez télécharger et installer sur votre poste de travail.
  • Nécessite l’installation du .NET framework
  • Confidentiel ; vos données demeurent sur votre poste de travail.
  • L’application est payante (30$ pour 1000 adresses)
  • L’importation des données se fait en format Excel avec un tutorial simple et clair.
  • Permet d’exporter les résultats en une page html qui peut facilement être placée sur un Intranet ou partagée via courriel.

geocoderpro


http://www.gpsvisualizer.com/geocoder/

  • Initialement créée pour transférer des points GPS vers une carte interactive
  • L’interface n’est pas très intuitive
  • Le géocodage multiple (plusieurs adresses) n’est permis qu’avec le géocodeur de Yahoo. Le moteur de Google ne permet qu’une adresse à la fois.
  • Ne permet pas les regroupements par catégorie ou par couleur
  • L’interface permet d’exporter la carte au format html

gpsvisualizer


http://geocoder.ca/

  • La version gratuite ne permet de géocoder qu’une seule adresse à la fois
  • Le service est payant pour les adresses multiples (2,50$ pour 1000 adresses)
  • Permet le « reverse geocoding » (le géocodage à partir d’une position géographique)
  • Pour les plus expérimentés, vous pouvez télécharger la base de données des codes postaux et les centroïdes des villes canadiennes et américaines. Ces informations peuvent être intégrées dans une base de données pour développer votre propre application de géocodage.

geocoder.ca

l’indice de Pampalon

L’indice de Pampalon a été développé afin de mesurer l’intensité de la défavorisation matérielle et sociale d’une population. Il s’agit d’une information qui, dans certains contextes, peut être utile dans les analyses géomarketing.

Il peut servir, entre autres, aux services de santé ou aux organismes communautaires à cibler des secteurs d’intervention, à quantifier leur marché ou à offrir des services spécifiques. L’indice est calculé à partir d’une population de référence variable (ex. ville, province, etc.) et se base sur les données statistiques issues du recensement canadien.

Pour calculer la dimension matérielle, l’indice se base sur trois indicateurs :

  • la proportion des personnes de 15 ans ou plus n’ayant pas de diplôme d’études secondaires
  • le revenu moyen des personnes de 15 ans ou plus
  • le rapport emploi/population chez les personnes âgées de 15 ans ou plus

cartographie - indice de Pampalon - aspect social

Cartographie de l’indice de Pampalon (asepct social). © Alexandre Lebel, 2005


En ce qui a trait à la dimension sociale, trois autres indicateurs sont utilisés :

  • la proportion de personnes séparées, divorcées ou veuves
  • la proportion de familles monoparentales
  • la proportion de personnes vivant seules

cartographie - indice de Pampalon - aspect matériel

Cartographie de l’indice de Pampalon (asepct matériel). © Alexandre Lebel, 2005


Les indicateurs sont, à la base, compilés de manière individuelle et exprimés séparément (matérielle ou sociale) mais peuvent être amalgamés pour former un taux combiné.
cartographie - indice de Pampalon - indicateurs combinés

Cartographie de l’indice de Pampalon (indicateurs combinés – matériel et social). © Alexandre Lebel, 2005

Source des images : LEBEL, Alexandre « Une approche intégrée pour la définition des unités de voisinage dans le contexte d’une étude sur les inégalités sociales de la santé dans la région de Québec », 2005, Université Laval [lien]