l’utilisation du Big Data en entreprise

Mardi dernier se tenait la 4e edition du colloque Action-TI organisé par la section Mauricie-Centre-du-Québec. Sous le thème « Les TI…et si on les abordait sous toutes leurs formes », on y a présenté une vingtaine de conférences de qualité qui touchaient à un bon nombre de secteurs d’activités – allant de la gestion de projet aux infrastructures technologiques.

Nous avons eu la chance d’y donner une présentation sur l’utilisation du Big Data en entreprise, un concept actuellement éloigné de la réalité des organisations mais qui ne tardera pas à devenir un incontournable – compte tenu des nombreux défis que doivent  relever les entreprises qui sont plus que jamais sous pression de la concurrence.

Résumé de la conférence

On produit une quantité astronomique de données – envrion 5 exabytes à tous les 2 jours.

L’entreprise qui saura extraire, transformer et utiliser l’information est une entreprise qui détient du pouvoir – une longueur stratégique sur ces concurrents.

Toutefois, il est difficile d’y voir clair – considérant que le volume de données à traiter est gigantesque.

L’utilisation du Big Data, qui permet de réunir et de traiter une grande quantité d’information afin d’en obtenir des résultats concrets devient donc une alternative à considérer.

On remarque 3 phases dans une stratégie d’utilisation du Big Data:

  1. Le stockage : qui se fait maintenant de manière semi-structuré via notamment des bases de données noSQL telles que Cassandra ou MongoDB.
  2. Le traitement : le principal framework de développement est Hadoop – un projet issu de Apache. Son architecture de traitement distribué sur plusieurs ordinateurs permet de traiter une grande quantité de données rapidement et efficacement via l’algorithme MapReduce.
  3. La visualisation des données : un domaine en soit – mais qui vise à représenter de manière simple et clair les résultats de l’analyse effectuée. De nombreux outils existent à ce sujet, notamment Tableau Software ou Statwing. Les données peuvent également être réintégrés dans les CRM ou les outils d’intelligence d’affaires traditionnels tels que Pentaho ou Jaspersoft.

Bien évidemment – on ne le répètera jamais assez – l’organisation qui souhaite  se doter d’une telle infrastructure doit impérativement procéder à une analyse complète de ses besoins et de ses capacités. Parmi les principaux points à regarder, mentionnons :

  • Les coûts
  • La pertinence des données
  • La fidélité des informations
  • La pérennité
  • La conservation
  • Etc.

Finalement, les bénéfices à utiliser le big data sont nombreux. Le fait de pouvoir compter sur un outil d’aide à la décision rapide et optimisé est de loin l’avantage le plus important. Toutefois, une entreprise qui saura correctement intégrer ce nouvel aspect dans l’analyse de son environnement pourra bénéficier :

  • D’une vue globale de ses activités
  • De valeur ajoutée à ses données internes
  • D’une synthèse  de l’ensemble de ses informations
  • … et plus encore!

Nous profitons de cette tribune pour lever notre chapeau à toute l’équipe d’Action TI et particulièrment la dynamique équipe de Nmédia Solutions qui ont su faire de cet événement un succès. Bravo à tous!

segmentation B2B : les codes SCIAN

Nos récents articles sur la segmentation B2B (voir ici et ici) ont suscités beaucoup de réactions auprès de nos lecteurs. Leur principale interrogation : « C’est quoi un code SCIAN et à quoi ça sert? ». Voici donc la réponse…

Le Système de classification des industries de l’Amérique du Nord (SCIAN) est un système de catégorisation des entreprises qui a été conçu par les organismes statistiques du Canada (Statistique Canada), du Mexique (l’Instituto Nacional de Estadística, Geografía e Informática) et des Etats-Unis (l’Economic Classification Policy Committee et l’Office of Management and Budget). C’est l’Accord de libre-échange (ALENA), entré en vigueur en janvier 1994 qui a mené à la création du SCIAN. La première version a vu le jour il y a 14 ans, en mars 1998.

Le SCIAN vise à fournir des définitions communes de la structure industrielle des trois pays, ainsi qu’un cadre statistique commun pour faciliter leur analyse. Le SCIAN peut aussi servir à classer les compagnies et les entreprises. C’est dans ce cadre plus précis que nous l’utilisons pour élaborer des stratégies d’entreprises et ainsi donner une « intelligence » supplémentaire aux données de nos clients.

Il s’agit d’un système exhaustif qui s’applique à toutes les activités économiques. Puisque toutes les entreprises nord-américaines possèdent un code SCIAN, il est facile de segmenter les activités d’une entreprise et ainsi cibler d’autres organisations évoluant dans un secteur semblable.

La structure du SCIAN est hiérarchique. L’économie s’y trouve divisée en 20 secteurs que voici :

11

Agriculture, foresterie, pêche et chasse 53 Services immobiliers et services de location et de location à bail
21 Extraction minière et extraction de pétrole et de gaz 54 Services professionnels, scientifiques et techniques
22 Service publics 55 Gestion de sociétés et d’entreprises
23 Construction 56 Services administratifs, services de soutien, services de gestion des dé chets et services d’assainissement
31-33 Fabrication 61 Services d’enseignement
41 Commerce de gros 62 Soins de santé et assistance sociale
44-45 Commerce de détail 71 Arts, spectacles et loisirs
48-49 Transport et entreposage 72 Hébergement et services de restauration
51 Industrie de l’information et industrie culturelle 81 Autres services, sauf les administrations publiques
52 Finance et assurances 91 Administrations publiques

Puis, chacun des secteurs (codes à deux chiffres) se divisent par la suite comme suit :

  • des sous-secteurs (codes à trois chiffres),
  • des groupes (codes à quatre chiffres)
  • des classes (codes à cinq chiffres).

Par exemple :

  • [23] Construction
  • [238] Enetrepreneurs spécialisés
  • [2381] Entrepreneurs en travaux de fondation, de structure, et d’extérieur de bâtiment
  • [23816] Entrepreneurs en travaux de toiture

Pour avoir plus de détails sur les SCIAN complets, visitez la page officielle de Statistique Canada.

business intelligence, geoBI et géomarketing

La semaine dernière, des clients m’ont questionné quant à la différence qui existe entre le BI, le geoBI et le géomarketing. Bien souvent, la ligne est mince entre ces trois appellations. Pourtant, des différences cruciales les distinguent.

Business intelligence
Lorsque l’on parle de BI (pour “business intelligence”) ou intelligence d’affaires, on réfère généralement à la technique qui permet d’analyser les données d’entreprises (ex. le total des ventes par produit ou par vendeur). Ces données sont alors présenté sous forme de tableaux ou de diagrammes (on parle alors de tableaux de bord – dashboards en anglais).

Le geoBI
La technique demeure la même lorsque l’on introduit la dimension géographique dans le BI (le géoBI), à la seule différence que les résultats produits peuvent maintenant être représentés sur une carte géographique. On parle ici d’analyse “spatiale”, où les indicateurs produits peuvent s’apparenter à : Quel est le volume des ventes pour un produit X dans la ville Y, quelle est la facture moyenne dans le territoire du vendeur Z, etc.

Le géomarketing
Dans les cas qui précèdent, ce ne sont que les données internes à l’entreprise qui sont manipulées et analysées. Dans le cas du géomarketing, on intègre des données externes provenant de sources publiques ou privées (ex. recensement ou annuaires d’entreprises spécialisées). Cette technique permet ainsi de donner une nouvelle dimension aux informations de l’entreprise. On peut ainsi obtenir des profils socio-économiques, des listes de clients potentiels, des taux de pénétration dans les marchés ou des territoires ciblés, des indicateurs de performance basés sur la population ou les entreprises présentes dans un secteur, etc…