Green Digital Factory

Introduction

La « data » est devenue un élément essentiel dans le management (stratégique ou opérationnel) de toute organisation (entreprises, administrations). Elle peut prendre de nombreuses formes, et être plus ou moins abondante : le « big data » devient de plus en plus courant. L’extraction et le traitement de la data doivent être simples et rapides pour qu’elle puisse être exploitée efficacement. Les sources de la data sont multiples : elle peut provenir d’organismes publics ou privés (INSEE, Banques Centrales, OCDE, Bloomberg, Reuters, banques privées, syndicats professionnels, etc…). Elle peut provenir d’institutions nationales, étrangères ou internationales. Elle peut être interne à l’entreprise (clients, comptage, etc…). Elle peut être accessible gratuitement par tout le monde (open data), payante, d’accès réservé ou confidentielle. La data peut avoir de nombreux formats (JSON, CVS, XML…), et des fréquences allant du « high speed » (de la seconde) aux données quotidiennes, hebdomadaires, mensuelles…

Objectif : création d'une Green Digital Factory

Neutral-IT et DataLearning se sont associées pour créer  une offre, Digital Factory, en complément ou en remplacement du SI interne du client. Cette offre est Green, car adossée aux datacenters écoresponsables de Neutral-IT, dont la chaleur fatale est utilisée pour chauffer l’eau des bâtiments-hôtes (par conception, leur PUE est extrêmement faible), et dont les serveurs sont de seconde main, ce qui permet de réduire sensiblement leur empreinte carbone.

Les différentes étapes de notre Green Digital Factory sont :

    I] Collecte des données

  • Saisie de données : Données saisies manuellement par une personne de l’entreprise
  • Envoi de courriel de données
  • Capture de données : Données récupérées automatiquement sur les différents supports de l’entreprise
  • Récupération de données internes ou flux internes à votre entreprise par connexion par API
  • Senseurs internes, robots industriels, IOT, bases de données clients…
  • Acquisition de données : données existantes mais hors de l’entreprise :
  • Connexion à des sources externes à votre entreprise via une API (services payant tel que Bloomberg, Reuters, … ou open source)

La récupération des données nécessite le consentement des personnes concernées et se cantonne à celles nécessaires à l’objectif fixé.

II ] Stockage de l’information

  • Stockage des données sur nos serveurs (données structurées ou non-structurées)
  • Sauvegarde et archivage

Les données sont stockées sur des supports chiffrés, dont l’accès est sécurisé par firewall, rupture protocolaire, authentification par clé AES ou ECC et isolations des réseaux.

III] Traitement de l’information

  • Nettoyage des données, data wrangling
  • Organisation de l’information, combinaison des données disponibles pour créer de nouvelles informations, basées sur du machine Learning et de l’intelligence artificielle.
  • Utilisation de différents outils d’analyse tels que le Machine Learning

L’infrastructure distribuée est particulièrement efficace pour le traitement de données parallèles et le calcul distribué. En effet, les données peuvent être morcelées sur différents supports physiques et prétraitées par les processeurs locaux, puis rassemblées pour un traitement final. Ainsi, la puissance de traitement de l’ensemble des nœuds de stockage est mise à contribution, optimisant la vitesse de traitement de l’information.

IV] Sauvegarde des résultats

  • Sauvegarde et copie des résultats du traitement des données dans un environnement sécurisé.

V] Diffusion de l’information

  • Accès au Dashboard online à accès restreints
  • Partage de l’information via l’envoi de courriel / alertes de documents directement exploitables

L’outil permet à l’entreprise d’obtenir un tableau de bord qui l’aidera dans ses décisions opérationnelles et stratégiques.

Les données pourront, si l’utilisateur le souhaite, être exploitées sur tous les logiciels de traitement de données habituels (Excel, R, Eviews, Stata, Statistica, etc…).

VI] Suppression des données

  • Archivage, anonymisation, suppression des données non nécessaires

La Green Digital Factory permet au client d’accroître sa productivité, d’optimiser la prise de décision, tout en contribuant au développement d’un numérique responsable. La RSE des entreprises profite directement de l’utilisation de nos solutions.

Objectif : création d'une Green Digital Factory

Dans l’exemple ci-contre, nous traitons les données issues de la DREES sur le statut vaccinal des personnes positives au COVID.

Les données d’origine sont disponibles sur le site https://data.drees.solidarites-sante.gouv.fr/explore/dataset/covid-19-resultats-issus-des-appariements-entre-si-vic-si-dep-et-vac-si/  Nos robots collectent les données quotidiennement à 17h et les stockent dans nos bases de données en accord avec leurs licences d’utilisation.

nous pouvons facilement visualiser un tableau de bord, dont nous vous présentons ci-dessous un petit extrait :

Pour un aperçu plus exhaustif, une utilisation interactive ou toute question, demandez votre accès de test gratuit grâce au formulaire ci-dessous :