Share:

Bien que la perspective d’obtenir des informations fiables avec l’apprentissage automatique (ML) et l’analyse de données basée sur l’IA puisse sembler écrasante, elle n’a pas à l’être, explique John Loughlin, technologue en chef de Cloudreach.

Dans un webinaire de juin 2020, nous avons discuté de la façon d’aborder l’analyse de données avec pragmatisme et confiance en utilisant google Cloud Data (GCD) Services.

Nous récapitulons ici ces conseils, en donnant un aperçu de la façon dont les entreprises peuvent mettre en œuvre les éléments constitutifs pour devenir une organisation axée sur les données à l’aide des services GCD.

Commencez par les fonctionnalités de base de la gestion des données : sécurité et gouvernance

Gardez à l’esprit que l’objectif global – permettre l’analyse qui ouvre la porte à de meilleures décisions commerciales – repose sur les valeurs fondamentales de sécurité et de gouvernance, qui, ensemble, fournissent le contexte pour une utilisation efficace de la technologie.

Gestion des données Sécurité

La protection des données est fondamentale pour votre programme et pour que vos parties prenantes puissent bien faire les choses. Les notes importantes à garder à l’esprit comprennent:

  • Utilisez des pratiques de gestion des identités et des accès conformes au principe du moindre privilège, ce qui signifie que vous accordez aux utilisateurs juste assez d’accès pour accomplir la tâche à accomplir. Cela réduit l’impact potentiel si les informations d’identification sont compromises.
  • Chiffrez les données au repos et en mouvement. (Il s’agit d’une pratique courante dans le Cloud.)
  • Vous pouvez gérer les clés de chiffrement de la même manière que vous le feriez sur site à l’aide de Google Cloud Key Management Service (KMS).

Gouvernance des données

Des cas récents de données exposées qui ont fait l’objet d’une grande publicité ont attiré l’attention sur la gouvernance des données et conduit à des exigences de plus en plus strictes.

Il existe des outils et des moyens de vous aider à gérer cela et à vous assurer que vous opérez à la pointe de la gouvernance des données. Il s’agit notamment du catalogue de données et du service de gestion des métadonnées, ainsi que des audits, certifications et attestations tiers par rapport aux normes mondiales.

Options de base de données : Transactionnel ou Analytique

Pour obtenir des performances à grande échelle lors du passage de systèmes locaux à des systèmes de base de données basés sur le Cloud, tenez compte de vos données et de leur utilisation.

Allez-vous travailler avec des données qui sont schéma-en-lecture ou schéma-en-écriture ? (C’est-à-dire les données structurées et relationnelles par rapport aux [think of a spreadsheet]données non structurées ou semi-structurées, telles que les données transmises à partir d’appareils ou les données de capteurs.)

Effectuerez-vous le traitement des transactions ? Les fonctions impliquant l’achat ou le transfert d’argent nécessitent un petit travail discret ou plusieurs travaux qui doivent se faire en tant qu’unité. La réponse vous aide à déterminer si vous interrogerez des éléments de données individuels ou des ensembles d’éléments et, à son tour, si vous avez besoin d’un système de traitement transactionnel ou d’un système analytique.

Une fois que vous avez déterminé quel type de système de gestion de base de données répondra le mieux à vos besoins, GCP fournit une gamme d’outils entièrement managés et évolutifs pour vous aider à vous lancer et à démarrer. Voici quelques options :

  • Cloud SQL/Cloud Spanner : Cloud SQL vous permet d’exécuter des services de base de données relationnelles entièrement gérés, tandis que Cloud Spanner, conçu pour évoluer horizontalement, est une bonne option pour les très grands systèmes opérationnels.
  • BigQuery : idéal pour les charges de travail analytiques.
  • Cloud BigTable : conçu pour héberger des données moins structurées qui n’ont pas leur place dans une base de données relationnelle.

Analytique : une progression des capacités, de la complexité et de la vitesse des données

Les experts de l’industrie ont massivement observé que l’analyse de données est une progression – une capacité cumulative qui passe de la base à la sophistication en termes de capacités, de complexité des données sur lesquelles vous basez vos décisions et de vitesse à laquelle vous opérez.

Progression de

l’analyse L’infographie Progression de l’analyse illustre le processus de maturation se déplaçant de gauche à droite le long des niveaux de progression de la capacité des données, de la description (données relationnelles) et du diagnostic (devient plus basé sur des règles) à la prédiction (données multi-sources, y compris les techniques d’apprentissage automatique) et prescriptive (données en streaming en temps quasi réel).

Cloudreach a vu cette progression se manifester à plusieurs reprises tout au long de son expérience pour aider les clients à transformer les pratiques en matière de données. Le niveau de confort et la capacité à produire des applications analytiques fiables proviennent de cette maturation de gauche à droite (voir graphique « Progression de l’analyse »).

En d’autres termes, attendez d’être à l’aise avec les flux de données, la transformation des données, la collecte à partir de plusieurs sources et la contextualisation des données avant de vous lancer dans une analyse prescriptive.

Comment GCP facilite le voyage vers des capacités d’analyse de données sophistiquées

Cela étant dit, il n’est pas nécessaire que ce soit un processus incroyablement long. GCP facilite ce processus en rendant l’infrastructure disponible sous une forme simplifiée et facilement consommable qui facilite l’expérimentation accélérée du stockage et de la gestion des données.

Cela élimine le besoin de rechercher de la capacité de réserve auprès des serveurs sous licence ou d’acheter des versions temporaires de logiciels. Obtenir les outils dont vous avez besoin pour exécuter ces expériences est simplifié, ce qui vous permet d’explorer les possibilités et d’obtenir l’expérience pratique dont vous avez besoin pour renforcer la confiance – et des capacités d’analyse plus sophistiquées.

GCP Services documente et met également à disposition les meilleures pratiques sur la façon de construire divers composants et d’accomplir des tâches spécifiques, ce qui aide à minimiser le risque de créer une accumulation lourde de pratiques et de systèmes de production non éprouvés.

Outils GDC qui permettent des informations basées sur le ML et l’IA

ML/ AI

GCP fournit plusieurs outils clés qui vous aident à construire une base solide prenant en charge les capacités analytiques de ML et d’IA, tels que :

  • Ingestion de données à l’échelle du téraoctet (nécessaire pour transformer les données en temps réel)
  • Streaming et pipeline de données fiables
  • Entreposage de données plus rapide et informations prédictives
  • Visualisation avancée des données/visualisation des événements

Lier les pratiques d’analyse de données à la réalité : réussite des clients

Cloudreach possède une vaste expérience pour aider les clients à tirer pleinement parti de tout ce que GDC Services a à offrir. Notre entreprise a été en mesure de faire une différence pour nos clients en utilisant ces outils, y compris le gain client ci-dessous.

Les DOT d’État utilisent l’analyse prescriptive pour développer une plate-forme de gestion du trafic

Dans un cas qui illustre clairement comment devenir axé sur les données est un processus progressif, Cloudreach a travaillé avec le ministère des Transports (DOT) dans plusieurs États pour créer des plates-formes de gestion du trafic qui utilisent des techniques d’analyse de données prédictives et prescriptives.

Ces projets impliquaient la migration d’un système de gestion de base de données relationnelle (SGBDR) vers l’intégration BigQuery de données supplémentaires (par exemple, des données de capteurs). Les DOT ont commencé par des rapports descriptifs et des analyses descriptives, générant des informations sur leurs réseaux routiers, tels que les charges de circulation, les emplacements des projets de construction et les taux d’accidents dans des zones spécifiques.

Progressant vers l’intégration des données des capteurs, les DOT ont permis le développement de plates-formes sophistiquées de gestion du trafic qui augmentent la connaissance de la situation des modèles et de la coordination des réponses, ainsi que la prévision de la gestion des routes et des appareils et même des impacts météorologiques potentiels.

Technologies clés utilisées : BigQuery, BigTable, Cloud Spanner, DataFlow, BigQuery BIS, Cloud ML, Pub/Sub et Cloud IOT Core

Vous voulez en savoir plus ?

Approfondissez ce sujet en consultant Laying the Foundation : How to Effectively Build out Core Capabilities Using Google Cloud Data Services ou Contactez-nous dès aujourd’hui.