Pourquoi le backup de données Salesforce est-il important ?

Selon la dernière étude d’Intel (Intel Security Study: No shortage of complaints about cloud service providers: Survey) concernant les fournisseurs cloud:
– 23% des clients reconnaissent avoir connu une perte ou une corruption de données
– 20% ont eu des accès non autorisés à leurs services ou leurs données

L’origine des pertes de données peuvent être attribuées à 3 types d’évènement :

  1. Une malveillance externe
  2. Une défaillance de l’infrastructure
  3. Une erreur interne

Salesforce assure déjà un très haut niveau de sécurité. Salesforce prévient d’une perte de données qui serait liée à un problème d’infrastructure (incendie du datacenter, inondation, ou encore corruption du disque dur) et a plusieurs protections en place pour prévenir une malveillance externe. De plus, Salesforce vous permet de générer des fichiers de sauvegarde de vos données sur une base hebdomadaire ou mensuelle en fonction de votre édition (vous pouvez donc perdre au pire jusqu’a une semaine ou un mois de données). Ce n’est toutefois pas suffisant pour des entreprises ayant des exigences de data ou de sécurité élevées.

De notre expérience chez Odaseva, 30% des clients ont été confrontés à un incident de données Salesforce à l’issue de mauvaises manipulations, lors d’intégration de données avec des systèmes tiers ou à cause d’un comportement inapproprié de leurs utilisateurs. Ce type d’incident a nécessité l’exécution d’une procédure de restauration des données.

Se protéger de la corruption de données (erreur de la part d’un utilisateur ou altération intentionnelle)

Si les Clouds Publics apportent un niveau de sécurité dans les règles de l’art, les clients peuvent toutefois perdre des données ; perte généralement liée à une erreur humaine, qu’il s’agisse d’une donnée supprimée accidentellement ou bien une réécriture. Lorsqu’un utilisateur Salesforce supprime une donnée dans son organisation Salesforce, la donnée n’est conservée que pendant 15 jours par Salesforce dans la corbeille. Salesforce propose également une offre de Data Recovery Service (https://help.salesforce.com/articleView?id=000003594&type=1) qui étend cette option à 90 jours mais peut s’avérer cher ($10,000), prendre plusieurs semaines pour récupérer des fichiers CSV, prendre ensuite plusieurs mois pour les remettre dans Salesforce, ce qui peut s’avérer non adapté au regard de la complexité requise ou du niveau d’exigence de réactivité nécessaire.

D’autres raisons peuvent emmener les utilisateurs Salesforce à vouloir protéger leurs données comme par exemple :

  • Préparer un retour arrière (rollback) suite à une migration de données
  • Archiver ses données dans un objectif d’archivage légal
  • Répliquer ses données dans un autre environnements (data warehouse/BI)
  • Capturer différentes versions de la données dans le temps

Challenge

Mettre en place un plan de backup robuste peut soulever de nombreux problèmes techniques. Avant de vous engager dans ce type de projet, posez-vous les bonnes questions :

Quel type de backup avez-vous besoin ?

Vous pouvez opter pour différentes typologies de backup de vos données : full backup, incrémental backup ou backup partiel. Chacun avec ses pours et ses contres.

Backup Type Commentaires Pour Contre
Full Protège toutes les données Sauvegarde l’intégralité des données Peut nécessiter un certain temps et représente un large volume de données à gérer. En cas d’incident la restauration peut donc prendre plus de temps
Incrémental Backup focalisé sur la différence depuis le dernier full backup. L’API data réplication API de Salesforce est particulièrement adaptée à ce choix Efficace pour retrouver un changement survenu à une date spécifique. Le volume de data est plus petit et donc plus facile à gérer Peut manquer de détail et prendre beaucoup plus de temps en cas de restauration (il faudra donc restaurer le dernier full backup et les derniers backup incrémentaux)
Partiel Backup une partie ciblée de l’ensemble des données (par exemple, les clients Italiens) Efficace pour restaurer une donnée ciblée. Solution idéale pour un ciblage de données, dans le cadre d’un archivage de performance par exemple (ie les données vieilles de plus de 5 ans) Peut manquer de détail sur la relation entre les objets

Il est également possible de choisir plusieurs stratégies de backup pour optimiser un plan de recouvrement d’activité (Disaster Recovery Plan en anglais), dans le cadre d’un plan plus global de Business Continuity, avec une procédure de sauvegarde ciblant les données critiques d’un système d’information d’entreprise. Un plan de sauvegarde complet peut par exemple prendre la forme d’un full backup hebdomadaire, d’un backup incrémental tous les jours pour la plupart des données et d’un backup incrémental toutes les heures pour les données métiers les plus critiques.
Lorsque que vous faites le choix d’un outil pour mettre en œuvre une stratégie de backup qui corresponde au besoin de votre entreprise, vous pourrez prendre en considération differentes options :
– S’appuyer sur des fonctionnalités natives de Salesforce (Weekly Data Export, Data loader)
– Développer votre propre solution en utilisant des API
– Opter pour une solution spécialisée dans le backup de Salesforce.
Ici aussi, chaque option a ses pour et ses contre mais il est conseillé de prendre en considération les notions ci-dessous:

Sécurité

Quel que soit votre choix, la sécurité doit être au cœur de votre stratégie. Cela signifie par exemple de prendre en compte l’encryption de ses données. Vous pouvez considérer avoir un bon niveau de sécurité des données en suivant ces 3 notions :

  • Infrastructure de stockage de la données (data location, disk capacity, redundancy, availability, encryption of the data at rest, encryption key management, physical security access, authentication, access logs, and other security requirements)
  • Rétention et Durabilité des backups: il faut à la fois conserver les backup sur une durée alignée avec vos besoins mais aussi alignée avec les réglementations (exemple : il ne faut pas avoir une Rétention illimitée des données personnelles dans le cadre de la GDPR). De plus, pour les backups nécessitant une rétention élevée, une durabilitée élevée garantira une intégrité des backups dans le temps
  • Encryption des données Serveur et Granulaire : non seulement les serveurs qui stockent les backups doivent être encryptés (rend illisible un disque dur s’il se fait voler), il faut idéalement aussi encrypter les données au niveau granulaires (rend illisible la donnée si un hacker arrive à rentrer sur le serveur)

Restauration de la donnée

Le backup implique naturellement la question de la restauration de la donnée. Il est conseillé de prendre en compte les éléments suivants :

  • La capacité à restaurer rapidement des enregistrements
  • La capacité à restaurer massivement des enregistrements et à reconstruire toutes les relations entre les objets
  • Les enjeux de la restauration de la données en parallèle des enjeux de data quality (un problème de qualité de la donnée peut empêcher une restauration de données)
  • Les enjeux de la restauration de la données en parallèle des enjeux d’intégration (une restauration d’enregistrement peut casser le fonctionnement d’une intégration système)
  • Les enjeux de la restauration de la données en parallèle des automatisations en place (une validation rule ou un workflow salesforce pourra empêcher ou altérer par exemple la restauration d’un enregistrement)

Tolérance aux échecs (Fault Tolerance) et Scalabilité

Les solutions de sauvegarde des données se doivent de tolérer un niveau minimum d’échecs sans nécessiter d’intervention humaines. Les solutions asynchrones (Bulk API) propose par exemple un niveau basique de tolérance à l’erreur (tentatives successives automatiques). Si les critères listes ci-dessous sont important à vos yeux, il pourra être intéressant d’avoir une solution qui inclut la notion de Fault Tolerance.

  • Volumes importants
  • Stabilité des backup & stratégie de retry pour faire fonctionner les opérations
  • Degré d’automatisation du backup/restore
  • Supervision et optimisation des backups
  • Vitesse et Performance des opérations (par exemple besoin d’opération parallélisées)

Et n’oublions pas les besoins critiques de Personnalisation et d’Automatisation du backup

Avec les API de Salesforce, il est possible de contrôler la totalité d’une procédure de backup. Il sera intéressant de considérer une solution avec un haut niveau de flexibilité qui pourront correspondre à vos attentes:

  • Control du périmètre de Backup/Restore (par exemple : fichiers, données et/ou metadonnées)
  • Fréquence des backups (toutes les heures ? tous les jours ? toutes les semaines ?)
  • Besoin d’une personnalisation du plan de backup (mix d’un plan de backup full et incrémental, priorisation du backup de certaines données, etc)
  • Maintenance d’un plan de backup (détection automatique des changements dans un datamodel, compatibilité avec les nouvelles versions de Salesforce, etc)

Pour en savoir plus sur les bonnes pratiques relatives à la sauvegarde et à la restauration des données Salesforce, rendez-vous sur la série d’articles co-écrite avec le département CCE (Customer Centric Engineering) de Salesforce :

La data est au coeur de la croissance de nos entreprises, prenons-en soin.
Sovan Bin, CEO & Founder, Odaseva
http://www.odaseva.com

Sovan Bin
Close
Go top