EMC étend son portefeuille de solutions Data Lake, comprenant de nouveaux produits, ainsi que de nouvelles fonctionnalités. Objectif : permettre aux entreprises d’étendre le Data Lake : des postes décentralisés au datacenter et au cloud.

Ces nouveaux produits -Isilon SD Edge, Isilon OneFS et Isilon Cloud Pools- permettent une meilleure gestion des Data Lake, notamment par l’accessibilité aux données non-structurées et cela où qu’elles soient.

Les nouvelles solutions EMC Isilon consolident de multiples flux de données permettant aux utilisateurs d’accéder à des données provenant de différentes sources, pour ensuite les analyser et en tirer une vraie valeur.

Ces nouvelles solutions viennent répondre à trois défis majeurs auxquels les entreprises font face :

– les entreprises deviennent plus globales avec des collaborateurs mobiles;

– le volume de données non-structurées double chaque année; il convient de les gérer efficacement tout en en tirant de la valeur;

– le cloud hybride est devenu une option pour permettre aux clients de gérer leur data center plus efficacement.

Dès son origine, Isilon s’est taillé une solide réputation sur le marché des grands systèmes NAS grâce à ses systèmes Isilon IQ et à leur système d’exploitation OneFS. Dans sa nouvelle version, résolument orientée big data, OneFS est encore plus granulaire; il étend les capacités de roll-back et de mise à jour sans interruption d’activité pour étendre le Data Lake en connectant les données non structurées qui se trouvent dans l’entreprise, sur le cloud et en périphérie.

«Le besoin est réel : le volume de données non structurées est quasi exponentiel; je vois aussi que les systèmes portables se perfectionnent et se généralisent et que le nombre d’appareils par utilisateur ne cesse d’augmenter, constate Arnaud Bacros, Country Manager, Belgium & Luxembourg, EMC. Gartner estime à 30 milliards le nombre d’appareils connectés dans le monde en 2020, un ordre de grandeur six fois supérieur à ce qu’il est aujourd’hui… et tous ces appareils produiront des données à un rythme soutenu !»

Outre OneFS, EMC introduit Isilon SD Edge d’EMC, une solution de stockage SDS (software-defined) sur fichiers que l’on peut déployer sur du matériel standard pour étendre la périphérie du Data Lake par incrément de 36 To et EMC CloudPools qui étend le Data Lake au cloud, améliorant ainsi le niveau d’efficacité en utilisant le cloud comme un niveau d’archivage des données froides, lesquelles restent accessibles pour les analyses à la demande.

Avec la solution Isilon SD Edge, EMC procure une capacité exceptionnelle : un maximum de 36 To par emplacement en périphérie, ce qui garantit aux succursales les capacités de stockage requises pour être productives, commente Arnaud Bacros. «Isilon SD Edge est une solution 100% logicielle qui s’exécute dans VMware sur des systèmes matériels standard et offre aux entreprises des coûts avantageux et de multiples possibilités de déploiement. C’est aussi une cohérence des protocoles et des services de données : la souplesse d’accès aux données est sans égale, avec une prise en charge multiprotocole pour HTTP, SWIFT, HDFS, SMB et NFS.»

Étape suivante : le cloud. La nouvelle application CloudPools contribue à l’expansion du Data Lake sur le cloud en prévoyant un niveau de stockage pour les «données gelées». L’aspect le plus intéressant de cette application est qu’elle ne nécessite aucune passerelle d’accès au cloud. De plus, les utilisateurs et les applications conservent à tout moment la possibilité de visualiser et de consulter ces données.

Arnaud Bacros parle de vraie montée en puissance dans le cloud : «dépassez la limite actuelle de 50 Po d’un seul cluster Isilon et profitez des performances du cloud pour vous affranchir des obstacles et des limites de stockage. Qui plus est, toutes les données CloudPools sont partagées, compressées et chiffrées pour garantir une protection optimale. Il vous suffit de sélectionner un cloud adapté à votre entreprise parmi un vaste choix de fournisseurs de clouds publics, dont Virtustream, Amazon Web Services et Microsoft Azure. A la clé, des économies plus que sensibles : vous accédez à des capacités de stockage quasiment illimitées tout en évoluant vers un modèle de coût basé sur des dépenses d’exploitation.»

 

Avez-vous besoin d’un Data Lake… maintenant ?

L’univers numérique, qui comprend la plupart des besoins de données de l’entreprise, devrait croître de 40% par an au cours de la prochaine décennie. Rester compétitif nécessite d’utiliser l’analyse de données, notamment pour prédire les comportements d’achat, mais aussi la conduite des projets d’innovation qui permettront d’améliorer le service à la clientèle ou d’améliorer la productivité. Ce qui veut dire assembler, stocker et analyser de grandes quantités de données. Pour EMC, les analytics ne devraient plus être une aspiration, mais une réalité !

Une entreprise sur deux (49%) a conscience qu’elle peut obtenir un aperçu plus précieux de l’information et des données, mais ne sait pas comment. Aujourd’hui, moins d’une entreprise sur cinq (19%) est capable de fonctionner en temps réel et une sur trois (33%) planifie de le faire…

Investir dans un Data Lake ? EMC a identifié quatre signes révélateurs.

D’abord, la complexité opérationnelle. Vous essayez de faire évoluer votre infrastructure, mais vous manquez de ressources. Ensuite,

les coûts d’exploitation : vous essayez de réduire les dépenses d’exploitation, mais les demandes du business vous poussent à investir. Troisième signe : vos applications analytiques existantes exercent une pression sur vos systèmes de production; vos analyses en temps réel peuvent être très gourmandes en ressources. Enfin, quatrième signe : vos données sont exécutées sur différentes distributions Hadoop et vous ne vous en sortez plus.

Quel que soit le secteur d’activité, chacun pense que ses problèmes et opportunités sont uniques. Or, on en revient toujours aux défis universels. Les organisations se tournent vers les Data Lakes lorsqu’elles recherchent un niveau élevé de performances de traitement et souhaitent pouvoir gérer de façon économique des très gros volumes de données. Ce qui différencie un Business Data Lake d’un Data Lake générique est la possibilité de gouverner les données en accord avec les besoins métiers. La maîtrise des données est plus souple, ce qui permet de rendre celles-ci accessibles dans toute l’entreprise à des fins d’analyse.

 

Fonctionnement d’un Data Lake

Les Data Lakes offrent un environnement automatisé en libre-service pour réaliser les opérations suivantes :

  • Acquisition : collecte de données à partir d’un nombre illimité de sources (ERP, métier, bases de données, web, réseaux sociaux etc..)
  • Stockage : stockage des données dans leur format brut ou après modification (ETL).Elles sont accessibles simultanément par de nombreux protocoles d’échange de données dont HDFS (Hadoop) (qui est la porte d’accès aux outils big data).
  • Analyse : algorithmes avancés pour l’analytique prévisionnelle.
  • Mise à disposition : présentation des données aux consommateurs (utilisateurs et applications) en fonction des besoins.
  • Action : développement et mise à disposition de nouveau code logiciel à partir des informations nouvellement acquises.

Quels sont les avantages d’un Data Lake  

– Mélange les données structurées et non structurées pour créer de la valeur informationnelle, lancer de nouveaux services et de nouveaux produits; personnalise l’offre pour chaque client et anticipe leurs besoins.
– Simplifie l’infrastructure de stockage en l’unifiant sur un socle unique.
– Valorise le patrimoine historique des données de l’entreprise dans le cadre de nouveaux projets.

 

Summary
 EMC renouvelle l'offre Isilon
Article Name
EMC renouvelle l'offre Isilon
Author