Fivetran soutient l’automatisation du Modern Data Lake sur Amazon S3

Fivetran, spécialiste mondial dans le domaine de l’automatisation des mouvements de données, a annoncé la prise en charge d’Amazon Simple Storage Service (Amazon S3) avec le format de Data Lake Apache Iceberg. Amazon S3 est un service de stockage de données d’Amazon Web Services (AWS) qui offre une évolutivité, une disponibilité des données, une sécurité et des performances de premier ordre. Apache Iceberg est un format de données open-source largement supporté qui offre des transactions algorithmiques, cohérentes, isolées et durables (ACID) pour les data lakes. Fivetran est une plateforme automatisée de transfert de données qui anonymise les informations personnelles identifiables (PII) tout en nettoyant, normalisant et chargeant automatiquement les données dans le Data Lake.

Grâce à une capacité de stockage étendue et à la prise en charge de plusieurs formats de données, le Data Lake est une solution très prisée par les équipes qui effectuent des analyses sur des ensembles massifs de données ou qui mènent des projets de Data Science de grande envergure qui contribuent à l’activité de l’entreprise. Des centaines de milliers de data lakes fonctionnent sur Amazon S3 et, parmi les nombreuses équipes des entreprises qui les ont déjà mis en œuvre, une majorité cite l’amélioration de l’agilité de l’entreprise, l’amélioration du développement de produits et de services, ainsi que l’amélioration du service et de l’engagement des clients comme des avantages des data lakes.

« Fivetran prend en charge S3 en tant que solution de destination, ce qui représente une grande avancée pour notre plateforme Distilled et pour tous ceux qui développent des données externes et des produits analytiques. », a déclaré Aaron Peabody, cofondateur et CEO d’Untitled Firm. « Cette nouvelle destination permet à nos clients d’exploiter tout le potentiel des services AWS. Nous sommes ravis que Fivetran ait investi dans cette destination, car elle est un catalyseur de force multiplicatrice pour notre propre feuille de route de produits chez Untitled. »

« Nous extrayons, nettoyons, dédupliquons et préparons automatiquement à l’analyse de grands volumes de données semi-structurées pour alimenter les data lakes de la même manière fiable et sécurisée que nos clients obtiennent aujourd’hui leurs données dans leurs warehouses cloud », a déclaré Fraser Harris, Vice-President of Product chez Fivetran. « Fivetran et AWS partagent la même vision : sans structure, sans gouvernance et sans précision des données dans le data lake, les entreprises augmentent inutilement la complexité et ne réalisent pas la pleine valeur des données qu’elles y stockent. La mission de Fivetran est de rendre l’accès aux données aussi simple et fiable que l’électricité, et ce nouveau soutien porte cette promesse dans le monde des data lakes. »

« Nous sommes ravis que l’accessibilité d’Amazon S3 avec Iceberg continue de se développer », a déclaré Greg Khairallah, Director of Analytics chez Amazon Web Services. « C’est un moyen facile pour nos clients de simplifier l’ingestion de données tout en offrant aux clients l’évolutivité d’un data lake et la transformation fiable des données d’un Data Warehouse. »

À mesure que les enterprises continuent de tirer parti des data lakes pour exécuter des analyses et extraire des informations de leurs données, les équipes de Marketing Intelligence progressistes en demandent davantage, et des solutions telles qu’Amazon S3 et la prise en charge des pipelines automatisés répondent à cette demande. Tinuiti, l’une des plus grandes entreprises indépendantes de marketing à la performance, traite quotidiennement d’importants volumes de données et doit disposer d’un data lake – Amazon S3 en particulier – pour alimenter le potentiel de la marque de ses clients.

« Le data lake est un moyen facile, abordable, sécurisé et robuste de stocker toutes les données de nos clients », explique Lakshmi Ramesh, Vice-President, Data Services chez Tinuiti. « Le principal défi consiste à optimiser les performances et l’accessibilité, mais la prise en charge par Fivetran d’Amazon S3 avec Iceberg permettra d’optimiser davantage notre pipeline Fivetran. Le data lake étant notre source unique de vérité, il est essentiel que toutes les données ingérées à partir de différentes sources soient accessibles dans le data lake. »

Au lieu de se focaliser sur toutes les étapes manuelles nécessaires pour ingérer les données, les nettoyer, les préparer à l’utilisation, hacher et bloquer les données sensibles, puis commencer à les interroger, les entreprises modernes voient une grande valeur dans la réduction des efforts de gestion du data lake grâce à l’automatisation des pipelines et à la gouvernance.

« La prise en charge d’Amazon S3 par Fivetran et sa normalisation du format Iceberg facilitent plus que jamais l’accès des entreprises à leurs données », déclare Tomer Shiran, cofondateur et directeur général de Dremio. « Avec Fivetran, AWS et Dremio, les entreprises peuvent construire leur architecture open data lakehouse pour que les utilisateurs accèdent et consultent rapidement les données et fournissent des informations commerciales critiques basées sur les données. »

A propos de Fivetran :

Fivetran automatise le mouvement des données à la fois depuis, vers et à travers les plateformes de données cloud. Fivetran automatise les parties les plus laborieuses du processus d’ELT, de l’extraction à la transformation, afin que les ingénieurs data puissent se concentrer sur des projets à plus fort potentiel, tout en ayant l’esprit tranquille. Grâce à un taux de disponibilité de 99,9 % et à des pipelines à rétablissement automatique, Fivetran permet à des centaines de grandes marques du monde entier, dont Autodesk, Conagra Brands, JetBlue, Lionsgate, Morgan Stanley et Ziff Davis, d’accélérer leurs décisions fondées sur la data et de soutenir leur croissance. Fivetran est basée à Oakland, en Californie, et possède des bureaux dans le monde entier.

Quitter la version mobile