Uber utilise Presto pour améliorer la flexibilité de l’entreposage et de l’interrogation des données

Must Try

Compte tenu de la taille et de la complexité croissantes des données d’entreprise, la technologie est constamment mise à jour. Et le moteur de requêtes distribué PrestoDB est sur le point de fournir une série d’améliorations en matière de veille économique et d’analyse à grande échelle, selon Girish Baliga (photo, à droite), président du conseil d’administration de la Fondation Presto et directeur principal de l’ingénierie chez Uber Technologies Inc.

« Presto est un moteur inestimable qui peut se connecter à tous ces différents formats de stockage et de données », a déclaré Baliga. « Cela nous permet également d’avoir un point d’entrée unique pour que nos utilisateurs puissent exécuter leurs moteurs SQL et obtenir des informations assez rapidement par rapport à certains des autres moteurs que nous avons chez Uber. »

Uber a ses propres déploiements internes, pour lesquels il s’appuie fortement sur Presto étant donné le choix de l’entreprise d’une pile de données ouvertes. Presto joue également bien avec les autres formats de données et de stockage open source comme Hadoop, Hive et Spark, a ajouté Baliga.

Baliga et Steven Mih (photo, à gauche), co-fondateur et PDG d’Ahana Cloud Inc., se sont entretenus avec Lisa Martin, analyste du secteur theCUBE, avant l’AWS Startup Showcase : « Data as Code — The Future of Enterprise Data and Analytics », diffusé le 5 avril. Ils ont discuté des lacs de données ouvertes, de l’entreposage et des mises à jour passionnantes de la Fondation Presto. (* Divulgation ci-dessous.)

L’entreposage de données traditionnel examiné

Pendant des années, les organisations se sont appuyées sur un style d’entreposage de données pratiquement inchangé pour leur intelligence d’affaires et leurs analyses. Dans sa forme actuelle, ce style de fonctionnement est souvent mal équipé pour gérer les types et sources de données complexes qui existent aujourd’hui. Les lacs de données cloud ouverts, comme celui d’Ahana, construits sur des moteurs SQL comme Presto, offrent aux organisations une option plus flexible et relativement peu coûteuse à grande échelle, selon Mih.

« Ce qui se passe, c’est que les gens mettent des données semi-structurées et non structurées, par exemple, dans des lacs de données cloud ou d’autres lacs de données, et ils découvrent qu’ils peuvent interroger directement avec un moteur de requête SQL comme Presto », a expliqué Mih. « Et cela vous permet d’avoir une approche beaucoup plus flexible pour obtenir des informations sur vos données. C’est pourquoi les entreprises se tournent vers une architecture plus moderne.

Selon Mih, un autre grand cas d’utilisation rendu possible par des solutions comme Presto concerne les requêtes ad hoc et interactives.

« Il y a tellement de données qui sont générées et stockées, et vous devez être en mesure d’interroger ces données en place avec des performances très, très élevées, ce qui signifie que vous pouvez obtenir des réponses en quelques secondes. Cela vous permet d’avoir la capacité interactive d’explorer les données et d’innover dans votre entreprise », a-t-il déclaré.

Debout sous l’égide de Linux

Mih et Baliga sont tous deux des membres remarquables de la Fondation Presto, et ce point commun sous-tend un engagement à améliorer la technologie, sur laquelle Uber et Ahana Cloud s’appuient fortement. Ces deux sociétés, en plus d’une foule d’autres, constituent le « consortium d’entreprises qui veulent toutes voir Presto continuer à devenir de plus en plus grande », selon Mih.

Sous la Fondation Linux aujourd’hui, PrestoDB existait à l’origine en tant que projet à l’intérieur de Facebook. À maturité, il a été rendu open-source et donné à Linux, où il réside toujours aujourd’hui. Sans surprise, le projet Presto est régulièrement amélioré, avec une multitude de nouvelles fonctionnalités déjà testées ou en cours de développement.

« RaptorX est un système de mise en cache à plusieurs niveaux qui a été fantastique », a déclaré Mih. « Les optimisations Aria sont un autre domaine. Chez Ahana, nous avons également développé des fonctionnalités de sécurité ; nous faisons don des intégrations avec Apache Ranger, et c’est le genre de choses que nous faisons pour aider la communauté.

Parallèlement à la création de nouvelles fonctionnalités pour les organisations dépendantes de Presto, de grandes entreprises comme Uber – avec leurs besoins en données à haute capacité – font preuve d’une immense confiance dans la communauté de développeurs en plein essor de Presto. Cette communauté comprend des noms comme Facebook et Ahana Cloud, et ils aident à maintenir l’écosystème.

Les organisations participantes au sein de Presto se répartissent en deux grandes catégories : celles (comme Uber) qui l’utilisent en interne et d’autres (comme Ahana) qui l’offrent en tant que service à d’autres entreprises. Selon Baliga, les premiers apportent évolutivité et fiabilité, tandis que les seconds offrent flexibilité et extensibilité. L’interaction entre ces deux différents types de parties prenantes est en grande partie responsable de faire du projet ce qu’il est aujourd’hui.

En tant que projet open source sous la tutelle de la Fondation Linux, les utilisateurs de Presto sont également assurés de la transparence durable de l’écosystème sans aucun changement soudain de licence qui pourrait entraîner des coûts supplémentaires ou des limitations d’utilisation, ont souligné Mih et Baliga.

Voici l’interview vidéo complète, qui fait partie de la couverture par SiliconANGLE et theCUBE de l’événement AWS Startup Showcase : « Data as Code – The Future of Enterprise Data and Analytics ».

(* Divulgation : TheCUBE est un partenaire média payant pour le AWS Startup Showcase : « Données en tant que code — L’avenir des données et de l’analyse d’entreprise » un événement. Ni Ahana Cloud Inc., le sponsor de la couverture des événements de theCUBE, ni les autres sponsors n’ont de contrôle éditorial sur le contenu de theCUBE ou de SiliconANGLE.)

Photo: SiliconANGLE

Montrez votre soutien à notre mission en rejoignant notre Cube Club et notre communauté d’experts Cube Event. Rejoignez la communauté qui comprend Amazon Web Services et le PDG d’Amazon.com Andy Jassy, ​​le fondateur et PDG de Dell Technologies Michael Dell, le PDG d’Intel Pat Gelsinger et bien d’autres sommités et experts. .

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Recipes

Block title

More Recipes Like This

Voir aussi