Receba o produto que está esperando ou devolvemos o dinheiro.
Projetos de dados são fundamentais para o ecossistema técnico das organizações, mas muitos engenheiros de dados ainda continuam trabalhando em problemas que outros já resolveram.
Este guia prático mostra como entregar dados de alto valor, concentrando-se em aspectos essenciais da engenharia de dados, como ingestão de dados, qualidade de dados, idempotência e muito mais.
O autor Bartosz Konieczny orienta você no processo de construção de projetos confiáveis de engenharia de dados de ponta a ponta, desde a ingestão de dados até a observabilidade dos dados, com foco em padrões de design de engenharia de dados que resolvem problemas comuns de negócios de forma segura e otimizada em termos de armazenamento.
Cada padrão inclui uma descrição do problema, soluções e consequências para o usuário, inserindo o padrão no contexto de cenários da vida real. Ao longo dessa jornada, você usará ferramentas de dados de código aberto e serviços de nuvem pública para implementar cada padrão. Você aprenderá:
Desafios que os engenheiros de dados enfrentam e seu impacto nos sistemas de dados
Como esses desafios se relacionam com os componentes do sistema de dados
Aplicações práticas de padrões de engenharia de dados
Como identificar e corrigir problemas com seus atuais componentes de dados
Soluções agnósticas de tecnologia para projetos de dados novos e existentes, com exemplos de implementação de código aberto
Este livro é a obra seminal para o futuro dos padrões de design de engenharia de dados e deveria ser leitura obrigatória para qualquer profissional de dados. É tão importante para o futuro da profissão quanto os Padrões de Design da Gangue dos Quatro foram para o projeto de software - Scott Haines, coautor, Delta Lake: The Definitive Guide [Delta Lake: o Guia Definitivo].
A engenharia de dados muitas vezes parece uma forma de resolver os mesmos problemas repetidamente. Bartosz Konieczny muda isso com este livro. Abordando tudo, desde idempotência até tratamento de erros e observabilidade de dados, este é o guia definitivo para construir pipelines de dados resilientes com padrões de design reutilizáveis e comprovados - Adi Polak, diretor, Confluent.