Senior Data Engineer (AI & AWS)
- Part-time
Company Description
Blend is a premier AI services provider, committed to co-creating meaningful impact for its clients through the power of data science, AI, technology, and people. With a mission to fuel bold visions, Blend tackles significant challenges by seamlessly aligning human expertise with artificial intelligence. The company is dedicated to unlocking value and fostering innovation for its clients by harnessing world-class people and data-driven strategy. We believe that the power of people and AI can have a meaningful impact on your world, creating more fulfilling work and projects for our people and clients. For more information, visit www.blend360.com.
Job Description
ABOUT THE ROLE
Buscamos um(a) Data Engineer Sênior com experiência em arquiteturas de dados modernas na AWS e interesse genuíno em Inteligência Artificial e Machine Learning. Nessa posição, você será responsável por construir e manter a infraestrutura de dados que sustenta produtos analíticos, modelos de ML e soluções de GenAI da empresa e de seus clientes. Você vai trabalhar em um ambiente orientado a dados, colaborando com engenheiros, cientistas de dados e times de produto para garantir que os dados certos cheguem às pessoas certas, com qualidade, confiabilidade e escala.
KEY RESPONSIBILITIES
• Projetar e implementar pipelines de ingestão e transformação de dados em batch e real-time de alta escala
• Construir e manter arquiteturas de lakehouse usando AWS S3, Glue, Redshift e Apache Iceberg
• Desenvolver e orquestrar pipelines de ML/AI com AWS SageMaker e Apache Airflow
• Implementar soluções de streaming em tempo real com Apache Kafka e/ou AWS Kinesis
• Explorar e aplicar padrões de GenAI via AWS Bedrock, incluindo pipelines RAG, workflows de embeddings e integração com LLMs
• Aplicar práticas de Data Mesh para descentralizar domínios de dados e melhorar a autonomia dos times
• Garantir qualidade, linhagem e governança de dados com dbt e AWS Glue Data Catalog
• Otimizar custos e performance de queries em ambientes Redshift e Athena
Qualifications
• 5+ anos de experiência como Data Engineer com foco em cloud
• Domínio de Python, PySpark e SQL para processamento e transformação de dados em larga escala
• Experiência sólida com AWS: S3, Glue, Redshift, Athena, Lambda, SageMaker e Kinesis
• Experiência com orquestração de pipelines usando Apache Airflow
• Conhecimento em streaming de dados com Apache Kafka ou AWS Kinesis
• Familiaridade com dbt para transformação e documentação de dados
• Experiência com IaC usando Terraform para provisionamento de infraestrutura de dados
• Conhecimento em Apache Iceberg para gerenciamento de tabelas em data lakes
• Interesse comprovado em IA/ML — experiência com pipelines de ML ou GenAI é um forte diferencial
• AWS Certified Data Analytics – Specialty ou AWS Certified Machine Learning (diferencial)