Fala pessoal!!! 😀
Não preciso dizer o quanto é importante o tema de Governança de Dados e nem sobre a Lei Geral de Proteção de Dados do Brasil ("LGPD"), que é a principal regulamentação voltada para a proteção de dados pessoais, ambas amplamente discutidas aqui na rede. Lembrei agora do meu querido amigo e professor Neylson Crepalde, grande mestre nestes temas e também em Amazon Web Services (AWS). 😀
Portanto, trago hoje uma abordagem mais prática e super estratégica de como implementar isso na AWS. Vamos falar de Governança de Dados com Amazon Macie e AWS Lake Formation. Espero que gostem. 🤗 😎
Primeiramente, o que é o Amazon Macie e AWS Lake Formation?
O Amazon Macie é um serviço de segurança de dados da AWS que utiliza machine learning e correspondência de padrões para descobrir dados sensíveis. Ele fornece visibilidade sobre os riscos de segurança dos dados e permite a proteção automatizada contra esses riscos.
O AWS Lake Formation é um serviço que simplifica a configuração de permissões de segurança e governança, permitindo que apenas os usuários autorizados tenham acesso aos dados.
Esclarecidos estes primeiros pontos vamos falar um pouco de uma arquitetura de referência da AWS altamente escalável e resiliente que atende a inúmeros cenários. A proposta permite que várias fontes de dados enviem informações para o data lake, onde o Amazon S3 será o armazenamento central dos dados. Uma vez que os dados são inseridos no Amazon S3, o Amazon Macie analisa as informações armazenadas e identifica quais são os dados sensíveis. Essas informações são então utilizadas pelo AWS Glue para executar um fluxo de trabalho que irá anonimizar os dados utilizando técnicas de mascaramento e criptografia. Depois que esse fluxo de trabalho é concluído, os dados são armazenados em outro bucket do Amazon S3. Essa hierarquia de buckets é fundamental para segregar o acesso aos dados para usuários específicos utilizando as regras definidas no AWS Lake Formation.
Os destaques da arquitetura na minha opinião são os seguintes:
➡ O serviço gerenciado AWS Database Migration Service (DMS) que irá fazer um Capture-Data-Change (CDC) e ingerir os dados incrementalmente.
➡ O pipeline de detecção de dados sensíveis (PII) que utiliza o Amazon Macie para analisar os arquivos e faz a descoberta dos dados sensíveis automaticamente.
➡ O fluxo de trabalho do AWS Glue que irá mascarar e criptografar os dados identificados através de um script Python.
➡ O AWS Lake Formation que irá mapear as permissões de cada usuário e seu nível de acesso.
💡 Quer aprender mais sobre isso também? Acesse o Blog da AWS e veja a documentação completa e repositório:
Bons estudos! 🚀🚀🚀
Grande abraço do Van! 🤗 😎
#AWS #AWSTraining #AWSCertification #AWSSkillBuilder #AMAZON #AWSMacie #AWSLakeFormation #AWSGlue #LGPD #Data #DataEngineering #DataDriven