Fala pessoal!!! 😀


Não preciso dizer o quanto é importante o tema de Governança de Dados e nem sobre a Lei Geral de Proteção de Dados do Brasil ("LGPD"), que é a principal regulamentação voltada para a proteção de dados pessoais, ambas amplamente discutidas aqui na rede. Lembrei agora do meu querido amigo e professor Neylson Crepalde, grande mestre nestes temas e também em Amazon Web Services (AWS). 😀


Portanto, trago hoje uma abordagem mais prática e super estratégica de como implementar isso na AWS. Vamos falar de Governança de Dados com Amazon Macie e AWS Lake Formation. Espero que gostem. 🤗 😎


Primeiramente, o que é o Amazon Macie e AWS Lake Formation?


O Amazon Macie é um serviço de segurança de dados da AWS que utiliza machine learning e correspondência de padrões para descobrir dados sensíveis. Ele fornece visibilidade sobre os riscos de segurança dos dados e permite a proteção automatizada contra esses riscos.


O AWS Lake Formation é um serviço que simplifica a configuração de permissões de segurança e governança, permitindo que apenas os usuários autorizados tenham acesso aos dados.


Esclarecidos estes primeiros pontos vamos falar um pouco de uma arquitetura de referência da AWS altamente escalável e resiliente que atende a inúmeros cenários. A proposta permite que várias fontes de dados enviem informações para o data lake, onde o Amazon S3 será o armazenamento central dos dados. Uma vez que os dados são inseridos no Amazon S3, o Amazon Macie analisa as informações armazenadas e identifica quais são os dados sensíveis. Essas informações são então utilizadas pelo AWS Glue para executar um fluxo de trabalho que irá anonimizar os dados utilizando técnicas de mascaramento e criptografia. Depois que esse fluxo de trabalho é concluído, os dados são armazenados em outro bucket do Amazon S3. Essa hierarquia de buckets é fundamental para segregar o acesso aos dados para usuários específicos utilizando as regras definidas no AWS Lake Formation.


Os destaques da arquitetura na minha opinião são os seguintes:

➡ O serviço gerenciado AWS Database Migration Service (DMS) que irá fazer um Capture-Data-Change (CDC) e ingerir os dados incrementalmente.

➡ O pipeline de detecção de dados sensíveis (PII) que utiliza o Amazon Macie para analisar os arquivos e faz a descoberta dos dados sensíveis automaticamente.

➡ O fluxo de trabalho do AWS Glue que irá mascarar e criptografar os dados identificados através de um script Python.

➡ O AWS Lake Formation que irá mapear as permissões de cada usuário e seu nível de acesso.


💡 Quer aprender mais sobre isso também? Acesse o Blog da AWS e veja a documentação completa e repositório:

https://lnkd.in/dFQ3UAAB 👏👏👏


Bons estudos! 🚀🚀🚀


Grande abraço do Van! 🤗 😎


#AWS #AWSTraining #AWSCertification #AWSSkillBuilder #AMAZON #AWSMacie #AWSLakeFormation #AWSGlue #LGPD #Data #DataEngineering #DataDriven