Skip to content

Latest commit

 

History

History
94 lines (55 loc) · 5.34 KB

File metadata and controls

94 lines (55 loc) · 5.34 KB

DP-900: Microsoft Azure Data Fundamentals

Módulo 3: Explorar os dados não relacionais no Azure

Unidade 2

  • Objetivos da unidade 2: a. Provisionar servicos de dados não relacionais; b. Configurar servicos de dados nao relacionais; c. Explorar os problemas basicos de conectividade; d. Explorar os componentes de seguranca de dados.

  • Provisionar servicos de dados não relacionais:

    • O que é provisionamento? É a arte de providênciar algo. E o ato de executar uma série de tarefas que um provedor de servicos realiza para criar e configurar um serviço. O provisionamento é o processo de definição da infraestrutura de TI. Ele também se refere às etapas necessárias para gerenciar o acesso aos dados e recursos e para disponibilizá-los a usuários e sistemas.

    • Como Provisionar o Cosmos DB? O cosmosDB tem 5 APIs diferentes.

      1. Core(SQL)- Recommended;
      2. Azure Cosmos DB API for MongoDB(baseado em document);
      3. Cassandra(banco de dados colunar);
      4. Azure Table(baseado em chave de partição/Particion Key -chave agrupamento- e uma Chave de Linha/Row Key -chave identificação única-);
      5. Gremlim (Graph).

      image

      Para exemplo, vamos usar Core(SQL) para provisionar no Cosmos DB.

      1. Basics: image

      2. Global Distribuition: Só configuramos a Global Distribuition quando temos um provisionamento de taxas de transferência(option Provisioned throughput.

      image

      1. Networking: Vamos deixá-lo disponível para todas as redes(público).

      image

      1. Backup Policy: Temos duas opções - Localmente redundant/Locally-redundant backup storage onde esse backup será salvo na mesma região e no mesmo data center; Geograficamente reduntante/Geo-redundant backup storage na mesma região em zonas diferentes/data centers diferentes.

      image

      1. Encryption:

      image

      1. Tags/Marcações: Colocar marcações para conseguirmos mapear o custo que isso está nos gerando em cada uma das aplicações ou o BD.

      image

      1. Review + create:

      image

      Seguindo esses passos o nosso recurso está sendo provisionado/preparado/disponibilizado:

      image

    • Provisionamento do Data Lake Storage.

      Primeiro, o que é Data Lake: é um repositório utilizado para armazenar todos os dados estruturados e não estruturados. Ao armazená-los de forma não estruturada pode-se realizar diferentes tipos de análise, incluindo processamento de big data, análise em tempo real e machine learning, a fim de adquirir melhores decisões.

      1. Basics:

      image

      1. Pricing:

      image

      1. Encryption:

      image

      1. Tags:

      image

      1. Review + create:

      image

      • Também temos a possibilidade de provisionar o Data Lake através do Storage account/contas de armazenamento(compartilhamento de arquivos entre usuários de outros serves - podemos ter tabelas, filas e arquivos de compartilhamento). Na janela Advanced de criação no tópico Data Lake Storage Gen2.

      • Data Lake Storage Gen2: Esse cara simplesmente equipara toda a parte de armazenamento de arquivos que temos, ele converte isso como se tivéssemos o preço de armazenamento de larga escala(que geralmente trabalhamos com objetos complexos) e compara isso ao armazenamento tradicional no storage, ou seja, ele não diferencia se estamos usando o storage para guardar um blob ou para guardar um arquivo que vamos trabalhar no Data Lake, com isso temos um alto ganho no custo.

      • Importante: Criar as entidades de segurança. É um objeto que pode ser um usuário, um grupo ou um serviço.

Unidade 2: Verificação de conhecimento

Sem título