From 6495825c5b23cd5f246643f95ea39c150178c8af Mon Sep 17 00:00:00 2001 From: Louis Dieffenthaler Date: Thu, 30 Nov 2023 09:57:09 +0100 Subject: [PATCH 1/9] La til beskrivelse av hvordan man registrerer pseudonymiserte views --- docs/dataprodukter/dele/dataprodukt.md | 13 ++++++++++++- 1 file changed, 12 insertions(+), 1 deletion(-) diff --git a/docs/dataprodukter/dele/dataprodukt.md b/docs/dataprodukter/dele/dataprodukt.md index 2788795d..9f34259f 100644 --- a/docs/dataprodukter/dele/dataprodukt.md +++ b/docs/dataprodukter/dele/dataprodukt.md @@ -12,4 +12,15 @@ Der oppgis navn, beskrivelse, team i Teamkatalogen samt kontaktpunkt til teamet. Datasett legges til ved at man klikker seg inn på et `dataprodukt` på [Markedsplassen](https://data.intern.nav.no). Under `Legg til datasett` kan man registrere den aktuelle tabellen fra BigQuery sammen med metadata som gjør det enklere for teamet å beholde oversikten. Metadata gjør det også enklere for folk utenfor teamet å finne dataene. -Beskrivelser av kolonnene i tabellen kan legges inn i [BigQuery-konsollet](https://console.cloud.google.com/bigquery). \ No newline at end of file +Beskrivelser av kolonnene i tabellen kan legges inn i [BigQuery-konsollet](https://console.cloud.google.com/bigquery). + + +### Pseudonymisering av datasett +Team har ofte data om enkeltpersoner der vi trenger identifikatorer for å kunne koble tabeller sammen og følge personer over tid. +Vi tilbyr en løsning for å registrere BigQuery-views der valgte kolonner pseudonymiseres. +Pseudonymiserte views baserer seg på en hvilken som helst BigQuery-tabell/view i teamets prosjekt. +Ved registrering av `datasett`, kan du velge å pseudonymisere tabellen. +Du må velge minst èn kolonne som skal pseudonymiseres. +Vi oppretter et eget view i teamets prosjekt der kolonnene er pseuodnymisert. +Kolonnene pseudonymiseres med SHA256-algoritmen og en tilfeldig verdi som er forskjellig for hver tabell. +Til tross for at tabellene pseudonymiseres med forskjellige verdier, kan de likevel kobles sammen gjennom en [tjenesten vi tilbyr for å koble sammen pseudonymiserte tabeller](/analyse/sammenstille). From 2f4d0511dcdfd9924de81125bbadf5ecd59e6cf1 Mon Sep 17 00:00:00 2001 From: Louis Dieffenthaler Date: Fri, 1 Dec 2023 10:52:20 +0100 Subject: [PATCH 2/9] La inn veiledning til hvordan man kan koble sammen pseudonymisert views --- docs/analyse/koble-pseudonymiserte.md | 17 +++++++++++++++++ docs/dataprodukter/dele/dataprodukt.md | 12 ++++++++---- 2 files changed, 25 insertions(+), 4 deletions(-) create mode 100644 docs/analyse/koble-pseudonymiserte.md diff --git a/docs/analyse/koble-pseudonymiserte.md b/docs/analyse/koble-pseudonymiserte.md new file mode 100644 index 00000000..f7522bd3 --- /dev/null +++ b/docs/analyse/koble-pseudonymiserte.md @@ -0,0 +1,17 @@ +# Koble sammen pseudonymiserte views +I [Markedsplassen](https://data.intern.nav.no) er det mulig å tilrettelegge [pseudonymiserte tabeller](/dataprodukter/dele/dataprodukt/#pseudonymisering-av-datasett) for sammenkobling. +Du trenger tilgang til minst to pseudonymiserte tabeller registrert på [Markedsplassen](https://data.intern.nav.no). +Du spesifiserer hvilke tabeller du ønsker å koble sammen. +Du kan også velge å lage konsistente id-er for personer som har byttet fødselsnummer. +For de tabellene som inneholder fødselsnummer må du oppgi hvilken kolonne disse finnes i. +Tabellene slettes etter 21 dager, med mindre du velger noe annet. +Når du bestiller tabellene skjer følgende: + +1. Et nytt `BigQuery-dataset` opprettes i et eget Markedsplassen-prosjekt i GCP. Du får tilgang til dette. +2. Markedsplassen generer en verdi som brukes i pseudonymiseringen +3. De opprinnelige tabellene som de pseudonymiserte tabellene er basert på leses av Markedsplassen +4. Konsistente id-er lages ved at vi kobler inn mapping-tabell (optional) +5. Markedsplassen pseudonymiserer kolonner som *produsentene* har merket som pseudonymiserte. SHA256 og den samme verdien for alle tabellene brukes i pseudonymiseringen. +6. View opprettes i `BigQuery-dataset` + +Tilganger til vises under ["mine tilganger" på Markedsplassen](https://data.intern.nav.no/user/access). \ No newline at end of file diff --git a/docs/dataprodukter/dele/dataprodukt.md b/docs/dataprodukter/dele/dataprodukt.md index 9f34259f..dedfae41 100644 --- a/docs/dataprodukter/dele/dataprodukt.md +++ b/docs/dataprodukter/dele/dataprodukt.md @@ -15,12 +15,16 @@ Metadata gjør det også enklere for folk utenfor teamet å finne dataene. Beskrivelser av kolonnene i tabellen kan legges inn i [BigQuery-konsollet](https://console.cloud.google.com/bigquery). -### Pseudonymisering av datasett +### Pseudonymisering av tabeller Team har ofte data om enkeltpersoner der vi trenger identifikatorer for å kunne koble tabeller sammen og følge personer over tid. -Vi tilbyr en løsning for å registrere BigQuery-views der valgte kolonner pseudonymiseres. +Vi tilbyr en løsning for å registrere BigQuery-view der valgte kolonner pseudonymiseres. Pseudonymiserte views baserer seg på en hvilken som helst BigQuery-tabell/view i teamets prosjekt. Ved registrering av `datasett`, kan du velge å pseudonymisere tabellen. Du må velge minst èn kolonne som skal pseudonymiseres. -Vi oppretter et eget view i teamets prosjekt der kolonnene er pseuodnymisert. +Vi oppretter et eget view i et separat `BigQuery-dataset` i teamets prosjekt. +Her opprettes view der kolonnene er pseuodnymisert. Kolonnene pseudonymiseres med SHA256-algoritmen og en tilfeldig verdi som er forskjellig for hver tabell. -Til tross for at tabellene pseudonymiseres med forskjellige verdier, kan de likevel kobles sammen gjennom en [tjenesten vi tilbyr for å koble sammen pseudonymiserte tabeller](/analyse/sammenstille). +Metadata som vises på Markedsplassen inneholder adressen til det pseudonymiserte viewet. + + +Til tross for at tabellene pseudonymiseres med forskjellige verdier, kan de likevel kobles sammen gjennom en [tjenesten vi tilbyr for å koble sammen pseudonymiserte tabeller](/analyse/koble-pseudonymiserte). From f533b75b70ed713acfe04d90147349f43b4b9ee4 Mon Sep 17 00:00:00 2001 From: Louis Dieffenthaler Date: Fri, 1 Dec 2023 10:56:10 +0100 Subject: [PATCH 3/9] La inn pseudonymiserte views i innholdsfortegnelsen --- mkdocs.yml | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/mkdocs.yml b/mkdocs.yml index f5e90591..89cddba3 100644 --- a/mkdocs.yml +++ b/mkdocs.yml @@ -92,9 +92,10 @@ nav: - KNADA Airflow: analyse/airflow/knada-airflow.md - Google managed Airflow (Cloud Composer): analyse/airflow/managed-airflow.md - Metabase: analyse/metabase.md - - Allowlisting av trafikk: analyse/allowlisting.md - Datafortellinger: analyse/datafortellinger.md - KNADA VM: analyse/knada-vm.md + - Koble sammen pseudonymisert tabeller: analyse/koble-pseudonymiserte.md + - Allowlisting av trafikk: analyse/allowlisting.md - Google Secret Manager: analyse/google-secret-manager.md - Kodeeksempler: analyse/eksempler.md - TDV driver: analyse/tdv.md From 33bc16ca0b5b28a16e7a291e0a67f12ca724c458 Mon Sep 17 00:00:00 2001 From: Kyrre Havik Date: Tue, 5 Mar 2024 14:02:44 +0100 Subject: [PATCH 4/9] =?UTF-8?q?jupyter:=20flikking=20p=C3=A5=20tekst?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/analyse/notebook/generelt.md | 33 +++++++++++++++++-------------- 1 file changed, 18 insertions(+), 15 deletions(-) diff --git a/docs/analyse/notebook/generelt.md b/docs/analyse/notebook/generelt.md index 9b0ed293..be0cd606 100644 --- a/docs/analyse/notebook/generelt.md +++ b/docs/analyse/notebook/generelt.md @@ -1,23 +1,20 @@ ---- -title: Generelt for notebooks ---- - ## Sette opp nbstripout i notebook > nbstripout er et verktøyet som sørger for at output celler i Jupyter notebooks utelates fra Git commits. -For å unngå at output celler fra Jupyter notebooks blir pushet sammen med kode til Github anbefaler vi å installere [nbstripout](https://github.com/kynan/nbstripout) for repoet ditt. +For å unngå at output celler fra Jupyter notebooks blir pushet sammen med kode til Github anbefaler vi å installere [nbstripout](https://github.com/kynan/nbstripout). Dette verktøyet må installeres alle stedet du har repoet sjekket ut. -For å installere, gjør som følger: +For å ta dette i bruk i din notebook: - `pip install nbstripout --user` - Kjør kommandoen `nbstripout --install --global` fra repoet ditt lokalt -## Autentisering +## Autentisering mot GCP Vi anbefaler alle å lære seg å bruke sin personlige bruker fra Jupyter notebooks, dette for å sikre seg at man bruker kun de tilgangene man selv skal ha. ### Personlig bruker + 1. I notebooken, åpne en terminal 2. Kjør kommandoen `gcloud auth login --update-adc` 3. Gå til lenken som vises i terminalen og logg inn med NAV-bruker @@ -27,21 +24,23 @@ Etter å ha utført stegene over vil du i din notebook kunne jobbe med dine priv Denne tilgangen er kun midlertidig, og man må gjøre dette hver dag. ### Service account -!!! warn "Dette gjelder kun for [managed notebooks](./managed-notebook.md). Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker)." + +!!! warn "Dette gjelder kun for [managed notebooks](./managed-notebook.md). + Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker)." En fersk [managed notebook](./managed-notebook.md) vil automatisk autentisere seg mot GCP-tjenester med service accountens credentials. Det betyr at man er tilkoblet GCP med en service accounten ut av boksen når man starter opp en notebook. Bruker du denne service accounten, så er det denne brukeren som må få tilgang til kildene du skal snakke med. -Hvis du på et tidspunkt har logget på GCP med din personlige bruker fra notebooken må du bytte tilbake til service accounten. -Det gjør du slik: +Hvis du på et tidspunkt har logget på GCP med din personlige bruker fra notebooken, og har behov for å bytte tilbake kan du følge oppskriften nedenfor. 1. Sjekk hvilken bruker som er aktiv med `gcloud auth list`. 2. Hvis det er din personlige, velg service accounten ved å kjøre `gcloud config set account `. 3. Fjern tilgangen til din personlige bruker ved å kjøre `gcloud auth application-default revoke --account `. ## Tilpasse Oracle connector for raskere spørringer -Ved å justere `arraysize` og `prefetchrows` kan spørringer mot databaser onprem forbedres markant! + +Ved å justere `arraysize` og `prefetchrows` kan spørringer mot Oracle databaser onprem forbedres markant! Se dokumentasjonen til [oracledb-biblioteket](https://python-oracledb.readthedocs.io/en/latest/user_guide/tuning.html) for mer informasjon. ## Jupyter extensions @@ -56,10 +55,14 @@ pip install --upgrade jupyterlab jupyterlab-git --user ``` ## Bruk av Github Advanced Security og Dependabot for notebook servere -!!! warning "Dependabot støtter per i dag kun språkene Ruby, JavaScript, Python, PHP, Dart, Elixir, Elm, Go, Rust, Java og .NET så hvis man bruker R kan man ikke benytte seg av det følgende" -Vi oppfordrer notebook brukere til å ha en requirements.txt fil med python bibliotekene som de selv installerer på notebook serveren i et github repo i `navikt` orgen på github. Alle repoer i `navikt` har automatisk aktivert [Github Advanced Security inkludert Dependabot](https://docs.github.com/en/get-started/learning-about-github/about-github-advanced-security). Gjøres dette vil man få varsler om sårbarheter i bibliotekene som er i bruk samt at det automatisk blir generert pull requests i repoet med versjon av biblioteket hvor sårbarheten er fikset. +!!! warning "Dependabot støtter per i dag _ikke_ R, denne oppskriften funker kun for de som bruker kun språkene Ruby, JavaScript, Python, PHP, Dart, Elixir, Elm, Go, Rust, Java og .NET. + +Vi oppfordrer Jupyter notebook brukere til å ha en `requirements.txt` fil med Python-bibliotekene som dere selv bruker i et Github-repo. +Alle repoer i `navikt` har automatisk aktivert [Github Advanced Security inkludert Dependabot](https://docs.github.com/en/get-started/learning-about-github/about-github-advanced-security). +Bruker man dette vil man få varsler om sårbarheter i bibliotekene som er i bruk, samt at det automatisk blir generert pull requests i repoet med versjon av biblioteket hvor sårbarheten er fikset. -Dersom man bygger egne Dockerimages for Notebooks eller Airflow tilbyr Dependabot også automatisk scanning etter sårbarheter i disse. +Dersom man bygger egne Dockerimages for Jupyter eller Airflow tilbyr Dependabot også automatisk scanning etter sårbarheter for disse. -En kan også aktivere [CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/about-code-scanning-with-codeql) for repoet som analyserer koden din og genererer alerts ved sårbarheter. [Se her for informasjon om oppsett av CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/configuring-code-scanning-for-a-repository#configuring-code-scanning-automatically). +En kan også aktivere [CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/about-code-scanning-with-codeql) for repoet som analyserer koden din og genererer alerts ved sårbarheter. +[Se her for informasjon om oppsett av CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/configuring-code-scanning-for-a-repository#configuring-code-scanning-automatically). From cbfe436c355c744b022ab164faff191e9461aa25 Mon Sep 17 00:00:00 2001 From: Kyrre Havik Date: Tue, 5 Mar 2024 14:16:56 +0100 Subject: [PATCH 5/9] jupyter: auth mot github --- docs/analyse/notebook/generelt.md | 26 ++++++++++++++++++++++++++ 1 file changed, 26 insertions(+) diff --git a/docs/analyse/notebook/generelt.md b/docs/analyse/notebook/generelt.md index be0cd606..e1c17ac9 100644 --- a/docs/analyse/notebook/generelt.md +++ b/docs/analyse/notebook/generelt.md @@ -66,3 +66,29 @@ Dersom man bygger egne Dockerimages for Jupyter eller Airflow tilbyr Dependabot En kan også aktivere [CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/about-code-scanning-with-codeql) for repoet som analyserer koden din og genererer alerts ved sårbarheter. [Se her for informasjon om oppsett av CodeQL](https://docs.github.com/en/code-security/code-scanning/automatically-scanning-your-code-for-vulnerabilities-and-errors/configuring-code-scanning-for-a-repository#configuring-code-scanning-automatically). + +## Autentisering mot Github + +Det finnes flere måter å autentisere seg mot Github, men vi anbefaler å enten bruke SSH-nøkler eller fine-grained personal access tokens (PAT). + +## SSH-nøkkel + +Ved å bruke SSH-nøkler så lager man et nøkkelpar, hvor Github får din offentlige nøkkel, og man har sin private nøkkel lagret i Jupyter notebooken sin. +Vi anbefaler på det sterkeste å ha en egen nøkkel for Jupyter, da kan man enkelt trekke tilbake tilgangen hvis den blir slettet, eller havner på avveie. + +Du kan følge Github sin [Generating a new SSH key](https://docs.github.com/en/authentication/connecting-to-github-with-ssh/generating-a-new-ssh-key-and-adding-it-to-the-ssh-agent#generating-a-new-ssh-key), eller kjørende kommandoen nedenfor. +Vi anbefaler å bruke passord på SSH nøkkelen, dette er påkrevd for SSH-nøkler på lokal maskin. + +``` +ssh-keygen -t ed25519 -C "din_epost_email@nav.no" +``` + +Etter at du har generet et eget nøkkelpar må du legge den offentlige delen inn hos Github. +Du kan følge Github sin [Adding a new SSH key to your account](https://docs.github.com/en/authentication/connecting-to-github-with-ssh/adding-a-new-ssh-key-to-your-github-account#adding-a-new-ssh-key-to-your-account), eller gå direkte til [SSH and GPG keys](https://github.com/settings/keys), og trykke på `New SSH key`. + +## Fine-grained PAT + +Personal access tokens brukes for å lage et token med en bestemt varighet, som gir alle som har ditt token mulighet til å koble seg til Github. +Med fine-grained tokens kan man spesifisere mer detaljert hva man skal ha tilgang til, for eksempel spesifisere hvilke Github repo man skal ha tilgang til. + +Gå til [New fine-grained personal access token](https://github.com/settings/personal-access-tokens/new) for å komme i gang. From 1e7a8bcf6ac37faa17da207c6c1389e124c3ab5f Mon Sep 17 00:00:00 2001 From: Kyrre Havik Date: Tue, 5 Mar 2024 14:21:05 +0100 Subject: [PATCH 6/9] fix: feil i formateringen --- docs/analyse/notebook/generelt.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/docs/analyse/notebook/generelt.md b/docs/analyse/notebook/generelt.md index be0cd606..9c8fa9b8 100644 --- a/docs/analyse/notebook/generelt.md +++ b/docs/analyse/notebook/generelt.md @@ -25,8 +25,8 @@ Denne tilgangen er kun midlertidig, og man må gjøre dette hver dag. ### Service account -!!! warn "Dette gjelder kun for [managed notebooks](./managed-notebook.md). - Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker)." +!!! warn Dette gjelder kun for [managed notebooks](./managed-notebook.md). + Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker). En fersk [managed notebook](./managed-notebook.md) vil automatisk autentisere seg mot GCP-tjenester med service accountens credentials. Det betyr at man er tilkoblet GCP med en service accounten ut av boksen når man starter opp en notebook. From b6321f3c310bc3780431cd0f057f424970d5c460 Mon Sep 17 00:00:00 2001 From: Kyrre Havik Date: Tue, 5 Mar 2024 16:21:58 +0100 Subject: [PATCH 7/9] =?UTF-8?q?fix:=20feil=20format=20p=C3=A5=20warning-bo?= =?UTF-8?q?ks?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/analyse/notebook/generelt.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/docs/analyse/notebook/generelt.md b/docs/analyse/notebook/generelt.md index e1c17ac9..8c57110e 100644 --- a/docs/analyse/notebook/generelt.md +++ b/docs/analyse/notebook/generelt.md @@ -25,8 +25,9 @@ Denne tilgangen er kun midlertidig, og man må gjøre dette hver dag. ### Service account -!!! warn "Dette gjelder kun for [managed notebooks](./managed-notebook.md). - Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker)." +!!! warning + Dette gjelder kun for [managed notebooks](./managed-notebook.md). + Bruker du [KNADA notebook](./knada-notebook.md), se autentisering med [personlig bruker](#personlig-bruker). En fersk [managed notebook](./managed-notebook.md) vil automatisk autentisere seg mot GCP-tjenester med service accountens credentials. Det betyr at man er tilkoblet GCP med en service accounten ut av boksen når man starter opp en notebook. From cc241b4fbc3ada7e85f7a0893622b357a2d2237b Mon Sep 17 00:00:00 2001 From: Kyrre Havik Date: Tue, 5 Mar 2024 16:37:19 +0100 Subject: [PATCH 8/9] jupyter: litt om valg og bruk --- docs/analyse/notebook/generelt.md | 18 ++++++++++++++++++ 1 file changed, 18 insertions(+) diff --git a/docs/analyse/notebook/generelt.md b/docs/analyse/notebook/generelt.md index 8c57110e..3027042e 100644 --- a/docs/analyse/notebook/generelt.md +++ b/docs/analyse/notebook/generelt.md @@ -72,6 +72,9 @@ En kan også aktivere [CodeQL](https://docs.github.com/en/code-security/code-sca Det finnes flere måter å autentisere seg mot Github, men vi anbefaler å enten bruke SSH-nøkler eller fine-grained personal access tokens (PAT). +Er du usikker på hva du trenger så anbefaler vi at du starter med fine-grained PAT med en varighet på 7 dager. +Da har du nok tid til å utforske Jupyter, men ingen risiko for at dine tilgangsnøkler blir liggende til evig tid på Jupyter hvis du glemmer å rydde opp. + ## SSH-nøkkel Ved å bruke SSH-nøkler så lager man et nøkkelpar, hvor Github får din offentlige nøkkel, og man har sin private nøkkel lagret i Jupyter notebooken sin. @@ -87,9 +90,24 @@ ssh-keygen -t ed25519 -C "din_epost_email@nav.no" Etter at du har generet et eget nøkkelpar må du legge den offentlige delen inn hos Github. Du kan følge Github sin [Adding a new SSH key to your account](https://docs.github.com/en/authentication/connecting-to-github-with-ssh/adding-a-new-ssh-key-to-your-github-account#adding-a-new-ssh-key-to-your-account), eller gå direkte til [SSH and GPG keys](https://github.com/settings/keys), og trykke på `New SSH key`. +Etterpå kan du bruke `git` som vanlig og klone ned med `SSH`-adressen (git@github.com:navikt/ditt-repo.git). + +!!! info + SSH-nøkler må ligge i katalogen `~/.ssh` og kun lesbar av deg. + Sette filrettigheter med `chmod 600 ~/.ssh/id_ed25519`. + ## Fine-grained PAT Personal access tokens brukes for å lage et token med en bestemt varighet, som gir alle som har ditt token mulighet til å koble seg til Github. Med fine-grained tokens kan man spesifisere mer detaljert hva man skal ha tilgang til, for eksempel spesifisere hvilke Github repo man skal ha tilgang til. Gå til [New fine-grained personal access token](https://github.com/settings/personal-access-tokens/new) for å komme i gang. +Merk at du vil ikke kunne hente ut en PAT etter den har blitt generert, så hvis du mister den så er det bare å rotere tokenet. + +For å bruke PAT i Jupyter kan du opprette filen `.netrc` i ditt hjemmeområde i Jupyter med følgende innhold: + +``` +machine github.com login +``` + +Etterpå kan du bruke `git` som vanlig og klone ned med `HTTPS`-adressen (https://github.com/navikt/ditt-repo.git) From 2470448ee591e3eee2c29785e985a83327781731 Mon Sep 17 00:00:00 2001 From: MauriceLouis <97877732+MauriceLouis@users.noreply.github.com> Date: Wed, 6 Mar 2024 15:28:51 +0100 Subject: [PATCH 9/9] Update docs/analyse/koble-pseudonymiserte.md Co-authored-by: Kyrre Havik --- docs/analyse/koble-pseudonymiserte.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/analyse/koble-pseudonymiserte.md b/docs/analyse/koble-pseudonymiserte.md index f7522bd3..7a26f897 100644 --- a/docs/analyse/koble-pseudonymiserte.md +++ b/docs/analyse/koble-pseudonymiserte.md @@ -10,7 +10,7 @@ Når du bestiller tabellene skjer følgende: 1. Et nytt `BigQuery-dataset` opprettes i et eget Markedsplassen-prosjekt i GCP. Du får tilgang til dette. 2. Markedsplassen generer en verdi som brukes i pseudonymiseringen 3. De opprinnelige tabellene som de pseudonymiserte tabellene er basert på leses av Markedsplassen -4. Konsistente id-er lages ved at vi kobler inn mapping-tabell (optional) +4. Konsistente id-er lages ved at vi kobler inn mapping-tabell (ikke påkrevd) 5. Markedsplassen pseudonymiserer kolonner som *produsentene* har merket som pseudonymiserte. SHA256 og den samme verdien for alle tabellene brukes i pseudonymiseringen. 6. View opprettes i `BigQuery-dataset`