1. D'Konzept vun Data Masking
Datemaskéierung ass och bekannt als Datemaskéierung. Et ass eng technesch Method fir sensibel Donnéeën ze konvertéieren, z'änneren oder ze decken wéi Handysnummer, Bankkaartnummer an aner Informatioun wa mir Maskeregelen a Politik ginn hunn. Dës Technik gëtt haaptsächlech benotzt fir ze verhënneren datt sensibel Donnéeën direkt an onzouverlässeg Ëmfeld benotzt ginn.
Datemaskeringsprinzip: Datemaskéierung soll déi originell Datencharakteristiken, Geschäftsregelen an Daterelevanz behalen fir sécherzestellen datt déi spéider Entwécklung, Testen an Datenanalyse net vun der Maskering beaflosst ginn. Garantéieren d'Konsistenz an d'Validitéit vun der Donnéeën virun an no der Maskéierung.
2. Donnéeën Masking Klassifikatioun
Datemaskéierung kann a statesch Datemaskéierung (SDM) an dynamesch Datemaskéierung (DDM) opgedeelt ginn.
Static Data Masking (SDM): Statesch Datemaskéierung erfuerdert d'Schafung vun enger neier Net-Produktiounsëmfeld Datebank fir Isolatioun vum Produktiounsëmfeld. Sensibel Donnéeën ginn aus der Produktiounsdatebank extrahéiert an dann an der Net-Produktiounsdatebank gespäichert. Op dës Manéier ginn déi desensibiliséiert Donnéeën aus dem Produktiounsëmfeld isoléiert, wat d'Geschäftsbedierfnesser entsprécht an d'Sécherheet vun de Produktiounsdaten garantéiert.
Dynamic Data Masking (DDM): Et gëtt allgemeng an der Produktiounsëmfeld benotzt fir sensibel Daten an Echtzäit ze desensibiliséieren. Heiansdo sinn verschidden Niveaue vu Maskéierung erfuerderlech fir déiselwecht sensibel Donnéeën a verschiddene Situatiounen ze liesen. Zum Beispill kënne verschidde Rollen a Permissiounen verschidde Maskéierungsschemaen implementéieren.
Dateberichterstattung an Dateprodukter Maskéierungsapplikatioun
Esou Szenarie enthalen haaptsächlech intern Dateniwwerwaachungsprodukter oder Affichen, externe Servicedatenprodukter, a Berichter baséiert op Datenanalyse, sou wéi Geschäftsberichter a Projete Bewäertung.
3. Donnéeën Mask Léisung
Gemeinsam Datemaskéierungsschemaen enthalen: Invalidatioun, Zoufallswäert, Datenersatz, symmetresch Verschlësselung, Duerchschnëttswäert, Offset a Ronnen, asw.
Invalidatioun: Invalidatioun bezitt sech op d'Verschlësselung, Ofkierzung oder Verstoppen vu sensiblen Donnéeën. Dëse Schema ersetzt normalerweis real Daten mat spezielle Symboler (wéi *). D'Operatioun ass einfach, awer d'Benotzer kënnen d'Format vun den ursprénglechen Donnéeën net wëssen, wat spéider Datenapplikatiounen beaflosse kann.
Zoufälleg Wäert: Den zoufällege Wäert bezitt sech op den zoufälleg Ersatz vu sensiblen Donnéeën (Zuelen ersetzen Zifferen, Buschtawen ersetzen Buschtawen, an Zeechen ersetzen Zeechen). Dës Maskéierungsmethod garantéiert d'Format vu sensiblen Donnéeën zu engem gewësse Mooss an erliichtert déi spéider Datenapplikatioun. Masking Dictionnairen kënne fir e puer sënnvoll Wierder gebraucht ginn, wéi Nimm vu Leit a Plazen.
Daten Ersatz: Date Ersatz ass ähnlech wéi d'Maskéierung vun null an zoufälleg Wäerter, ausser datt amplaz speziell Zeechen oder zoufälleg Wäerter ze benotzen, d'Maskeringsdaten duerch e spezifesche Wäert ersat ginn.
Symmetresch Verschlësselung: Symmetresch Verschlësselung ass eng speziell reversibel Maskéierungsmethod. Et verschlësselt sensibel Donnéeën duerch Verschlësselungsschlësselen an Algorithmen. De Chiffertextformat ass konsequent mat den originelle Donnéeën a logesche Regelen.
Duerchschnëtt: Den Duerchschnëttsschema gëtt dacks a statistesch Szenarie benotzt. Fir numeresch Donnéeën berechene mir als éischt hir Moyenne, an dann zoufälleg déi desensibiliséiert Wäerter ronderëm d'Moyenne verdeelen, sou datt d'Zomm vun den Daten konstant bleift.
Offset a Rounding: Dës Method ännert déi digital Donnéeën duerch zoufälleg Verréckelung. D'Offset-Ronnung garantéiert d'ongeféier Authentizitéit vum Sortiment wärend d'Sécherheet vun den Donnéeën erhale bleift, déi méi no bei de realen Donnéeën ass wéi déi virdrun Schemaen, an eng grouss Bedeitung am Szenario vun der Big Data Analyse huet.
De recommandéiert Modell "ML-NPB-5660" fir d'Datenmasking
4. Allgemeng benotzt Data Masking Techniken
(1). Statistesch Techniken
Dateprobéieren an Datenaggregatioun
- Dateprobe: D'Analyse an d'Evaluatioun vum ursprénglechen Dateset duerch d'Auswiel vun engem representativen Ënnerdeel vum Dateset ass eng wichteg Method fir d'Effizienz vun De-Identifikatiounstechniken ze verbesseren.
- Dateaggregatioun: Als Sammlung vu statisteschen Techniken (wéi Summatioun, Zielen, Duerchschnëtt, Maximum a Minimum) op Attributer a Mikrodaten applizéiert, ass d'Resultat representativ fir all Opzeechnungen am originelle Dateset.
(2). Kryptographie
Kryptographie ass eng allgemeng Method fir d'Effizienz vun der Desensibiliséierung ze desensibiliséieren oder ze verbesseren. Verschidde Aarte vu Verschlësselungsalgorithmen kënnen verschidden Desensibiliséierungseffekter erreechen.
- Deterministesch Verschlësselung: Eng net zoufälleg symmetresch Verschlësselung. Et veraarbecht normalerweis ID-Daten a kann de Chiffertext op déi ursprénglech ID entschlësselen a restauréieren wann néideg, awer de Schlëssel muss richteg geschützt sinn.
- Irreversibel Verschlësselung: D'Hash Funktioun gëtt benotzt fir Daten ze veraarbecht, déi normalerweis fir ID Daten benotzt ginn. Et kann net direkt entschlësselt ginn an d'Mapping Relatioun muss gespäichert ginn. Zousätzlech, wéinst der Feature vun der Hashfunktioun, kann Datenkollisioun optrieden.
- Homomorphesch Verschlësselung: De Chiffertext homomorphesche Algorithmus gëtt benotzt. Seng Charakteristik ass datt d'Resultat vun der Chiffertext Operatioun d'selwecht ass wéi déi vun der Kloertext Operatioun no der Entschlësselung. Dofir gëtt et allgemeng benotzt fir numeresch Felder ze veraarbecht, awer et gëtt net wäit aus Leeschtungsgrënn benotzt.
(3). System Technologie
D'Ënnerdréckungstechnologie läscht oder schützt Datenartikelen déi net de Privatsphäreschutz entspriechen, awer publizéiert se net.
- Masking: et bezitt sech op déi heefegst Desensibiliséierungsmethod fir den Attributwäert ze maskéieren, sou wéi d'Géignernummer, d'Identitéitskaart ass mat engem Stär markéiert oder d'Adress ass ofgeschnidden.
- Lokal Ënnerdréckung: bezitt sech op de Prozess fir spezifesch Attributwäerter (Spalten) ze läschen, net wesentlech Datefelder ze läschen;
- Record Ënnerdréckung: bezitt sech op de Prozess fir spezifesch records (Reihen) ze läschen, net wesentlech Date records ze läschen.
(4). Pseudonym Technologie
Pseudomanning ass eng De-Identifikatiounstechnik déi e Pseudonym benotzt fir en direkten Identifizéierer (oder aner sensibel Identifizéierer) ze ersetzen. Pseudonym Techniken schafen eenzegaarteg Identifizéierer fir all eenzel Informatiounen Sujet, amplaz direkten oder sensibel Identifizéierer.
- Et kann onofhängeg zoufälleg Wäerter generéieren fir mat der ursprénglecher ID ze entspriechen, d'Kaarttabelle späicheren a strikt den Zougang zu der Kaarttabelle kontrolléieren.
- Dir kënnt och Verschlësselung benotze fir Pseudonyme ze produzéieren, awer Dir musst den Entschlësselschlëssel richteg halen;
Dës Technologie gëtt wäit benotzt am Fall vun enger grousser Zuel vun onofhängegen Datebenotzer, sou wéi OpenID am Open Plattform Szenario, wou verschidden Entwéckler verschidden Openids fir dee selwechte Benotzer kréien.
(5). Generaliséierungstechniken
Generaliséierungstechnik bezitt sech op eng De-Identifikatiounstechnik déi d'Granularitéit vun ausgewielten Attributer an engem Datesaz reduzéiert an eng méi allgemeng an abstrakt Beschreiwung vun den Donnéeën ubitt. Generaliséierungstechnologie ass einfach ze implementéieren a kann d'Authentizitéit vu Rekordniveau Daten schützen. Et gëtt allgemeng an Dateprodukter oder Dateberichter benotzt.
- Rounding: involvéiert d'Auswiel vun enger Roundbasis fir dat ausgewielten Attribut, sou wéi Upward oder Downward Forensik, déi Resultater 100, 500, 1K, an 10K ginn
- Top an ënnen Kodéierungstechniken: Ersetzen Wäerter iwwer (oder ënner) der Schwell mat engem Schwell deen den ieweschten (oder ënnen) Niveau representéiert, wat e Resultat vun "iwwer X" oder "ënnert X" gëtt
(6). Randomization Techniken
Als Aart vun De-Identifikatiounstechnik bezitt d'Randomiséierungstechnologie op d'Ännerung vum Wäert vun engem Attribut duerch Randomiséierung, sou datt de Wäert no Randomiséierung anescht ass wéi den urspréngleche reelle Wäert. Dëse Prozess reduzéiert d'Fäegkeet vun engem Ugräifer fir en Attributwäert vun aneren Attributwäerter am selwechte Daterekord ofzeleeën, awer beaflosst d'Authentizitéit vun de resultéierende Donnéeën, wat mat Produktiounstestdaten gemeinsam ass.
Post Zäit: Sep-27-2022