1. De Konzept vun der Datemaskéierung
Datemaskéierung ass och bekannt als Datemaskéierung. Et ass eng technesch Method fir sensibel Donnéeën wéi Handysnummer, Bankkaartnummer an aner Informatiounen ze konvertéieren, z'änneren oder ze verstoppen, wa mir Maskéierungsregelen a Richtlinne festgeluecht hunn. Dës Technik gëtt haaptsächlech benotzt fir ze verhënneren datt sensibel Donnéeën direkt an onzouverlässegen Ëmfeld benotzt ginn.
Prinzip vun der Datemaskéierung: D'Datemaskéierung soll déi ursprénglech Datecharakteristiken, Geschäftsregelen an Daterelevanz erhalen, fir sécherzestellen, datt déi spéider Entwécklung, Tester an Datenanalyse net duerch Maskéierung beaflosst ginn. D'Konsistenz an d'Validitéit vun den Daten virun an no der Maskéierung garantéieren.
2. Klassifikatioun vun Datemaskéierung
Datenmaskéierung kann a statesch Datenmaskéierung (SDM) an dynamesch Datenmaskéierung (DDM) opgedeelt ginn.
Statesch Datenmaskéierung (SDM)Statesch Datenmaskéierung erfuerdert d'Grënnung vun enger neier Datebank fir Net-Produktiounsëmfeld fir d'Isolatioun vun der Produktiounsëmfeld. Sensibel Donnéeë ginn aus der Produktiounsdatebank extrahéiert an dann an der Net-Produktiounsdatebank gespäichert. Op dës Manéier ginn déi desensibiliséiert Donnéeë vun der Produktiounsëmfeld isoléiert, wat den Geschäftsbedürfnisser entsprécht an d'Sécherheet vun de Produktiounsdaten garantéiert.
Dynamesch Datenmaskéierung (DDM)Et gëtt allgemeng an der Produktiounsëmfeld benotzt fir sensibel Donnéeën a Echtzäit ze desensibiliséieren. Heiansdo sinn ënnerschiddlech Maskéierungsniveauen erfuerderlech fir déiselwecht sensibel Donnéeën a verschiddene Situatiounen ze liesen. Zum Beispill kënnen ënnerschiddlech Rollen a Berechtigungen ënnerschiddlech Maskéierungsschemae implementéieren.
Applikatioun fir Datenrapportéierung an Maskéierung vu Datenprodukter
Zu dëse Szenarie gehéieren haaptsächlech intern Dateniwwerwaachungsprodukter oder Reklammplakater, extern Servicedatenprodukter a Rapporten op Basis vun Datenanalysen, wéi z. B. Geschäftsberichter a Projetreviews.
3. Datenmaskéierungsléisung
Zu de gängigen Datenmaskierungsschemae gehéieren: Invalidéierung, zoufällege Wäert, Datenersatz, symmetresch Verschlësselung, Duerchschnëttswäert, Offset an Ronnung, etc.
OngëltegkeetInvalidéierung bezitt sech op d'Verschlësselung, d'Ofkierzung oder d'Verstoppen vu sensiblen Donnéeën. Dëst Schema ersetzt normalerweis richteg Donnéeën duerch speziell Symboler (wéi *). D'Operatioun ass einfach, awer d'Benotzer kënnen de Format vun den ursprénglechen Donnéeën net kennen, wat spéider Datenapplikatioune beaflosse kann.
Zoufällege WäertDe zoufällege Wäert bezitt sech op den zoufällegen Ersatz vu sensiblen Donnéeën (Zuelen ersetzen Zifferen, Buschtawen ersetzen Buschtawen, a Zeechen ersetzen Zeechen). Dës Maskéierungsmethod garantéiert de Format vu sensiblen Donnéeën bis zu engem gewësse Grad a vereinfacht déi spéider Datenapplikatioun. Maskéierungslexikone kënne fir verschidde bedeitend Wierder, wéi z. B. Nimm vu Persounen a Plazen, néideg sinn.
DatenersatzDatenersatz ass ähnlech wéi d'Maskéierung vun Null- a zoufällege Wäerter, ausser datt amplaz vu Spezialzeechen oder zoufällege Wäerter d'Maskéierungsdaten duerch e spezifesche Wäert ersat ginn.
Symmetresch VerschlësselungSymmetresch Verschlësselung ass eng speziell reversibel Maskéierungsmethod. Si verschlësselt sensibel Donnéeën duerch Verschlësselungsschlësselen an Algorithmen. De Chiphertextformat ass konsequent mat den ursprénglechen Donnéeën a logesche Reegelen.
DuerchschnëttD'Duerchschnëttsschema gëtt dacks a statistesche Szenarie benotzt. Fir numeresch Donnéeën berechnen mir als éischt hire Mëttelwäert, an dann verdeelen mir déi desensibiliséiert Wäerter zoufälleg ronderëm de Mëttelwäert, wouduerch d'Zomm vun den Donnéeën konstant bleift.
Offset an OfrondungDës Method ännert déi digital Donnéeën duerch eng zoufälleg Verrécklung. D'Offset-Rondung garantéiert déi ongeféier Authentizitéit vum Beräich, wärend d'Sécherheet vun den Donnéeën erhale bleift, déi méi no un den tatsächlechen Donnéeën ass wéi déi virdrun Methoden, an huet eng grouss Bedeitung am Szenario vun der Big Data-Analyse.
De recommandéierte Modell "ML-NPB-5660"fir d'Datemaskéierung
4. Dacks benotzt Datemaskéierungstechniken
(1). Statistesch Techniken
Datenauswiel an Datenaggregatioun
- Datenauswiel: D'Analyse an d'Evaluatioun vum ursprénglechen Datesaz andeems eng representativ Ënnergrupp vum Datesaz ausgewielt gëtt ass eng wichteg Method fir d'Effektivitéit vun Deidentifikatiounstechniken ze verbesseren.
- Datenaggregatioun: Als eng Sammlung vu statisteschen Techniken (wéi Summatioun, Zielen, Duerchschnëttsberechnung, Maximum a Minimum), déi op Attributer a Mikrodaten ugewannt ginn, ass d'Resultat representativ fir all Daten am ursprénglechen Datesaz.
(2). Kryptographie
Kryptographie ass eng üblech Method fir Desensibiliséierung ze desensibiliséieren oder d'Effektivitéit vun der Desensibiliséierung ze verbesseren. Verschidden Aarte vu Verschlësselungsalgorithmen kënnen ënnerschiddlech Desensibiliséierungseffekter erreechen.
- Deterministesch Verschlësselung: Eng net-zoufälleg symmetresch Verschlësselung. Si veraarbecht normalerweis ID-Donnéeën a kann den Chiffertext entschlësselen an op déi ursprénglech ID restauréieren, wann néideg, awer de Schlëssel muss richteg geschützt sinn.
- Irreversibel Verschlësselung: D'Hashfunktioun gëtt benotzt fir Daten ze veraarbechten, déi normalerweis fir ID-Daten benotzt ginn. Si kënnen net direkt entschlësselt ginn an d'Mapping-Bezéiung muss gespäichert ginn. Zousätzlech kann et wéinst der Funktioun vun der Hashfunktioun zu Datenkollisiounen kommen.
- Homomorph Verschlësselung: Den homomorphe Chiphertext Algorithmus gëtt benotzt. Seng Charakteristik ass, datt d'Resultat vun der Chiphertext Operatioun datselwecht ass wéi dat vun der Klartext Operatioun no der Entschlësselung. Dofir gëtt en dacks benotzt fir numeresch Felder ze veraarbechten, awer aus Performance Grënn net wäit verbreet.
(3). Systemtechnologie
D'Ënnerdréckungstechnologie läscht oder schützt Datenelementer of, déi net dem Dateschutz entspriechen, awer publizéiert se net.
- Maskéieren: et bezitt sech op déi heefegst Desensibiliséierungsmethod fir den Attributwäert ze maskéieren, wéi zum Beispill d'Nummer vum Géigner, d'Identitéitskaart ass mat engem Asterisk markéiert oder d'Adress ass ofgeschnidden.
- Lokal Ënnerdréckung: bezitt sech op de Prozess vum Läschen vun spezifeschen Attributwäerter (Kolonnen), vum Ewechhuele vun net-essentiellen Datenfelder;
- Datensuppressioun: bezitt sech op de Prozess vum Läschen vun spezifeschen Datensätz (Reien), vum Läschen vun net-essentiellen Datensätz.
(4). Pseudonymtechnologie
Pseudomanning ass eng Deidentifikatiounstechnik, déi e Pseudonym benotzt fir en direkten Identifizéierer (oder en aneren sensiblen Identifizéierer) ze ersetzen. Pseudonymtechnike kreéieren eenzegaarteg Identifizéierer fir all eenzel Informatiounssujet, amplaz vun direkten oder sensiblen Identifizéierer.
- Et kann onofhängeg zoufälleg Wäerter generéieren, déi der ursprénglecher ID entspriechen, d'Mapping-Tabell späicheren an den Zougang zu der Mapping-Tabell strikt kontrolléieren.
- Dir kënnt och Verschlësselung benotze fir Pseudonyme ze produzéieren, awer Dir musst den Entschlësselungsschlëssel richteg behalen;
Dës Technologie gëtt wäit verbreet am Fall vun enger grousser Zuel vun onofhängege Benotzer vun Daten agesat, wéi zum Beispill OpenID am Szenario vun oppene Plattformen, wou verschidden Entwéckler verschidden OpenIDen fir deeselwechte Benotzer kréien.
(5). Generaliséierungstechniken
D'Generaliséierungstechnik bezitt sech op eng Deidentifikatiounstechnik, déi d'Granularitéit vun ausgewählten Attributer an engem Datesaz reduzéiert an eng méi allgemeng an abstrakt Beschreiwung vun den Donnéeën ubitt. D'Generaliséierungstechnologie ass einfach ëmzesetzen a kann d'Authentizitéit vun Daten op Datenniveau schützen. Si gëtt dacks an Datenprodukter oder Datenrapporter benotzt.
- Ronnung: beinhalt d'Auswiel vun enger Ronnungsbasis fir den ausgewielten Attribut, wéi z. B. no uewen oder no ënnen Forensik, wat Resultater vun 100, 500, 1K an 10K ergëtt.
- Top- a Bottom-Codéierungstechniken: Wäerter iwwer (oder ënner) dem Schwellwäert duerch e Schwellwäert ersetzen, deen den ieweschten (oder ënneschten) Niveau representéiert, wat zu engem Resultat vun "iwwer X" oder "ënner X" féiert.
(6). Randomiséierungstechniken
Als eng Zort Deidentifikatiounstechnik bezitt sech d'Randomiséierungstechnologie op d'Modifikatioun vum Wäert vun engem Attribut duerch Randomiséierung, sou datt de Wäert no der Randomiséierung anescht ass wéi den urspréngleche reelle Wäert. Dëse Prozess reduzéiert d'Fäegkeet vun engem Ugräifer, en Attributwäert aus aneren Attributwäerter am selwechte Datensatz ofzeleeden, awer beaflosst d'Authentizitéit vun den resultéierenden Donnéeën, wat bei Produktiounstestdaten heefeg ass.
Zäitpunkt vun der Verëffentlechung: 27. September 2022