1. Концепт маскирања података
Маскирање података је такође познато као маскирање података. То је техничка метода претворити, модификовати или прекрити осетљиве податке као што су број мобилног телефона, број банковне картице и друге информације када смо дали правила и политике маскирања. Ова техника се првенствено користи да се спречи да се осетљиви подаци користе директно у непоузданим окружењима.
Принцип маскирања података: Маскирање података треба да одржи оригиналне карактеристике података, пословна правила и релевантност података да би се осигурало да се маскирање не утиче на накнадни развој, тестирање и анализу података. Осигурати конзистентност података и валидност пре и после маскирања.
2 Класификација маскирања података
Маскирање података може се поделити у статичко маскирање података (СДМ) и динамички маскирање података (ДДМ).
Статички маскирање података (СДМ): Статичко маскирање података захтева успостављање нове базе података непродуктивног окружења за изолацију из производног окружења. Осетљиви подаци се извлаче из базе података производње и потом се чувају у бази података која не производи. На овај начин се десензитизовани подаци изолирају из производног окружења, који задовољава пословне потребе и осигурава сигурност података о производњи.
Динамично маскирање података (ДДМ): Опћенито се користи у производном окружењу како би се десензибилизовала осетљиве податке у реалном времену. Понекад су потребни различити нивои маскирања за читање истих осетљивих података у различитим ситуацијама. На пример, различите улоге и дозволе могу имплементирати различите шеме маскирања.
Пријава за извештавање о подацима и производи података за маскирање података
Такви сценарији углавном укључују интерне производе за праћење података или билборд, производе података о спољним услугама и извештаје на основу анализе података, као што су пословни извештаји и преглед пројекта.
3. Раствор за маскирање података
Уобичајене шеме маскирања података укључују: неваљавање, случајну вредност, замену података, симетрична шифрирања, просечна вредност, компензацију и заокруживање итд.
Поништење: Инвалидација се односи на шифровање, скраћење или скривање осетљивих података. Ова шема обично замењује стварне податке са посебним симболима (као што је *). Операција је једноставна, али корисници не могу знати формат оригиналних података који могу утицати на наредне апликације података.
Насумична вредност: Случајна вредност односи се на случајну замену осетљивих података (бројеви замењују цифре, слова замењују слова и знакови замењују знакове). Ова метода маскирања обезбедиће формат осетљивих података у одређеној мери и олакшати накнадну апликацију података. За неке смислене речи могу бити потребне маскиране речнике, попут имена људи и места.
Замена података: Замена података је слична маскирању нула и случајних вредности, осим што уместо да користе посебне знакове или случајне вредности, подаци о маскирањима се замењују одређеном вриједношћу.
Симетрична шифровање: Симетрична шифроција је посебна реверзибилна метода маскирања. Шифрира осетљиве податке преко шифрираних типка и алгоритама. Формат шифрортадела је у складу са оригиналним подацима у логичким правилима.
Просек: Просечна шема се често користи у статистичким сценаријима. За нумеричке податке, прво израчунавамо њихову средњу вредност, а затим насумично дистрибуира десензитизоване вредности око средње вредности, чиме се држи зброј константних података.
Офсет и заокруживање: Ова метода мења дигиталне податке случајним сменом. Окружење оффсет осигурава приближну аутентичност опсега током одржавања сигурности података, који је ближи стварним подацима од претходних шема и има велики значај у сценарију велике анализе података.
Модел препоручује "МЛ-НПБ-5660"За маскирање података
4. Обично коришћене технике маскирања података
(1). Статистичке технике
Узорковање података и агрегација података
- Узорковање података: Анализа и евалуација оригиналног скупа података Одабиром репрезентативног подскуп скупа података је важна метода за побољшање ефикасности техника идентификације де-идентификације.
- Агрегација података: Као збирка статистичких техника (као што је збир, просечно, максимално и минимум) примењено на атрибуте у микродати, резултат је репрезентативан за све записе у оригиналном скупу података.
(2). Криптографија
Криптографија је уобичајена метода да се десензибилизује или побољшава ефикасност десензибилизације. Различите врсте алгоритама шифрирања могу постићи различите ефекте десензитирања.
- Детерминистично шифровање: не-случајна симетрична шифрирања. Обично обрађује податке о ИД-у и може дешифровати и обновити шифрастотак оригиналног ИД-а када је то потребно, али кључ је потребно правилно заштићен.
- Иреверзибилна шифрирања: ХАСХ функција се користи за обраду података, који се обично користи за ИД податке. Не може се директно дешифровати и однос мапирања се мора сачувати. Поред тога, због карактеристике функције Хасх, може се појавити судар података.
- ХОМОМОРФХИЧКА Шифрирање: користи се шифрортистански хомоморфни алгоритам. Његова карактеристика је да је резултат рада шифрирасте тексти исте као и оперативни рад налик текстуалним текстом након дешифрирања. Стога се обично користи за обраду нумеричких области, али то се не може широко користити за разлоге из перформанси.
(3). Системска технологија
Технологија сузбијања брише или одише податке о подацима који не испуњавају заштиту приватности, али их не објављују.
- Маскирање: То се односи на најчешће методе десензибилизације за маскирање вредности атрибута, попут броја противника, лична карта је означена звездицом или адреса је скраћена.
- локално сузбијање: односи се на процес брисања специфичних вредности атрибута (ступца), уклањањем небитних поља података;
- Снимање записа: Односи се на процес брисања одређених записа (редове), брисање небитних података о подацима.
(4). Псеудоним технологија
Псеудоманнинг је техника де-идентификације која користи псеудонимом за замену директног идентификатора (или другог осетљивог идентификатора). Псеудоним Технике стварају јединствене идентификаторе за сваку појединачну информацију, уместо директних или осетљивих идентификатора.
- Може да створи случајне вредности независно да одговарају оригиналном ИД-у, сачувајте таблицу за мапирање и строго контролишу приступ таблици за мапирање.
- Такође можете користити шифровање да бисте произвели псеудониме, али треба да правилно задржите кључ за дешифровање;
Ова технологија се широко користи у случају великог броја независних корисника података, попут ОпенИД-а на отвореном сценарију платформи, где различити програмери добијају различите отворене особе за истог корисника.
(5). Генерализација техника
Генерализација техника се односи на технику де-идентификације која смањује грануларност одабраних атрибута у скупу података и пружа општији и апстрактнији опис података. Генерализација технологија је једноставна за спровођење и може заштитити аутентичност података на нивоу записа. Обично се користи у подацима или извештајима података.
- Заокруживање: укључује одабир заокруживања основне базе за одабрани атрибут, као што су форензика према горе или надоле, дајући резултатима 100, 500, 1К и 10К
- ТЕХНИКЕ ГОРЊЕ И Дно кодирања: Замените вредности изнад (или испод) прага са прагом који представља врх (или доњи), дајући резултат "изнад к" или "испод к" или "испод к" или "испод к" или "
(6). Технике рандомизације
Као врсту технике де-идентификације, технологија рандомизације односи се на измену вредности атрибута кроз рандомизацију, тако да се вредност након рандомизације разликује од првобитне реалне вредности. Овај поступак смањује способност нападача да добије вредност атрибута од осталих вредности атрибута у истом податковном евиденцији, али утиче на аутентичност добијених података, што је уобичајено са подацима о испитивању производње.
Вријеме поште: сеп-27-2022