რა არის მონაცემთა ნიღბების ტექნოლოგია და გადაწყვეტა ქსელის პაკეტის ბროკერში?

1. მონაცემთა ნიღბების კონცეფცია

მონაცემთა ნიღაბი ასევე ცნობილია, როგორც მონაცემთა ნიღაბი. ეს არის ტექნიკური მეთოდი მგრძნობიარე მონაცემების გარდაქმნის, მოდიფიცირებისთვის ან დაფარვისთვის, როგორიცაა მობილური ტელეფონის ნომერი, საბანკო ბარათის ნომერი და სხვა ინფორმაცია, როდესაც ჩვენ მივცეთ ნიღბების წესები და პოლიტიკა. ეს ტექნიკა პირველ რიგში გამოიყენება მგრძნობიარე მონაცემების უშუალოდ არასაიმედო გარემოში გამოყენების თავიდან ასაცილებლად.

მონაცემთა ნიღბების პრინციპი: მონაცემთა ნიღბებმა უნდა შეინარჩუნოს მონაცემთა ორიგინალური მახასიათებლები, ბიზნესის წესები და მონაცემთა აქტუალობა, რათა უზრუნველყოს შემდგომი განვითარება, ტესტირება და მონაცემთა ანალიზი არ იმოქმედებს ნიღბით. უზრუნველყოს მონაცემთა თანმიმდევრულობა და სანდოობა ნიღბების დაწყებამდე და მის შემდეგ.

2. მონაცემთა ნიღბების კლასიფიკაცია

მონაცემთა ნიღბები შეიძლება დაიყოს მონაცემთა სტატიკურ ნიღბად (SDM) და მონაცემთა დინამიური ნიღბად (DDM).

სტატიკური მონაცემთა ნიღაბი (SDM): სტატიკური მონაცემების ნიღაბი მოითხოვს წარმოების გარემოსგან იზოლაციის ახალი არაპროდუქტიული გარემოს მონაცემთა ბაზის შექმნას. მგრძნობიარე მონაცემები ამოღებულია წარმოების მონაცემთა ბაზიდან და შემდეგ ინახება არაპროდუქტიული მონაცემთა ბაზაში. ამ გზით, დესენსიტიზირებული მონაცემები იზოლირებულია წარმოების გარემოდან, რომელიც აკმაყოფილებს ბიზნესის საჭიროებებს და უზრუნველყოფს წარმოების მონაცემების უსაფრთხოებას.

SDM

დინამიური მონაცემთა ნიღაბი (DDM): იგი ზოგადად გამოიყენება წარმოების გარემოში რეალურ დროში მგრძნობიარე მონაცემების დენსიტიზაციისთვის. ზოგჯერ, ნიღბების სხვადასხვა დონეა საჭირო, რომ წაიკითხონ იგივე მგრძნობიარე მონაცემები სხვადასხვა სიტუაციებში. მაგალითად, სხვადასხვა როლებმა და ნებართვებმა შეიძლება განახორციელოს ნიღბის სხვადასხვა სქემები.

DDM

მონაცემთა ანგარიშგების და მონაცემთა პროდუქტების მაკიაჟის პროგრამა

ასეთი სცენარები ძირითადად მოიცავს შიდა მონაცემთა მონიტორინგის პროდუქტებს ან ბილბორდს, გარე სერვისის მონაცემთა პროდუქტებს და მონაცემთა ანალიზის საფუძველზე დაფუძნებულ ანგარიშებს, როგორიცაა ბიზნესის ანგარიშები და პროექტის მიმოხილვა.

მონაცემთა ანგარიშგების პროდუქტის ნიღაბი

3. მონაცემთა ნიღბების გადაწყვეტა

მონაცემთა ნიღბების საერთო სქემებში შედის: ბათილობა, შემთხვევითი მნიშვნელობა, მონაცემთა ჩანაცვლება, სიმეტრიული დაშიფვრა, საშუალო მნიშვნელობა, ოფსეტური და დამრგვალება და ა.შ.

ბათილობა: ბათილადობა ეხება მგრძნობიარე მონაცემების დაშიფვრას, შემცირებას ან დამალვას. ეს სქემა ჩვეულებრივ ცვლის რეალურ მონაცემებს სპეციალური სიმბოლოებით (მაგალითად *). ოპერაცია მარტივია, მაგრამ მომხმარებლებმა არ იციან ორიგინალური მონაცემების ფორმატი, რამაც შეიძლება გავლენა მოახდინოს მონაცემთა შემდგომ პროგრამებზე.

შემთხვევითი მნიშვნელობა: შემთხვევითი მნიშვნელობა ეხება მგრძნობიარე მონაცემების შემთხვევითი ჩანაცვლებას (ციფრები შეცვლის ციფრებს, ასოებს შეცვლის ასოებს, ხოლო სიმბოლოები შეცვლის სიმბოლოებს). ნიღბების ეს მეთოდი უზრუნველყოფს მგრძნობიარე მონაცემების ფორმატს გარკვეულწილად და ხელს შეუწყობს შემდგომი მონაცემების გამოყენებას. ნიღბების ლექსიკონები შეიძლება დაგჭირდეთ რამდენიმე მნიშვნელოვანი სიტყვისთვის, მაგალითად, ადამიანებისა და ადგილების სახელები.

მონაცემთა ჩანაცვლება: მონაცემთა ჩანაცვლება მსგავსია null და შემთხვევითი მნიშვნელობების ნიღბით, გარდა იმისა, რომ სპეციალური სიმბოლოების ან შემთხვევითი მნიშვნელობების გამოყენების ნაცვლად, ნიღბების მონაცემები იცვლება კონკრეტული მნიშვნელობით.

სიმეტრიული დაშიფვრა: სიმეტრიული დაშიფვრა არის სპეციალური შექცევადი ნიღბების მეთოდი. იგი დაშიფვრავს მგრძნობიარე მონაცემებს დაშიფვრის კლავიშების და ალგორითმების საშუალებით. CipherText ფორმატი შეესაბამება ორიგინალ მონაცემებს ლოგიკურ წესებში.

საშუალო: საშუალო სქემა ხშირად გამოიყენება სტატისტიკურ სცენარებში. რიცხვითი მონაცემებისთვის, ჩვენ პირველ რიგში გამოვთვალეთ მათი საშუალო, შემდეგ კი შემთხვევით ვანაწილებთ დესენსიბილიზებულ მნიშვნელობებს საშუალოზე, რითაც მონაცემების მუდმივი ჯამი.

ოფსეტური და დამრგვალება: ეს მეთოდი ცვლის ციფრულ მონაცემებს შემთხვევითი ცვლა. ოფსეტური დამრგვალება უზრუნველყოფს დიაპაზონის სავარაუდო ავთენტურობას მონაცემთა უსაფრთხოების შენარჩუნებისას, რაც წინა სქემებთან შედარებით უფრო ახლოსაა და დიდი მნიშვნელობა აქვს დიდი მონაცემების ანალიზის სცენარში.

ML-NPB-5660- 数据脱敏

რეკომენდაციის მოდელი "ML-NPB-5660"მონაცემთა ნიღბისთვის

4. ჩვეულებრივ გამოყენებული მონაცემთა ნიღბების ტექნიკა

(1). სტატისტიკური ტექნიკა

მონაცემთა შერჩევა და მონაცემთა აგრეგაცია

- მონაცემთა შერჩევა: მონაცემთა კომპლექტის წარმომადგენლობითი ქვესახეობის შერჩევის გზით მითითებული ორიგინალური მონაცემების ანალიზი და შეფასება მნიშვნელოვანი მეთოდია დე-იდენტიფიკაციის ტექნიკის ეფექტურობის გასაუმჯობესებლად.

- მონაცემთა აგრეგაცია: როგორც სტატისტიკური ტექნიკის შეგროვება (მაგალითად, ჯამური, დათვლა, საშუალოდ, მაქსიმალური და მინიმალური), რომელიც გამოიყენება მიკროდატებში ატრიბუტებზე, შედეგი წარმოადგენს ყველა ჩანაწერის წარმომადგენელს მონაცემთა თავდაპირველ ნაკრებში.

(2). კრიპტოგრაფია

კრიპტოგრაფია ჩვეულებრივი მეთოდია დესენსიბილიზაციის ეფექტურობის დენსიტიზაციისა და გასაუმჯობესებლად. დაშიფვრის ალგორითმების სხვადასხვა ტიპმა შეიძლება მიაღწიოს სხვადასხვა დესენსიბილიზაციის ეფექტს.

- დეტერმინისტული დაშიფვრა: არა შემთხვევითი სიმეტრიული დაშიფვრა. ეს ჩვეულებრივ ამუშავებს პირადობის მოწმობის მონაცემებს და შეუძლია საჭიროების შემთხვევაში, დაშიფვრა და აღადგინოს შიფრირება, მაგრამ საჭიროების შემთხვევაში, მაგრამ გასაღები სათანადოდ უნდა იყოს დაცული.

- შეუქცევადი დაშიფვრა: ჰაშის ფუნქცია გამოიყენება მონაცემების დასამუშავებლად, რომელიც ჩვეულებრივ გამოიყენება პირადობის მოწმობისთვის. მისი პირდაპირ გაშიფვრა შეუძლებელია და რუკების ურთიერთობა უნდა იყოს შენახული. გარდა ამისა, ჰაშის ფუნქციის მახასიათებლის გამო, შეიძლება მოხდეს მონაცემთა შეჯახება.

- ჰომომორფული დაშიფვრა: გამოიყენება შიფრალური ჰომომორფული ალგორითმი. მისი მახასიათებელია ის, რომ შიფრინტის ოპერაციის შედეგი იგივეა, რაც გაშიფვრის შემდეგ plaintext ოპერაციის შემდეგ. აქედან გამომდინარე, იგი ჩვეულებრივ გამოიყენება რიცხვითი ველების დასამუშავებლად, მაგრამ იგი ფართოდ არ გამოიყენება შესრულების მიზეზების გამო.

(3). სისტემის ტექნოლოგია

ჩახშობის ტექნოლოგია წაშლის ან ფარავს მონაცემთა ნივთებს, რომლებიც არ აკმაყოფილებენ კონფიდენციალურობის დაცვას, მაგრამ არ აქვეყნებს მათ.

- ნიღაბი: ეს ეხება ყველაზე გავრცელებული დესენსიბილიზაციის მეთოდს ატრიბუტის მნიშვნელობის დასაფენად, მაგალითად, მოწინააღმდეგის ნომერი, პირადობის მოწმობა აღინიშნება ვარსკვლავით, ან მისამართი შემცირდება.

- ადგილობრივი ჩახშობა: ეხება კონკრეტული ატრიბუტის მნიშვნელობების (სვეტების) წაშლის პროცესს, მონაცემთა არსებითი ველების ამოღებას;

- ჩაწერის ჩახშობა: ეხება კონკრეტული ჩანაწერების წაშლის პროცესს (რიგები), მონაცემთა არსებითი ჩანაწერების წაშლის პროცესს.

(4). ფსევდონიმის ტექნოლოგია

Pseudomanning არის დეიდიდების ტექნიკა, რომელიც იყენებს ფსევდონიმს პირდაპირი იდენტიფიკატორის (ან სხვა მგრძნობიარე იდენტიფიკატორის) შესაცვლელად. ფსევდონიმის ტექნიკა ქმნის უნიკალურ იდენტიფიკატორებს თითოეული ინდივიდუალური ინფორმაციის საგნისთვის, პირდაპირი ან მგრძნობიარე იდენტიფიკატორების ნაცვლად.

- მას შეუძლია დამოუკიდებლად წარმოქმნას შემთხვევითი მნიშვნელობები, რომ შეესაბამებოდეს ორიგინალ ID- ს, შეინახოს რუკების ცხრილი და მკაცრად გააკონტროლოს რუკების ცხრილის წვდომა.

- თქვენ ასევე შეგიძლიათ გამოიყენოთ დაშიფვრა ფსევდონიმების შესაქმნელად, მაგრამ უნდა შეინარჩუნოთ გაშიფვრის გასაღები სწორად;

ეს ტექნოლოგია ფართოდ გამოიყენება იმ შემთხვევაში, თუ დიდი რაოდენობით დამოუკიდებელი მონაცემების მომხმარებლები, მაგალითად, OpenID– ის ღია პლატფორმის სცენარში, სადაც სხვადასხვა დეველოპერები იღებენ სხვადასხვა OpenID– ს იმავე მომხმარებლისთვის.

(5). განზოგადების ტექნიკა

განზოგადების ტექნიკა ეხება დეიდაციის ინიდაციის ტექნიკას, რომელიც ამცირებს არჩეული ატრიბუტების გრანულობას მონაცემთა ნაკრებში და უზრუნველყოფს მონაცემების უფრო ზოგად და აბსტრაქტულ აღწერას. განზოგადების ტექნოლოგია მარტივია და შეუძლია დაიცვას ჩანაწერების დონის მონაცემების ნამდვილობა. იგი ჩვეულებრივ გამოიყენება მონაცემთა პროდუქტებში ან მონაცემთა ანგარიშებში.

- დამრგვალება: გულისხმობს შერჩეული ატრიბუტის დამრგვალების ბაზის შერჩევას, მაგალითად, ზემოთ ან ქვევით სასამართლო ექსპერტიზას, შედეგების მიღებას 100, 500, 1K და 10K

- ზედა და ქვედა კოდირების ტექნიკა: შეცვალეთ ზემოთ მოცემული მნიშვნელობები (ან ქვემოთ) ბარიერი ბარიერი, რომელიც წარმოადგენს ზედა (ან ქვედა) დონეს, რაც გამოიღო "ზემოთ X" ან "ქვემოთ X"

(6). რანდომიზაციის ტექნიკა

როგორც ერთგვარი დე-იდენტიფიკაციის ტექნიკა, რანდომიზაციის ტექნოლოგია გულისხმობს ატრიბუტის მნიშვნელობის შეცვლას რანდომიზაციის გზით, ისე, რომ რანდომიზაციის შემდეგ მნიშვნელობა განსხვავდება ორიგინალური რეალური მნიშვნელობისგან. ეს პროცესი ამცირებს თავდამსხმელის შესაძლებლობას, რომ გამოიტანოს ატრიბუტის მნიშვნელობა სხვა ატრიბუტის მნიშვნელობებისგან იმავე მონაცემთა ჩანაწერში, მაგრამ გავლენას ახდენს შედეგად მიღებული მონაცემების ნამდვილობაზე, რაც საერთოა წარმოების ტესტის მონაცემებთან.


პოსტის დრო: SEP-27-2022