რა არის მონაცემთა დაფარვის ტექნოლოგია და გამოსავალი ქსელის პაკეტების ბროკერში?

1. მონაცემთა ნიღბის კონცეფცია

მონაცემთა ნიღაბი ასევე ცნობილია, როგორც მონაცემთა ნიღაბი. ეს არის ტექნიკური მეთოდი კონვერტირებისთვის, შეცვლით ან დაფარავს მგრძნობიარე მონაცემებს, როგორიცაა მობილური ტელეფონის ნომერი, საბანკო ბარათის ნომერი და სხვა ინფორმაცია, როდესაც ჩვენ გვაქვს დაფარვის წესები და პოლიტიკა. ეს ტექნიკა ძირითადად გამოიყენება, რათა თავიდან იქნას აცილებული მგრძნობიარე მონაცემების გამოყენება უშუალოდ არასანდო გარემოში.

მონაცემთა ნიღბის პრინციპი: მონაცემთა ნიღბმა უნდა შეინარჩუნოს მონაცემთა ორიგინალური მახასიათებლები, ბიზნეს წესები და მონაცემთა შესაბამისობა, რათა უზრუნველყოს, რომ შემდგომ განვითარებაზე, ტესტირებასა და მონაცემთა ანალიზზე გავლენას არ მოახდენს შენიღბვა. უზრუნველყოს მონაცემთა თანმიმდევრულობა და ვალიდობა დაფარვის წინ და მის შემდეგ.

2. მონაცემთა ნიღბის კლასიფიკაცია

მონაცემთა დაფარვა შეიძლება დაიყოს სტატიკურ მონაცემთა დაფარვას (SDM) და დინამიურ მონაცემთა დაფარვას (DDM).

სტატიკური მონაცემთა ნიღაბი (SDM): სტატიკური მონაცემების დაფარვა მოითხოვს ახალი არასაწარმოო გარემოს მონაცემთა ბაზის შექმნას საწარმოო გარემოდან იზოლირებისთვის. სენსიტიური მონაცემები ამოღებულია საწარმოო მონაცემთა ბაზიდან და შემდეგ ინახება არასაწარმოო მონაცემთა ბაზაში. ამ გზით ხდება დესენსიბილიზებული მონაცემების იზოლირება საწარმოო გარემოდან, რომელიც აკმაყოფილებს ბიზნესის საჭიროებებს და უზრუნველყოფს წარმოების მონაცემების უსაფრთხოებას.

SDM

დინამიური მონაცემთა დაფარვა (DDM): ის ზოგადად გამოიყენება წარმოების გარემოში სენსიტიური მონაცემების რეალურ დროში დესენსიბილიზაციისთვის. ზოგჯერ, სხვადასხვა სიტუაციებში ერთიდაიგივე მგრძნობიარე მონაცემების წასაკითხად საჭიროა დაფარვის სხვადასხვა დონე. მაგალითად, სხვადასხვა როლებმა და ნებართვებმა შეიძლება განახორციელონ სხვადასხვა ნიღბის სქემები.

DDM

მონაცემთა მოხსენებისა და მონაცემთა პროდუქტების ნიღბის აპლიკაცია

ასეთი სცენარები ძირითადად მოიცავს მონაცემთა შიდა მონიტორინგის პროდუქტებს ან ბილბორდებს, გარე სერვისების მონაცემთა პროდუქტებს და მონაცემთა ანალიზზე დაფუძნებულ ანგარიშებს, როგორიცაა ბიზნეს ანგარიშები და პროექტის მიმოხილვა.

მონაცემთა ანგარიშგების პროდუქტის ნიღაბი

3. მონაცემთა დაფარვის ხსნარი

მონაცემთა დაფარვის საერთო სქემები მოიცავს: გაუქმებას, შემთხვევით მნიშვნელობას, მონაცემთა ჩანაცვლებას, სიმეტრიულ დაშიფვრას, საშუალო მნიშვნელობას, ოფსეტს და დამრგვალებას და ა.შ.

ბათილობა: ბათილობა ეხება მგრძნობიარე მონაცემების დაშიფვრას, შეკვეცას ან დამალვას. ეს სქემა ჩვეულებრივ ცვლის რეალურ მონაცემებს სპეციალური სიმბოლოებით (როგორიცაა *). ოპერაცია მარტივია, მაგრამ მომხმარებლებმა არ იციან ორიგინალური მონაცემების ფორმატი, რამაც შეიძლება გავლენა მოახდინოს მონაცემთა შემდგომ აპლიკაციებზე.

შემთხვევითი მნიშვნელობა: შემთხვევითი მნიშვნელობა ეხება მგრძნობიარე მონაცემების შემთხვევით ჩანაცვლებას (ნომრები ცვლის ციფრებს, ასოები ცვლის ასოებს და სიმბოლოები ცვლის სიმბოლოებს). შენიღბვის ეს მეთოდი გარკვეულწილად უზრუნველყოფს მგრძნობიარე მონაცემების ფორმატს და ხელს შეუწყობს მონაცემთა შემდგომ გამოყენებას. ნიღბების ლექსიკონები შეიძლება დაგჭირდეთ ზოგიერთი მნიშვნელოვანი სიტყვისთვის, როგორიცაა ადამიანებისა და ადგილების სახელები.

მონაცემთა ჩანაცვლება: მონაცემთა ჩანაცვლება მსგავსია null და შემთხვევითი მნიშვნელობების შენიღბვისა, გარდა იმისა, რომ სპეციალური სიმბოლოების ან შემთხვევითი მნიშვნელობების გამოყენების ნაცვლად, ნიღბიანი მონაცემები შეიცვლება კონკრეტული მნიშვნელობით.

სიმეტრიული დაშიფვრა: სიმეტრიული დაშიფვრა არის სპეციალური შექცევადი ნიღბის მეთოდი. ის შიფრავს მგრძნობიარე მონაცემებს დაშიფვრის გასაღებებისა და ალგორითმების მეშვეობით. შიფრული ტექსტის ფორმატი შეესაბამება ორიგინალურ მონაცემებს ლოგიკურ წესებში.

საშუალო: საშუალო სქემა ხშირად გამოიყენება სტატისტიკურ სცენარებში. რიცხვითი მონაცემებისთვის ჩვენ ჯერ ვიანგარიშებთ მათ საშუალოს, შემდეგ კი შემთხვევით ვანაწილებთ დესენსიბილიზებულ მნიშვნელობებს საშუალოზე, რითაც ვინარჩუნებთ მონაცემთა ჯამს მუდმივ.

ოფსეტი და დამრგვალება: ეს მეთოდი ცვლის ციფრულ მონაცემებს შემთხვევითი გადანაცვლებით. ოფსეტური დამრგვალება უზრუნველყოფს დიაპაზონის მიახლოებით ავთენტურობას მონაცემთა უსაფრთხოების შენარჩუნებისას, რაც უფრო ახლოსაა რეალურ მონაცემებთან, ვიდრე წინა სქემები და აქვს დიდი მნიშვნელობა დიდი მონაცემთა ანალიზის სცენარში.

ML-NPB-5660-数据脱敏

რეკომენდირებული მოდელი"ML-NPB-5660"მონაცემთა ნიღბისთვის

4. ხშირად გამოყენებული მონაცემთა ნიღბის ტექნიკა

(1). სტატისტიკური ტექნიკა

მონაცემთა შერჩევა და მონაცემთა აგრეგაცია

- მონაცემთა შერჩევა: ორიგინალური მონაცემთა ნაკრების ანალიზი და შეფასება მონაცემთა ნაკრების წარმომადგენლობითი ქვეჯგუფის შერჩევით მნიშვნელოვანი მეთოდია დეიდენტიფიკაციის ტექნიკის ეფექტურობის გასაუმჯობესებლად.

- მონაცემთა აგრეგაცია: როგორც სტატისტიკური ტექნიკის ერთობლიობა (როგორიცაა შეჯამება, დათვლა, საშუალო დადგენა, მაქსიმუმი და მინიმალური), რომელიც გამოიყენება მიკრომონაცემების ატრიბუტებზე, შედეგი არის ორიგინალური მონაცემთა ნაკრების ყველა ჩანაწერის წარმომადგენელი.

(2). კრიპტოგრაფია

კრიპტოგრაფია არის გავრცელებული მეთოდი დესენსიბილიზაციის ან დესენსიბილიზაციის ეფექტურობის გასაძლიერებლად. დაშიფვრის ალგორითმების სხვადასხვა ტიპს შეუძლია მიაღწიოს სხვადასხვა დესენსიბილიზაციის ეფექტს.

- დეტერმინისტული დაშიფვრა: არა შემთხვევითი სიმეტრიული დაშიფვრა. ის ჩვეულებრივ ამუშავებს ID მონაცემებს და საჭიროების შემთხვევაში შეუძლია დაშიფვრა და აღადგინოს შიფრული ტექსტი თავდაპირველ ID-მდე, მაგრამ გასაღები სათანადოდ უნდა იყოს დაცული.

- შეუქცევადი დაშიფვრა: ჰეშის ფუნქცია გამოიყენება მონაცემთა დასამუშავებლად, რომელიც ჩვეულებრივ გამოიყენება ID მონაცემებისთვის. მისი პირდაპირ გაშიფვრა შეუძლებელია და რუკების ურთიერთობა უნდა იყოს შენახული. გარდა ამისა, ჰეშის ფუნქციის ფუნქციის გამო, შეიძლება მოხდეს მონაცემთა შეჯახება.

- ჰომორფული დაშიფვრა: გამოიყენება შიფრული ტექსტის ჰომორფული ალგორითმი. მისი მახასიათებელია ის, რომ დაშიფრული ტექსტის მოქმედების შედეგი იგივეა, რაც გაშიფვრის შემდეგ უბრალო ტექსტის მოქმედების შედეგი. ამიტომ, ის ჩვეულებრივ გამოიყენება რიცხვითი ველების დასამუშავებლად, მაგრამ ფართოდ არ გამოიყენება შესრულების მიზეზების გამო.

(3). სისტემის ტექნოლოგია

ჩახშობის ტექნოლოგია შლის ან იცავს მონაცემთა ელემენტებს, რომლებიც არ შეესაბამება კონფიდენციალურობის დაცვას, მაგრამ არ აქვეყნებს მათ.

- შენიღბვა: ეს ეხება ყველაზე გავრცელებულ დესენსიბილიზაციის მეთოდს ატრიბუტის მნიშვნელობის დასაფარად, როგორიცაა მოწინააღმდეგის ნომერი, ID ბარათი მონიშნულია ვარსკვლავით, ან მისამართი შეკვეცილია.

- ლოკალური ჩახშობა: ეხება სპეციფიკური ატრიბუტების მნიშვნელობების (სვეტების) წაშლის პროცესს, მონაცემთა არაარსებითი ველების წაშლის პროცესს;

- ჩანაწერების ჩახშობა: ეხება კონკრეტული ჩანაწერების (სტრიქონების) წაშლის პროცესს, არაარსებითი მონაცემების ჩანაწერების წაშლას.

(4). ფსევდონიმი ტექნიკა

ფსევდომანინგი არის დეიდენტიფიკაციის ტექნიკა, რომელიც იყენებს ფსევდონიმს პირდაპირი იდენტიფიკატორის (ან სხვა მგრძნობიარე იდენტიფიკატორის) ჩასანაცვლებლად. ფსევდონიმების ტექნიკა ქმნის უნიკალურ იდენტიფიკატორებს თითოეული ინდივიდუალური ინფორმაციის სუბიექტისთვის, პირდაპირი ან მგრძნობიარე იდენტიფიკატორების ნაცვლად.

- მას შეუძლია დამოუკიდებლად წარმოქმნას შემთხვევითი მნიშვნელობები, რათა შეესაბამებოდეს ორიგინალურ ID-ს, შეინახოს რუკების ცხრილი და მკაცრად გააკონტროლოს წვდომა რუკების ცხრილში.

- თქვენ ასევე შეგიძლიათ გამოიყენოთ დაშიფვრა ფსევდონიმების შესაქმნელად, მაგრამ საჭიროა სწორად შეინახოთ გაშიფვრის გასაღები;

ეს ტექნოლოგია ფართოდ გამოიყენება მონაცემთა დიდი რაოდენობის დამოუკიდებელი მომხმარებლების შემთხვევაში, როგორიცაა OpenID ღია პლატფორმის სცენარში, სადაც სხვადასხვა დეველოპერები იღებენ სხვადასხვა Openid-ებს ერთი და იმავე მომხმარებლისთვის.

(5). განზოგადების ტექნიკა

განზოგადების ტექნიკა ეხება დეიდენტიფიკაციის ტექნიკას, რომელიც ამცირებს შერჩეული ატრიბუტების მარცვლიანობას მონაცემთა ნაკრებში და უზრუნველყოფს მონაცემთა უფრო ზოგად და აბსტრაქტულ აღწერას. განზოგადების ტექნოლოგია მარტივი გამოსაყენებელია და შეუძლია დაიცვას ჩანაწერის დონის მონაცემების ავთენტურობა. ის ჩვეულებრივ გამოიყენება მონაცემთა პროდუქტებში ან მონაცემთა ანგარიშებში.

- დამრგვალება: მოიცავს არჩეული ატრიბუტისთვის დამრგვალების ბაზის არჩევას, როგორიცაა ზევით ან ქვევით კრიმინალისტიკა, რომელიც იძლევა შედეგებს 100, 500, 1K და 10K

- ზედა და ქვედა კოდირების ტექნიკა: შეცვალეთ მნიშვნელობები ზღურბლის ზემოთ (ან ქვემოთ) ზღვრით, რომელიც წარმოადგენს ზედა (ან ქვედა) დონეს, რაც იძლევა შედეგს "X ზემოთ" ან "X ქვემოთ"

(6). რანდომიზაციის ტექნიკა

როგორც ერთგვარი დეიდენტიფიკაციის ტექნიკა, რანდომიზაციის ტექნოლოგია გულისხმობს ატრიბუტის მნიშვნელობის შეცვლას რანდომიზაციის გზით, ისე, რომ რანდომიზაციის შემდეგ მნიშვნელობა განსხვავდება ორიგინალური რეალური მნიშვნელობისაგან. ეს პროცესი ამცირებს თავდამსხმელის უნარს გამოიტანოს ატრიბუტის მნიშვნელობა სხვა ატრიბუტების მნიშვნელობებიდან იმავე მონაცემთა ჩანაწერში, მაგრამ გავლენას ახდენს მიღებული მონაცემების ავთენტურობაზე, რაც საერთოა წარმოების ტესტის მონაცემებთან.


გამოქვეყნების დრო: სექ-27-2022