Ngày nay, chúng ta thấy dữ liệu từ nhiều nguồn khác nhau và vấn đề cuối cùng là đảm bảo tính bảo mật và quyền riêng tư của nó.
Điều này không chỉ bao gồm các tập dữ liệu lớn do các tổ chức nắm giữ mà còn bao gồm các mô hình AI / ML, thuật toán và cuối cùng là dữ liệu với các phép chiếu.
Khối lượng dữ liệu ngày càng tăng khi số lượng các công ty sử dụng phương pháp tiếp cận khoa học dữ liệu trong quá trình ra quyết định ngày càng tăng.
Đã có nhiều tổ chức khác nhau được phát hiện trong lĩnh vực mã hóa và bảo mật cho AI / ML và điện toán đám mây, hiện đang cho phép tính toán trên dữ liệu được mã hóa.
Trong thế giới dữ liệu và truyền thông thông tin luôn thay đổi, một trong những vấn đề cấp bách đối với các doanh nghiệp là bảo mật nội dung tệp.
Một số thông tin (email, thông tin đăng nhập) có thể được bảo mật bằng mật khẩu.
Tuy nhiên, thông tin khác được gửi bằng email hoặc FTP không hiệu quả nếu được bảo vệ bằng từ khóa.
Đây là lúc mã hóa tệp phát huy tác dụng, cung cấp sự bảo mật và tiện lợi mà các bên liên quan đến việc chuyển thông tin yêu cầu.
Mã hóa tệp là gì?
Các tệp hoặc hệ thống tệp riêng lẻ được bảo vệ bằng mã hóa tệp, mã hóa chúng bằng một khóa duy nhất và làm cho chúng chỉ khả dụng với chủ khóa.
Mục đích là để ngăn chặn các cá nhân có hại hoặc không được phép truy cập vào các tệp trên ổ cứng.
Hệ điều hành hoặc hệ thống tệp có thể cung cấp hỗ trợ mã hóa tệp. Các tệp nhạy cảm chỉ có thể được truy cập bằng khóa giải mã.
Nếu người dùng phải giao tiếp các tệp riêng lẻ một cách an toàn qua Internet hoặc lưu chúng trên phương tiện di động như thẻ USB, thì mã hóa tệp sẽ rất hữu ích.
Mật mã là thuật ngữ chỉ quá trình mã hóa và giải mã dữ liệu.
Hãy xem cách chúng ta có thể sử dụng Python để mã hóa và giải mã một số dữ liệu của mình. Chúng tôi sẽ sử dụng mã hóa đối xứng, có nghĩa là chúng tôi sẽ mã hóa và giải mã dữ liệu bằng cùng một khóa.
Để đi cùng với hướng dẫn này, chúng tôi sẽ cần Thư viện Python cho mật mã.
Các bước mã hóa và giải mã tệp
Chúng tôi sẽ làm theo các bước dưới đây.
- Cài đặt thư viện
- Bộ dữ liệu
- Tạo khóa
- Đang tải một khóa
- Mã hóa một tập tin
- Giải mã một tập tin
1. Cài đặt thư viện
Vui lòng mở “Command Prompt” (trên Windows) và nhập mã sau để cài đặt chúng:
2. Tập dữ liệu
Chúng tôi sẽ cần một tệp ví dụ để làm việc với để bắt đầu. Đây là một mẫu .csv tập tin bao gồm thông tin về điểm của học sinh.
3. Tạo khóa
Chúng tôi sẽ sử dụng một phương trình đối xứng trong ví dụ của chúng tôi. Fernet là một loại mã hóa được xác thực yêu cầu một “khóa” để đọc và / hoặc thay đổi một tệp. Bây giờ chúng ta sẽ tạo chìa khóa và đặt nó vào cùng một thư mục với tệp dữ liệu của chúng ta:
Nếu bạn truy cập thư mục chứa mã Python của mình, bạn sẽ tìm thấy tệp mykey.key. Tệp chỉ nên có một dòng, là một chuỗi ký tự trong một số trình tự. Bạn có thể xem khóa của tôi bên dưới, nhưng khóa của bạn sẽ khác.
4. Đang tải khóa
Chúng tôi sẽ cần tải khóa mã hóa vào môi trường của mình khi chúng tôi đã tạo ra nó để mã hóa / giải mã các tệp. Bước sau đây khá đơn giản, chỉ yêu cầu mở tệp mykey.key và lưu trữ nó trong bộ nhớ cục bộ:
Khóa mã hóa hiện được lưu cục bộ dưới dạng biến khóa.
5. Mã hóa một tập tin
Chúng tôi sẽ xây dựng một chức năng để sử dụng khóa mã hóa và trả lại tệp đã mã hóa ngay bây giờ mà chúng tôi có tệp cần mã hóa và khóa mã hóa. Chúng tôi lưu trữ đối tượng Fernet dưới dạng một biến cục bộ f khi chúng tôi tạo nó.
Sau đó, chúng tôi đã nhập dữ liệu ban đầu của mình (Grade.csv) vào dữ liệu gốc. Dữ liệu sau đó được mã hóa với đối tượng Fernet và được lưu trữ dưới dạng mã hóa.
Cuối cùng, chúng tôi lưu nó dưới dạng “enc_grades.csv” trong tệp new.csv. Tệp được mã hóa có thể được xem tại đây:
6. Giải mã một tập tin
Bạn sẽ muốn truy cập tệp sau khi đã mã hóa và, ví dụ: đã chuyển thành công tệp sang nơi khác. Thông tin đó hiện ở định dạng được mã hóa.
Bước tiếp theo là khôi phục tài liệu ban đầu bằng cách giải mã nó. Quy trình chúng ta sử dụng bây giờ là nghịch đảo của mã hóa mà chúng ta đã sử dụng trong phần trước.
Chúng tôi sẽ làm theo các bước tương tự như trước đây, nhưng lần này chúng tôi sẽ chuyển từ tệp được mã hóa sang tệp được giải mã:
Cuối cùng, chúng tôi lưu nó dưới dạng “dec_grades.csv” trong tệp new.csv. Tệp được mã hóa có thể được nhìn thấy bên dưới:
Kết luận
Chúng tôi đã học cách mã hóa và giải mã một tệp và dữ liệu chứa bên trong nó bằng cách sử dụng kiểu mã hóa tệp đối xứng trong bài đăng này bằng Python ngôn ngữ lập trình và gói mật mã.
Mã hóa và giải mã tệp là một quá trình đơn giản bằng cách sử dụng thư viện này.
Chúng ta không cần sử dụng phương pháp logic của mình.
Thay vào đó, chúng ta có thể tạo khóa, mã hóa tệp và sau đó giải mã bằng khóa - nó an toàn và đơn giản.
Bình luận