Luật mới do hai thượng nghị sĩ Mỹ, Mark R. Warner và Josh Hawley, đề xuất đang tìm cách bảo vệ quyền riêng tư bằng cách buộc các công ty công nghệ tiết lộ "giá trị thực sự" của dữ liệu cho người dùng biết.
Cụ thể, những công ty có hơn 100 triệu người dùng sẽ phải cung cấp cho mỗi người dùng một đánh giá về giá trị tài chính của dữ liệu của họ, cũng như tiết lộ doanh thu được tạo ra bằng cách "có được, thu thập, xử lý, bán, sử dụng hoặc chia sẻ dữ liệu người dùng".
Ngoài ra, Đạo luật DASHBOARD này sẽ cung cấp cho người dùng quyền xóa dữ liệu của họ khỏi cơ sở dữ liệu của các công ty.
Những kẻ thu thập dữ liệu
Dữ liệu được thu thập bởi các công ty công nghệ không chỉ bao gồm thông tin nhận dạng truyền thống như tên, tuổi và giới tính. Thay vào đó, như nhà sử học Harvard Rebecca Lemov lưu ý, nó bao gồm cả "các dòng tweet, lượt thích trên Facebook, Twitch, tìm kiếm trên Google, bình luận trực tuyến, mua hàng bằng một cú nhấp chuột, thậm chí việc xem qua một bức ảnh trong dòng feed của bạn".
Nói cách khác, dữ liệu lớn (big data) chứa đựng những khoảnh khắc "trần tục" nhưng thân mật trong đời sống của con người. Và, nếu Facebook nắm bắt được các tương tác của bạn với bạn bè và gia đình, Google biết được những tìm kiếm đêm khuya của bạn, còn Alexa nắm được các mệnh lệnh trong phòng khách của bạn, thì bạn có muốn biết dữ liệu của mình "có giá trị gì và được bán cho ai" như dự luật trên gợi ý không?
Tuy nhiên, việc tính toán giá trị của dữ liệu người dùng không hề đơn giản. Những ước tính về dữ liệu người dùng có giá trị gì thì khác nhau rất nhiều, từ mức chưa tới 1 USD cho người dùng bình thường đến 100 USD cho một người dùng Facebook. Một người dùng từng bán dữ liệu của mình với giá 2.733 USD trên Kickstarter. Để đạt được con số này, anh ta đã phải chia sẻ cả những dữ liệu như các tổ hợp phím, những chuyển động của con chuột và ảnh chụp màn hình thường xuyên.
Đáng buồn thay, Đạo luật DASHBOARD không chỉ định cách ước tính giá trị của dữ liệu người dùng. Thay vào đó, nó giải thích rằng Ủy ban chứng khoán và giao dịch - một cơ quan chính phủ liên bang độc lập - sẽ "phát triển một phương pháp hoặc những phương pháp để tính toán giá trị của dữ liệu người dùng". Đây chắc chắn là một công việc đầy thách thức.
Hơn cả chuyện cá nhân
Luật đề xuất trên nhằm mục đích cung cấp cho người dùng nhiều sự minh bạch hơn. Tuy nhiên, quyền riêng tư giờ đây không chỉ là vấn đề của dữ liệu cá nhân. Dữ liệu được chia sẻ bởi một số ít người có thể cung cấp "sự nhìn thấu" về cuộc sống của nhiều người.
Chẳng hạn, những lượt thích trên Facebook có thể giúp dự đoán xu hướng tình dục của người dùng với độ chính xác cao. Target đã sử dụng dữ liệu mua hàng mà họ có được để dự đoán khách hàng nào đang... mang thai, trong đó có một trường hợp đã thu hút được sự chú ý rộng rãi sau khi nhà bán lẻ này phát hiện ra một cô gái tuổi teen đang mang thai trước cả bố của cô bé.
Khả năng dự đoán như vậy có nghĩa là thông tin riêng tư không chỉ được chứa trong dữ liệu người dùng. Các công ty cũng có thể suy ra thông tin cá nhân của bạn, dựa trên mối tương quan mang tính thống kê trong dữ liệu của một số người dùng. Làm sao mà giá trị của những dữ liệu như thế có thể giảm xuống... 1 USD?
Ngoài ra, khả năng sử dụng phân tích thống kê này để xác định những người thuộc nhóm nào có thể mang những ý nghĩa riêng tư sâu rộng hơn. Nếu các nhà cung cấp dịch vụ có thể sử dụng những phân tích mang tính dự đoán để đoán xu hướng tính dục, chủng tộc, giới tính và tôn giáo của người dùng, thì làm sao ngăn họ có sự phân biệt đối xử dựa trên cơ sở đó?
Một khi đã được đưa vào vận hành, các công nghệ dự đoán sẽ tiếp tục hoạt động ngay cả khi người dùng xóa một phần dữ liệu đã giúp tạo ra chúng.
Kiểm soát thông qua dữ liệu
Độ nhạy cảm của dữ liệu không chỉ phụ thuộc vào những gì nó chứa đựng, mà còn phụ thuộc vào cách chính phủ và các công ty có thể sử dụng nó để gây ảnh hưởng.
Điều này thể hiện rõ ở hệ thống tín dụng xã hội theo kế hoạch của Trung Quốc. Chính phủ Trung Quốc có kế hoạch sử dụng cơ sở dữ liệu quốc gia và "việc xếp hạng độ tin cậy" để quản lý hành vi của công dân Trung Quốc.
"Chủ nghĩa tư bản giám sát" của Google, Amazon, và Facebook, như tác giả Shoshana Zuboff đã lập luận, cũng sử dụng dữ liệu mang tính dự đoán để "điều chỉnh và hướng hành vi của chúng ta tới những kết quả có thể mang lại lợi nhuận nhiều nhất".
Vào năm 2014, những tiết lộ về cách Facebook thử nghiệm với những dòng feed của họ để tác động đến trạng thái cảm xúc của người dùng đã kết thúc trong sự phản đối công khai. Tuy nhiên, trường hợp này làm cho thấy được cách mà các nền tảng kỹ thuật số nói chung có thể sử dụng dữ liệu để giữ cho người dùng tham gia "cuộc chơi" và, trong quá trình đó lại tạo ra nhiều dữ liệu hơn nữa.
Ai bị tổn hại?
Sự thật là việc thu thập, phân tích và xử lý dữ liệu, với tất cả ý nghĩa riêng tư của nó, không ảnh hưởng đến tất cả mọi người như nhau.
Những thiên vị và phân biệt đối xử do dữ liệu lớn (big data) tiếp tục tạo ra sự bất bình đẳng xoay quanh giới tính, chủng tộc và giai cấp. Phụ nữ, các nhóm dân tộc thiểu số và người nghèo về tài chính bị ảnh hưởng mạnh mẽ nhất. Chẳng hạn, giáo sư Safiya Umoja Noble của UCLA đã chỉ ra cách xếp hạng tìm kiếm của Google làm tăng thêm những định kiến tiêu cực về phụ nữ da màu.
Trong bối cảnh bất bình đẳng như vậy, làm sao mà một con số cụ thể có thể đo nổi giá trị "thực sự" của dữ liệu người dùng?