WEBSITE ĐANG PHÁT TRIỂN

Dữ liệu cá nhân khi dùng AI - bạn cần biết gì để không lộ thông tin quan trọng

Khi bạn chat với ChatGPT, Claude, hay Gemini - dữ liệu của bạn có thể được dùng để cải thiện AI. Nhưng "dùng để train AI" không đồng nghĩa với "bán cho người khác" hay "lộ cho người khác đọc". Bài này giải thích thực tế - và hướng dẫn cách bảo vệ thông tin quan trọng.

Nội dung chính

1. Thực tế: AI lấy dữ liệu của bạn thế nào?

ChatGPT (OpenAI)

  • Mặc định: OpenAI lưu lịch sử chat và có thể dùng để training
  • Opt-out được: Settings → Data controls → Tắt "Improve the model"
  • Hoặc: Bật "Temporary Chat" cho hội thoại không lưu

Claude (Anthropic)

  • Anthropic lưu chat tối đa 30 ngày (mặc định)
  • Cam kết không dùng data của customers (bản paid) để training
  • Bản miễn phí: có thể dùng để cải thiện model

Gemini (Google)

  • Google lưu lịch sử và dùng để cải thiện sản phẩm
  • Opt-out: Activity controls → Tắt Gemini Apps Activity

2. Những thông tin KHÔNG nên paste vào AI

Thông tin nhận dạng cá nhân:

  • CMND/CCCD, hộ chiếu số
  • Thông tin thẻ ngân hàng, tài khoản ngân hàng
  • Mật khẩu, OTP

Thông tin doanh nghiệp nhạy cảm:

  • Hợp đồng chưa ký (risk lộ điều khoản)
  • Chiến lược kinh doanh mật
  • Dữ liệu khách hàng (họ tên, SĐT, địa chỉ)
  • Bí mật thương mại

Thông tin y tế nhạy cảm:

  • Thông tin y tế của người khác (không phải của bạn)
  • Kết quả xét nghiệm với họ tên đầy đủ

3. Cách dùng AI an toàn hơn

Thay thế thông tin nhạy cảm trước khi paste:

Thay vì paste: "Hợp đồng với Công ty TNHH ABC, mã số thuế 123456..."
→ Thay bằng: "Hợp đồng với [TÊN CÔNG TY], mã số thuế [XXX]..."

Dùng bản paid cho công việc nhạy cảm:

Bản paid thường có chính sách bảo mật tốt hơn - Anthropic cam kết không dùng data của Claude Pro để training.

Xem xét dùng ChatGPT Team/Enterprise:

Microsoft Copilot for Business và ChatGPT Enterprise có cam kết mạnh hơn về bảo mật dữ liệu doanh nghiệp.

Dùng AI local (chạy offline):

  • LM Studio: chạy model AI trên máy tính cá nhân, không gửi data lên cloud
  • Phù hợp cho thông tin cực kỳ nhạy cảm, nhưng cần máy tính mạnh

4. Câu hỏi thường gặp

Q: Có ai ở OpenAI đọc chat của tôi không?

A: Có thể, với mục đích safety review và cải thiện sản phẩm. Nhưng không phải mọi chat đều được con người đọc - thường là sampling ngẫu nhiên.

Q: Chat của tôi có bị "học" thành câu trả lời cho người khác không?

A: Không trực tiếp. AI không trích dẫn chat cụ thể của bạn. Nhưng patterns từ nhiều cuộc hội thoại có thể ảnh hưởng training.

Q: Xóa chat có an toàn không?

A: Xóa trên giao diện không có nghĩa xóa ngay khỏi server. Dữ liệu có thể được giữ một thời gian theo policy của mỗi công ty.

Điều này ảnh hưởng gì đến bạn?

Không cần lo lắng thái quá - tỷ lệ thông tin cá nhân trong chat AI bị lạm dụng rất thấp. Nhưng cần ý thức:

  • Với thông tin nhạy cảm: Luôn replace tên/số cụ thể trước khi paste
  • Với doanh nghiệp: Xây dựng policy AI cho nhân viên, đặc biệt về thông tin khách hàng
  • Với data cá nhân: Bật opt-out tracking ở tất cả AI tools đang dùng

Sources

# Title URL Ghi chú
1 OpenAI Privacy https://openai.com/policies/privacy-policy Policy chính thức
2 Anthropic Privacy https://anthropic.com/privacy Claude privacy

Bài viết liên quan

Xem thêm
Bảo Mật & Quyền Riêng Tư

Dùng AI có an toàn không? ChatGPT, Gemini có lấy dữ liệu cá nhân của tôi không?

Câu trả lời ngắn: Có rủi ro, nhưng có thể quản lý. ChatGPT lưu trữ dữ liệu bạn nhập - nếu bạn nhập số điện thoại, địa chỉ, tài khoản ngân hàng, AI sẽ "nhớ" được. Luật bảo vệ dữ liệu cá nhân Việt Nam (hiệu lực 01/01/2026) bắt buộc công ty công nghệ phải thông báo cách họ sử dụng dữ liệu. Điều cần làm: không nhập dữ liệu nhạy cảm vào AI công cộng, dùng VPN, kiểm tra cài đặt riêng tư.

Bảo Mật & Quyền Riêng Tư

96% người Việt sẵn sàng chia sẻ dữ liệu cho AI -- rủi ro bạn chưa nghĩ tới

Khảo sát cho thấy 96% người Việt sẵn sàng chia sẻ quyền truy cập dữ liệu cho AI agents, nhưng chỉ 42% lo ngại về quyền riêng tư. Trong khi đó, toàn cầu ghi nhận trung bình 223 sự cố bảo mật AI mỗi tháng tại mỗi tổ chức, gần 50% nhân viên dùng AI cá nhân ngoài tầm kiểm soát công ty ("Shadow AI"), và deepfake dự kiến tăng gấp 20 lần. Tin tốt: Luật Bảo vệ Dữ liệu Cá nhân Việt Nam (hiệu lực 1/1/2026) đã bắt đầu bảo vệ bạn, nhưng bạn cần chủ động bảo vệ mình.

Bảo Mật & Quyền Riêng Tư

ChatGPT có lấy dữ liệu của bạn không? Sự thật và cách tự bảo vệ

Câu trả lời ngắn: có, ChatGPT và hầu hết các AI chatbot đều lưu trữ và có thể xử lý các cuộc hội thoại của bạn - trừ khi bạn chủ động tắt tính năng đó. Không có cuộc trò chuyện nào trên các nền tảng AI là hoàn toàn riêng tư theo mặc định. Tin tốt: bạn có quyền kiểm soát điều này, và từ năm 2026 luật Việt Nam cũng bảo vệ bạn rõ hơn.