Ghi nhãn dữ liệu
Một cuộc điều tra của tạp chí TIME đã tiết lộ rằng để xây dựng một hệ thống an toàn chống lại nội dung độc hại (ví dụ: lạm dụng tình dục, bạo lực, phân biệt chủng tộc, phân biệt giới tính, v.v.), OpenAI đã sử dụng lao động thuê ngoài người Kenya với mức lương dưới 2 đô la một giờ để gắn nhãn nội dung độc hại. Những nhãn này được sử dụng để huấn luyện một mô hình nhằm phát hiện nội dung tương tự trong tương lai. Những người lao động thuê ngoài này đã phải tiếp xúc với những nội dung độc hại và nguy hiểm đến mức họ mô tả trải nghiệm đó là "tra tấn". Đối tác thuê ngoài của OpenAI là Sama, một công ty cung cấp dữ liệu huấn luyện có trụ sở tại San Francisco, California.
Phá vỡ nhà tù
ChatGPT cố gắng từ chối các yêu cầu có thể vi phạm chính sách nội dung của nó. Tuy nhiên, một số người dùng đã tìm cách bẻ khóa ChatGPT bằng cách sử dụng nhiều kỹ thuật lập trình yêu cầu khác nhau để vượt qua các hạn chế này vào đầu tháng 12 năm 2022 và đã thành công trong việc lừa ChatGPT đưa ra hướng dẫn cách tạo bom xăng hoặc bom hạt nhân, hoặc tạo ra các lập luận theo phong cách tân phát xít. Một phóng viên của tờ Toronto Star đã có những thành công cá nhân không đồng đều trong việc khiến ChatGPT đưa ra những tuyên bố gây tranh cãi ngay sau khi ra mắt: ChatGPT đã bị lừa để ủng hộ cuộc xâm lược Ukraine năm 2022 của Nga, nhưng ngay cả khi được yêu cầu tham gia vào một kịch bản hư cấu, ChatGPT vẫn từ chối tạo ra các lập luận về lý do tại sao Thủ tướng Canada Justin Trudeau phạm tội phản quốc. (wiki)
Thời gian đăng bài: 18/02/2023