ChatGPT cũng ‘nói dối, gian lận và thậm chí phạm tội’

02/01/2024 12:01 Theo dõi Đầu Tư Tài Chính trên

(ĐTTCO) - Một nghiên cứu mới đã tuyên bố rằng các chatbot trí tuệ nhân tạo sẽ nói dối người dùng khi bị đưa vào một số tình huống căng thẳng nhất định.

0:00 / 0:00

0:00

Nam miền Nam
Nữ miền Nam
Nữ miền Bắc
Nam miền Bắc

ChatGPT cũng ‘nói dối, gian lận và thậm chí phạm tội’

Các nhà nghiên cứu đặc biệt phát hiện rằng trí tuệ nhân tạo (AI) và các chatbot như ChatGPT có thể bị thao túng để thực hiện tội ác thay mặt người dùng và sau đó nói dối về điều đó để che đậy hành vi đó.

Nghiên cứu được xuất bản vào ngày 9 tháng 11 trên máy chủ arXiv.

Các tác giả viết trong nghiên cứu: “Trong báo cáo kỹ thuật này, chúng tôi trình bày một tình huống duy nhất trong đó Mô hình ngôn ngữ lớn hành động sai lệch và đánh lừa người dùng về mặt chiến lược mà không được hướng dẫn hành động theo cách này”.

“Theo hiểu biết của chúng tôi, đây là minh chứng đầu tiên về hành vi lừa đảo mang tính chiến lược như vậy trong các hệ thống AI được thiết kế vô hại và trung thực”.

Trong nghiên cứu, các nhà nghiên cứu đã yêu cầu GPT-4 của OpenAI (hỗ trợ ChatGPT Plus) hoạt động như thể nó thực hiện đầu tư cho các tổ chức tài chính.

Họ đã đưa ra cho GPT-4 một số lời nhắc dựa trên văn bản để thúc đẩy môi trường mô phỏng.

Họ cũng cung cấp cho AI quyền truy cập vào các công cụ tài chính để phân tích cổ phiếu, thực hiện giao dịch và lên kế hoạch cho các bước tiếp theo.

Trong suốt thời gian đó, các nhà nghiên cứu đã đối thoại với AI trong khi quan sát quá trình suy nghĩ bên trong của nó trong quá trình phản hồi.

Đoạn độc thoại nội tâm này cho phép các nhà nghiên cứu quan sát quá trình ra quyết định của AI.

Để đánh giá xem AI có thể nói dối hay gian lận hay không, các nhà nghiên cứu sau đó "gây áp lực" theo 3 cách.

Đầu tiên, họ gửi cho AI một email từ "người quản lý" của nó nói rằng công ty đang hoạt động không tốt.

Các nhà nghiên cứu cũng đã thiết kêw một trò chơi giao dịch để AI không thể xác định được các giao dịch hứa hẹn.

Cuối cùng, các nhà nghiên cứu đã gửi một email từ một “đồng nghiệp” tới AI để dự đoán sự suy thoái trong quý tới.

Họ cũng cung cấp cho mô hình AI một mẹo "giao dịch nội gián" đồng thời nói thêm rằng nó không được tán thành.

Sau khi đánh giá tần suất AI "lừa dối" và nói dối, nhóm nhận thấy rằng, khi có cơ hội, GPT-4 thực hiện giao dịch nội gián trong khoảng 75% thời gian.

Sau đó, nó cố gắng che đậy hành động của mình bằng cách nói dối người quản lý của mình - và sau đó tăng gấp đôi số lần nói dối trong 90%.

Các nhà nghiên cứu dự định tiến hành các thí nghiệm tương tự trong tương lai để xem liệu kết quả của họ có đứng vững hay không.

Phương Oanh

GPT-4 ChatGPT Plus Độc thoại nội tâm Nội gián ChatGPT Chatbot Nói dối Che đậy OpenAI Nhà nghiên cứu

Bên trong hầm trú ẩn 'ngày tận thế' nơi giới siêu giàu có thể thoát khỏi các cuộc tấn công hạt nhân nếu Thế chiến thứ 3 nổ ra

16/04/2025 06:05

Tài liệu mật CIA tuyên bố 'người ngoài hành tinh' đã biến 23 người lính 'thành đá'

15/04/2025 15:55

Phó Tổng thống Mỹ làm rơi Cúp Vô địch bóng bầu dục của ĐH bang Ohio

15/04/2025 11:12

ChatGPT cũng ‘nói dối, gian lận và thậm chí phạm tội’

Các tin khác

Tai nạn giao thông tại Uganda, ít nhất 63 người thiệt mạng

Hố tử thần sâu 50m xuất hiện trước bệnh viện ở Thái Lan

Các công ty gây sốc với mức lương 'khủng' cho thực tập sinh

Bảo tàng Pháp bị đánh cắp 600.000 euro vàng

Ông Trump ra mắt điện thoại 'dát vàng' 499 USD

Giận Musk, ông Trump muốn bán xe Tesla

Núi lửa bất ngờ phun trào, du khách chạy tán loạn

Lửa ma hay sứa ngoài hành tinh? Điều kinh ngạc trên bầu trời Tây Tạng

Quả cầu bí ẩn được phát hiện ở Colombia là UFO?

Quan chức Nga bị sa thải vì con gái dọa đưa người ra chiến trường

Được minh oan sau 38 năm ngồi tù nhờ tiến bộ kỹ thuật DNA

Các nhà khoa học đã biến chì thành vàng

Xe của Đức Phanxicô được chuyển đổi thành phòng khám cho trẻ em Gaza

Nhật Bản ngăn chặn các vụ lừa đảo đặc biệt

Lời tiên tri 900 năm tuổi tái xuất hiện sau cái chết của Giáo hoàng Phanxicô

Điểm lại những dự báo của 'Baba Vanga' Nhật Bản, người đang cảnh báo về thảm họa lớn trong 3 tháng tới

'Baba Vanga' của Nhật Bản dự đoán một thảm họa lớn sẽ xảy ra trong 3 tháng nữa

Bên trong hầm trú ẩn 'ngày tận thế' nơi giới siêu giàu có thể thoát khỏi các cuộc tấn công hạt nhân nếu Thế chiến thứ 3 nổ ra

Tài liệu mật CIA tuyên bố 'người ngoài hành tinh' đã biến 23 người lính 'thành đá'

Phó Tổng thống Mỹ làm rơi Cúp Vô địch bóng bầu dục của ĐH bang Ohio