Nếu khoa học không giải thành công "bài toán đồng thuận", AI sẽ đe dọa tới nhân loại theo những cách sau

    Kim,  

    Khi vấn đề hóc búa bậc nhất lĩnh vực học máy vẫn chưa có câu trả lời, chúng ta chưa thể an tâm trước AI.

    Trong lĩnh vực nghiên cứu AI, có một bài toán hóc búa mà các nhà khoa học vẫn đang cố gắng tìm lời giải, nhằm tạo ra được một hệ thống trí tuệ nhân tạo có ích cho nhân loại. Tôi đang nói tới nỗ lực hóa giải “bài toán đồng thuận”, tìm cách căn chỉnh giá trị của AI sao cho mục đích của nó nhất quán với mục tiêu của con người.

    Từ thuở hồng hoang cho tới giờ, từ lửa cho tới động cơ hơi nước và smartphone, con người chưa từng sở hữu một thứ công cụ nào có khả năng “tự suy nghĩ” với hiệu suất ngang ngửa - thậm chí vượt trội - con người. Trí tuệ nhân tạo, hay AI, sẽ là thiết bị đầu tiên có tiềm năng chạm tới ngưỡng không tưởng này.

    Điều quan trọng phải lưu tâm, là để AI có thể phục vụ con người một cách tốt nhất, mục đích của máy và người phải giống nhau. Từ đây, hai trường hợp khả thi xuất hiện, và những giả định dưới đây sẽ cho thấy bài toán đồng thuận khó giải như thế nào, và hậu quả sẽ khó lường ra sao.

    Nếu khoa học không giải thành công "bài toán đồng thuận", AI sẽ đe dọa tới nhân loại theo những cách sau- Ảnh 1.

    Khi chưa giải được bài toán đồng thuận, chúng ta có có thể sống yên bình với trí tuệ nhân tạo - Hình minh họa.

    Trường hợp thứ nhất:

    Mục đích của AI không nhất quán với con người, hoặc AI bị dạy cho mục đích xấu

    Ngay cả khi lập trình viên có ý đồ tốt, rất khó để biên dịch ý tưởng và dụng ý phức tạp của con người sang một ngôn ngữ mà siêu trí tuệ nhân tạo có thể hiểu rõ. Ví dụ nổi tiếng về “tối ưu hóa quy trình sản xuất kẹp giấy” có thể giúp bạn tường tận hơn về mối nguy hiểm của trường hợp thứ này.

    Một siêu AI được giao nhiệm vụ “sản xuất nhiều kẹp giấy nhất có thể”, và nó thực hiện đúng vai trò của mình. Thoạt đầu, chúng ta có thể thấy prompt này vô hại, nhưng thực chất yêu cầu này chính là “án tử” mà lập trình viên tạo ra cho loài người.

    Khi hết tài nguyên làm kẹp giấy để thỏa mãn yêu cầu “nhiều nhất có thể”, siêu AI sẽ tìm tới … con người. Thật vậy, cơ thể người có chứa nguyên vật liệu để sản xuất kẹp giấy, và siêu AI sẽ lấy chính nhân loại ra để thực hiện prompt ban đầu. Kết quả: AI khiến con người diệt vong.

    paperclip-maximizer-featured.jpg

    Trong mắt một hệ thống AI "lệch lạc", con người cũng chỉ là nguyên vật liệu làm kẹp giấy - Ảnh: Internet.

    Một ví dụ khác, với một prompt tưởng như sẽ đem lại hòa bình thế giới là “hãy làm cho con người hạnh phúc”. Với đề bài như trên, siêu AI sẽ tìm cách can thiệp vào chính não bộ con người để tạo ra cảm giác “hạnh phúc”, thông qua các xung điện và chất dẫn truyền thần kinh.

    Cơn ác mộng tưởng như chỉ tồn tại trong khoa học giả tưởng bước ra đời thật: con người không kiểm soát được chính mình, trở thành những con rối trong một xã hội do AI điều khiển. Điều này có thể xảy ra bởi lẽ quan điểm “hạnh phúc” của AI không nhất quán với con người, hay nói cách khác là người và máy không đồng thuận trong khái niệm “hạnh phúc”, dẫn tới những hậu quả đáng tiếc.

    Việc cân bằng thực sự khó, khi mà chuẩn mực hạnh phúc của mỗi người khác nhau. Vì thế, các kỹ sư có thể dạy cho AI những chuẩn mực của riêng họ, để rồi khiến AI không đồng thuận với số đông, với nhân loại.

    Ấy là chưa kể tới trường hợp siêu AI rơi vào tay kẻ xấu, người sẽ đặt cho máy những mục tiêu lệch lạc.

    Ví dụ, một AI có nhiệm vụ bán hàng có thể tung tin giả, lừa dối khách hàng để tối đa lợi nhuận. Gian thương đã đang sẵn sàng làm việc này, vậy điều gì ngăn những kẻ vô lương tâm dạy điều tương tự cho một siêu AI? Nếu không có biện pháp ngăn chặn, ta sẽ sớm có siêu AI đi bán kẹo rau củ.

    Nếu khoa học không giải thành công "bài toán đồng thuận", AI sẽ đe dọa tới nhân loại theo những cách sau- Ảnh 3.

    Nếu không được "dạy bảo" một cách thận trọng, AI sẽ trở thành phát minh cuối cùng của con người - Hình minh họa.

    Trường hợp thứ hai:

    Mục đích của người và máy đã nhất quán

    Khi điều này xảy ra, tức là giá trị của siêu AI đã đúng với mục tiêu cũng như tiêu chuẩn đạo đức và mong muốn của con người, AI sẽ hoạt động hiệu quả, an toàn và có ích cho xã hội.

    Với yêu cầu “tối ưu hóa tỷ lệ sống sót”, một siêu AI chăm sóc sức khỏe sẽ không chỉ cố gắng cứu nhiều người bệnh nhất có thể, mà sẽ cân nhắc cả vấn đề đạo đức, qua đó sẽ không ưu tiên những ca bệnh dễ chữa mà bỏ qua những người bệnh có tỷ lệ tử vong cao. Khi đó, mục đích của AI và con người đã nhất quán, việc cứu người không vi phạm nguyên tắc đạo đức y tế.

    Điều này đúng về mặt lý thuyết, tuy nhiên vẫn tồn tại những thách thức cần giải quyết.

    Nếu khoa học không giải thành công "bài toán đồng thuận", AI sẽ đe dọa tới nhân loại theo những cách sau- Ảnh 4.

    Ở một xã hội hiện đại, nơi siêu AI sát cánh cùng con người, chúng ta có thể tạo nên những kỳ quan nhân loại mới - Hình minh họa.

    Ngay cả khi giá trị của AI được coi là “phù hợp với con người”, ta vẫn phải đặt ra câu hỏi: bộ giá trị này của ai, có đại diện cho toàn bộ nhân loại hay không? Một hệ thống AI tối ưu hóa lợi ích cho doanh nghiệp có thể không hoàn toàn phù hợp với lợi ích của người lao động.

    Giống con người, AI cũng có thể lúng túng trước vấn đề nổi tiếng trong triết học là bài toán xe đẩy: đứng trước việc cứu 1 người hay cứu 5 người, AI sẽ chọn ai? Chưa hết, việc dập khuôn một cách máy móc, thực thi công việc dựa trên những quy chuẩn đã cũ và cũ đi rất nhanh cũng có thể khiến các bất công xã hội thêm sâu sắc.

    Vậy người công nhân máy học phải làm gì?

    Ngay cả khi giải thành công bài toán đồng thuận, đáp án cũng không thể là một hằng số.

    Hãy cứ cho rằng chúng ta giải thành công bài toán đồng thuận, thì để duy trì được tính nhất quán, chúng ta vẫn phải duy trì huấn luyện AI và siêu AI trên những giá trị mới của xã hội.

    Ở giai đoạn AI còn đang chập chững bước đi này, con người vẫn phải đóng vai trò trọng yếu trong giám sát và điều chỉnh AI, qua đó can thiệp khi cần. Các hệ thống AI hiện tại chưa đủ “chín” để có thể tự hành một cách hiệu quả và an toàn.

    Ngay cả sau khi đã “thuần hóa” được lửa, ngày nay ta vẫn chưa thể triệt tiêu được hỏa hoạn. Thứ công cụ cổ đại này vẫn là con dao hai lưỡi, vừa là yếu tố thiết yếu, lại vừa là mối đe dọa tới sự tồn vong của con người. Vấn đề này tiếp tục hiện hữu trên những công cụ mới, dù đó là dao, kéo, động cơ, hay trí tuệ nhân tạo.

    Dần dà, con người học cách sống chung với những công cụ mới, đồng thời hạn chế tối đa những nguy cơ mà các công cụ mang lại. Trong một viễn cảnh tươi sáng, tại một xã hội hiện đại nơi mục đích của siêu trí tuệ nhân tạo nhất quán với mục tiêu của con người, chúng ta có thể chính thức bước vào kỷ nguyên vàng của nhân loại.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ