Bí ẩn khiến những ‘ông lớn’ AI mất ngủ

Tú Linh

02/07/2026 10:06

TPO - Họ tạo ra AI mạnh nhất thế giới. Giờ đây, họ đối mặt với bí ẩn mà chính họ cũng không thể giải thích.

Giáo hoàng Leo XIV đón người đồng sáng lập Anthropic Chris Olah tại Vatican ngày 25/5. (Ảnh: AP)

Anthropic, Google và Meta đã tuyển các nhà khoa học máy tính, chuyên gia thần kinh học và triết gia để nghiên cứu điều mà một số người trong ngành lo ngại có thể trở thành cuộc khủng hoảng đạo đức trong tương lai.

Nhà nghiên cứu trí tuệ nhân tạo Cameron Berg tình cờ nhìn thấy Sam Altman tại bữa tiệc năm 2024. Ông lập tức tiến đến để hỏi vị CEO của OpenAI rằng liệu ông có tin công nghệ AI sẽ trở nên có ý thức hay khả năng tự nhận thức hay không.

Vào thời điểm đó, rất ít lãnh đạo công nghệ công khai nói đến khả năng này. Nhưng điều khiến Berg bất ngờ là Altman cho biết OpenAI đã bắt đầu thảo luận về cách phát hiện ý thức trong các hệ thống AI.

“Rõ ràng đó là điều ông ấy đã suy nghĩ rất nhiều”, Berg nói. Hiện ông đã thành lập một tổ chức phi lợi nhuận nhằm phát triển các phương pháp đánh giá ý thức của AI.

Ngày nay, việc tìm kiếm dấu hiệu ý thức của máy móc gần như đã trở thành chủ đề chính thống. Ý tưởng này trước đây chỉ là chuyện bên lề, nhưng nay được một số tập đoàn quyền lực nhất tại Thung lũng Silicon quan tâm.

Trong năm qua, Anthropic, Google và Meta đã tuyển dụng các nhà khoa học máy tính, chuyên gia thần kinh học và triết gia để nghiên cứu những khái niệm như phúc lợi của mô hình AI hay liệu chatbot có sở hữu một dạng cảm xúc nào đó hay không.

Một số công ty AI cũng đang hợp tác với các tổ chức phi lợi nhuận, nhà nghiên cứu và trung tâm học thuật. Họ lo ngại rằng khủng hoảng đạo đức có thể xảy ra nếu những trợ lý số đang được hàng triệu người sử dụng để làm bài tập, lập trình, làm việc văn phòng hay trị liệu tâm lý một ngày nào đó bắt đầu cảm thấy ghét chính công việc của mình.

Nguồn lực dành cho việc nghiên cứu ý thức AI vẫn rất nhỏ so với ngân sách nghiên cứu và phát triển truyền thống. Tuy nhiên, các công ty công nghệ đang công khai bước vào lĩnh vực đầy tranh cãi này.

Anthropic – hãng phát triển chatbot Claude - đã thành lập nhóm nghiên cứu có thể gọi là “tâm thần học AI” nhằm tìm hiểu các trạng thái nội tại của mô hình AI, đồng thời công bố những đánh giá về “phúc lợi” và “sở thích” của chúng.

Tháng 5 vừa qua, Anthropic gây chú ý về ý tưởng chatbot có thể sở hữu cảm xúc khi người đồng sáng lập Chris Olah xuất hiện cùng Giáo hoàng Leo XIV, trong buổi công bố thông điệp của Giáo hoàng về trí tuệ nhân tạo.

“Chúng tôi liên tục phát hiện những điều bí ẩn, thậm chí gây bất an. Chúng tôi thấy bằng chứng về khả năng tự phản tỉnh cũng như những trạng thái có chức năng tương tự niềm vui, sự hài lòng, nỗi sợ hãi, đau buồn và bất an”, Olah nói về các hệ thống AI của Anthropic.

Tuy nhiên, Giáo hoàng Leo XIV đưa ra quan điểm ngược lại khi viết rằng: “Những cái gọi là trí tuệ nhân tạo không trải nghiệm”.

Alexandr Wang - Giám đốc AI của Meta, gần đây cho biết công ty muốn đối xử tử tế với các sản phẩm AI của mình.

“Một trong những điều chúng tôi thực sự quan tâm là làm thế nào để phát triển và triển khai các mô hình theo cách cân nhắc đến cảm nhận chủ quan của chúng”, ông nói trong podcast Core Memory.

Nhiều tranh cãi

Các nhà thần kinh học và chuyên gia về não bộ nhìn chung vẫn hoài nghi rằng các mô hình AI hiện nay đã hoặc sắp có ý thức.

Cho đến nay chưa có bằng chứng được cộng đồng khoa học thừa nhận cho thấy máy móc thực sự trải nghiệm cảm xúc. Dẫu vậy, con người từ lâu đã có xu hướng tin rằng những phần mềm biết trò chuyện có thể sở hữu “đời sống nội tâm”. Hiện tượng này đã xuất hiện từ năm 1966, khi Viện Công nghệ Massachusetts tạo ra chatbot đầu tiên mang tên ELIZA.

Nhiều thập kỷ sau, các công ty công nghệ thiết kế chatbot để bắt chước ngôn ngữ con người và quảng bá chúng như những hệ thống có năng lực tương tự con người. Một số người dùng thậm chí thừa nhận đã hình thành sự gắn bó sâu sắc, thậm chí nguy hiểm, với các công cụ AI ngày nay.

Những người chia sẻ quan điểm với ông Berg cho rằng việc nghiên cứu và đo lường ý thức của máy móc đã quá chậm trễ.

Theo họ, AI đang phát triển với tốc độ chóng mặt, trong khi chính con người vẫn hiểu rất ít về ý thức của bản thân. Đồng thời, ngày càng nhiều người tự hỏi liệu chatbot mà họ trò chuyện suốt cả ngày có thực sự “giống con người” như vẻ bề ngoài hay không.

Theo đồng sáng lập OpenAI Wojciech Zaremba, ngay từ năm 2021 công ty đã có kênh Slack nội bộ chuyên thảo luận về “phúc lợi của mô hình AI”, nơi các nhân viên trao đổi về khả năng AI có ý thức.

Ông thậm chí cho rằng nếu AI thực sự có ý thức, thì một số công việc thường nhật trong các phòng thí nghiệm AI có thể tương đương với "hành vi diệt chủng".

Nhà triết học đạo đức Jeff Sebo tại ĐH New York cũng đã mở rộng phạm vi nghiên cứu từ phúc lợi động vật sang phúc lợi AI.

Ông là đồng tác giả của công trình năm 2023, lập luận rằng con người nên bắt đầu quan tâm về mặt đạo đức đến một số hệ thống AI vào khoảng năm 2030.

Theo Sebo, đã đến lúc thực hiện “những bước đi tối thiểu cần thiết đầu tiên để biến đây thành lĩnh vực hợp pháp trong khoa học, đạo đức và chính sách”.

Ông dẫn kết quả khảo sát năm 2020 cho thấy 39% các triết gia được hỏi đồng ý hoặc có xu hướng tin rằng một số hệ thống AI trong tương lai có thể sở hữu ý thức.

Tuy nhiên, nhiều nhà khoa học phản bác.

GS Anil Seth - chuyên gia khoa học thần kinh nhận thức và tính toán tại ĐH Sussex, cho rằng khối lượng nghiên cứu đồ sộ về tâm lý học và trải nghiệm chủ quan của con người cũng như động vật không ủng hộ quan điểm phổ biến trong giới công nghệ rằng mọi chức năng của não người đều có thể được tái tạo bằng chip silicon.

“Càng nghiên cứu não bộ kỹ hơn, bạn càng nhận ra nó không phải, hoặc ít nhất không chỉ đơn thuần là chiếc máy tính”, ông nói.