“Ann hát được nhưng biểu cảm đơ như cây cơ”
Công bằng mà nói, nếu không xem MV “Làm sao nói thương anh” mà chỉ nghe giọng hát, chắc rất ít người đoán được đây là giọng ảo do máy móc tạo ra. Giọng hát của Ann không gọi là xuất sắc nhưng có thể đánh đồng với một vài ca sĩ thị trường đang nổi hiện nay, thậm chí nhỉnh hơn ở khả năng kiểm soát hơi hay phát âm tròn vành rõ chữ.
Ann được phía nhà sản xuất gọi là nữ thần tượng âm nhạc ảo đầu tiên của Việt Nam – vừa chính thức ra mắt khán giả tại TPHCM vào chiều 14/3. Khi chúng tôi, bao gồm cả một số nhà sản xuất âm nhạc được nghe giọng Ann lần đầu, chỉ có một người nhận ra “vấn đề của Ann” là “hoàn toàn không tìm thấy chút rung cảm nào trong giọng hát”. Một số người thì cho rằng giọng Ann “được”, “sạch nước cản”, “có thể được giới trẻ thích”... Đáng chú ý, có hai chuyên gia công nghệ đặt dấu hỏi về việc tạo ra giọng hát của Ann, có phải từ công nghệ thuần túy hay do một giọng hát thật ngoài đời “lồng tiếng”?
BoBo Đặng, “cha đẻ” của Ann cho biết, giọng của Ann là sự kết hợp của thuật toán AI cùng các âm thanh thật. Nói kỹ hơn, vị sáng lập này chia sẻ: “Việc xử lý ca khúc cho Ann rất khác biệt so với ca sĩ thật. Chúng tôi phải dùng những công nghệ kĩ thuật số để tái tạo màu giọng, kết hợp với một số kĩ thuật thu âm để chọn màu giọng tốt nhất với thể loại mà chúng tôi mong muốn.
AI là một trong những công cụ được chúng tôi dùng để tạo nên màu giọng này, nhưng cũng không phải là tất cả. Bên cạnh đó để thêm vào cảm xúc, chúng tôi cũng sử dụng nhiều âm thanh tự nhiên của con người như tiếng thở hoặc tiếng lấy hơi để tạo độ chân thật”.
Ann được tạo hình là nữ ca sĩ 18 tuổi, có mái tóc ngắn và gương mặt đậm chất Á đông. Một chi tiết thú vị là khi thiết kế cấu tạo cơ thể của Ann, nhóm của BoBo Đặng đã cố tình tạo ra một vài khiếm khuyết nhỏ bởi theo lý giải của họ, trên thực tế không có cái gọi là ngoại hình hoàn hảo. Theo dự kiến của nhóm, ngoại hình của Ann sẽ giữ nguyên ở tuổi 18, không già đi, đồng thời đời tư của cô cũng sạch sẽ, không scandal. Một số khán giả hóm hỉnh bình luận: “Mãi không già đi tức là yêu quái đấy”!
Sự xuất hiện của ca sĩ ảo Ann đã gây nhiều tranh luận với khán giả. Bên cạnh một số người ủng hộ “xu thế mới” trong sáng tạo nghệ thuật - ở đó có sự tham dự sâu sắc của công nghệ, rất nhiều người cho rằng, ngoài câu chuyện của ca từ và giai điệu, âm nhạc còn là câu chuyện của cảm xúc, điều này máy móc không làm được, ít nhất là Ann đã không tạo ra được cảm xúc cho người nghe. Nói như một khán giả: dù Ann được tạo ra với màu giọng và xử lý âm thanh sống động, có cao độ, trường độ và phát âm cảm giác như ca sĩ thật, nhưng bản chất đây vẫn là một ca sĩ ảo. Đây có lẽ cũng là lý do chỉ sau một ngày ra mắt, phía nhà sản xuất đã phải tắt tính năng bình luận trên youtube vì e ngại những ý kiến trái chiều của khán giả.
Nhà sản xuất Huy Quân cho biết việc dùng trí tuệ nhân tạo (AI) để xây dựng các ca sĩ ảo đang trở thành xu hướng tại một số nước như Hàn Quốc, Nhật Bản, Mỹ, Trung Quốc... Tuy nhiên, nếu biểu cảm của Ann còn “đơ như cây cơ” thì các ca sĩ ảo của một số quốc gia đã được xử lý hình họa tinh tế hơn, nhiều biểu cảm và sắc thái hơn. Anh Quân cũng chia sẻ, khán giả ở Hàn Quốc hoặc Nhật coi các ca sĩ ảo như các nhân vật hoạt hình, họ có cộng đồng hâm mộ riêng. Thị trường ca sĩ ảo trên thế giới cũng được đánh giá là “có tiềm năng” không kém gì thị trường game online.
Sách của nhà văn ảo
Trước khi ChatGPT phổ biến thì thị trường sách đã có ấn phẩm của AI. Nói riêng ở thị trường Việt Nam, từ năm 2020, “NYM - Tôi của tương lai” được coi là cuốn sách đầu tiên của một tác giả (Nguyễn Phi Vân) kết hợp với AI viết đã được NXB Văn hóa Văn nghệ ấn hành. Nhân vật chính của sách là NYM - một robot luôn nhận mình là người hơn một con người, đại diện của gen Z xuất chúng trong tương lai.
Cuốn sách của Nguyễn Phi Vân vừa ra mắt đã trở thành tác phẩm yêu thích của lứa gen Z khi nó cung cấp rất nhiều thông tin về bản chất của cách mạng công nghiệp 4.0, các trụ cột của cách mạng công nghiệp 4.0, cách thức thế giới đang khai thác vạn vật, Big Data... và quan trọng nhất là câu chuyện máy móc sẽ thay thế con người trong tương lai. Một số độc giả thậm chí coi “NYM” là cuốn sách giáo khoa của thế kỷ 21. Cũng phải nói lại, “NYM” thiên về dòng sách kỹ năng và phổ biến kiến thức hơn là sách văn học. Những thứ này, vừa hay là thế mạnh của AI. Bởi chẳng có bộ nhớ nào của người lại có thể nhanh, nhiều và chính xác cho bằng máy móc. Tuy nhiên, hạn chế của trí tuệ nhân tạo cũng lộ rõ ở đây, nó hoàn toàn thiếu xúc cảm, trí tưởng tượng và cái gọi là nhân khí (tính người) trong câu chuyện.
Ở thị trường xuất bản của nhiều nước, sách do AI viết đã không còn xa lạ. Trên trang Amazon, có tới hàng trăm đầu sách của các tác giả AI được chào bán. Tại Nhật Bản, cuốn sách “Ngày mà máy tính viết tiểu thuyết” (The day a computer writes a novel) do AI viết còn được bình chọn vào giải thưởng văn chương Nikkei Hoshi Shinichi 2016. Để đảm bảo công bằng và xóa bỏ định kiến, các giám khảo của giải thưởng đã không được thông báo trong số các tiểu thuyết dự giải, cuốn nào được viết bởi con người và cuốn nào được chấp bút bởi các nhóm máy tính.
Tờ Lemonde (Pháp) dẫn lại tin của Đài Truyền hình NHK về cách thức làm cuốn tiểu thuyết này: “Con người quyết định cốt truyện và nhân vật của cuốn sách, sau đó họ nhập các từ và cụm từ, từ một cuốn tiểu thuyết hiện có vào máy tính, máy tính căn cứ vào đó để tạo ra một cuốn sách mới”. Cuốn sách đã gây ấn tượng với tiểu thuyết gia khoa học viễn tưởng Satoshi Hase. Ông nói: “Tôi rất ngạc nhiên vì đây là một cuốn tiểu thuyết có cấu trúc tốt. Nhưng vẫn còn một số vấn đề cần khắc phục để đoạt giải, chẳng hạn như mô tả nhân vật.”
Các tác giả không cần lo lỗi thời
Vẫn là tờ LeMonde khẳng định: “Các tiểu thuyết gia có lẽ không nên lo lắng về việc mất việc làm. Mặc dù “Ngày mà máy tính viết tiểu thuyết” vượt qua vòng đầu tiên, nhưng nó đã không giành được giải thưởng”.
Chính ChatGPT khi được hỏi về việc AI tham gia sáng tác có là mối lo cho người cầm bút hay không, hệ thống này khẳng định: “Không, AI có thể hỗ trợ và tạo ra văn học một cách tự động nhưng nó không thể tạo ra sự sáng tạo và trải nghiệm của một nhà văn. Vì vậy, văn học sẽ vẫn còn tồn tại và phát triển theo thời gian”.
Một số người đã đọc các cuốn sách của AI, đặc biệt là sách văn học có chung nhận xét: trí tuệ nhân tạo có khả năng xây dựng một cốt truyện logic, có ý nghĩa nhưng kém về biểu cảm, nghèo nàn về từ vựng, không có những câu văn bay bổng hoặc hóm hỉnh, và đặc biệt thiếu vắng cảm xúc và những câu hỏi tự vấn. Đây là vấn đề chung của các “nhà văn AI” toàn thế giới, kể cả ở phiên bản tiếng Anh – thứ tiếng được cho là “tốt nhất với AI”.
Nhà văn người Pháp Michel Bussi khi được hỏi về giá trị quan trọng nhất của văn học nghệ thuật cũng khẳng định: “nghệ thuật thì làm thế nào cũng được, nhưng cuối cùng phải đưa cảm xúc tới cho người xem, đi vào nội tâm của họ, mở ra những cánh cửa luôn đóng kín, hoặc đem đến những trải nghiệm họ chưa từng trải qua. Đó chính là mục đích của nghệ thuật”. Tiểu thuyết gia trinh thám hàng đầu của Pháp đồng thời là nhà phân tích chính trị và giáo sư địa lý cũng cho rằng: “AI rất khó thay thế được các nghệ sĩ đích thực, có cá tính” bởi theo ông “cốt truyện không phải là điều quan trọng nhất, mà là việc làm thế nào để người đọc đi tới cảm xúc thật, và sâu lắng, khiến họ phải nhìn lại đời sống của họ, phải tự vấn và thay đổi”.