Không biết bạn sẽ suy nghĩ như thế nào về dịch vụ mới của Lyrebird ở Montreal. Công ty này cho biết API của họ sẽ cho phép bạn tổng hợp lời thoại từ giọng nói của bất kỳ ai chỉ với bản thu âm dài khoảng 1 phút – nghĩa là bạn có thể tự tổng hợp ra một đoạn phim với tiếng nói của Tom Cruise chẳng hạn, trong chốc lát.
Lyrebird đã tăng tải một số âm thanh ví dụ khá thuyết phục (bạn có thể tìm hiểu thêm từ trang này). Công ty nói rằng công nghệ này không đòi hỏi người nói phải nói những từ mà bạn sẽ sử dụng trong đoạn ghi âm muốn tạo ra, thậm chí bạn có thể tạo ra các ngữ điệu khác nhau khi người đó nói.
Tháng 11 năm ngoái, Adobe cũng đã phát hành một bản demo cho công nghệ tương tự. Dự án VoCo của Adobe yêu cầu 20 phút âm thanh và sử dụng các tài nguyên hệ thống để tổng hợp giọng nói. Trong khi đó, Lyrebird chỉ cần một bản ghi âm dài một phút và API của họ sẽ xử lí âm thanh trên đám mây trước khi cho ra kết quả cuối cùng.
Năm ngoái, khi dự án VoCo ra mắt, không ít người lo lắng kẻ xấu sẽ lợi dụng công nghệ này để phát tán nhiều thông tin gây hiểu nhầm mà mọi người cứ tưởng đó là bản gốc.
Trên website Ethics của công ty, Lyrebird nói rằng công nghệ của này được cung cấp công khai cho mọi người và họ bảo đảm sẽ không xảy ra những rủi ro như vậy. Công ty hy vọng con người sẽ sớm nhận thức được sự tồn tại của công nghệ này và sao chép tiếng nói của người khác là có thể.
Tuy nhiên, nguy cơ về tình trạng lừa đảo và thông tin sai lệch do bắt chước giọng nói vẫn hiện hữu. Chúng ta không chỉ nói về việc sao chép tiếng nói của lãnh đạo thế giới, bất kỳ ai cũng có thể bị lừa đảo bởi nhằm tưởng rằng mình đang nói chuyện hoặc nghe giọng nói của các thành viên trong gia đình.