Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản

0:00 / 0:00
0:00
Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản
SVVN - 6 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) đã nghiên cứu chế tạo một thiết bị dùng AI để chuyển ngôn ngữ ký hiệu (thủ ngữ) sang giọng nói và văn bản, giúp người khiếm thanh và khiếm thính có thể giao tiếp dễ dàng với cộng đồng.

Nhóm gồm Nguyễn Quang Đức, Lê Đỗ Thanh Bình, Phan Quốc Long, Nguyễn Thành Lưu, Bùi Ngô Hoàng Long (cùng khóa 2018, khoa Khoa học và Kỹ thuật Máy tính) và Cao Khánh Gia Hy (khóa 2020, khoa Quản lý Công nghiệp).

Theo trưởng nhóm Nguyễn Quang Đức, nước ta hiện có khoảng 1 đến 2,5 triệu người khiếm thanh và người khiếm thính, tương đương dân số một tỉnh. Tuy nhiên có rất ít phiên dịch viên ngôn ngữ ký hiệu. Riêng tại Hà Nội hiện chỉ có 6 người đạt đến trình độ có thể dịch các lĩnh vực cho người điếc, trong cả nước có khoảng 10 người. Hiện nay, những người khiếm thanh, khiếm thính hiện vẫn đang sử dụng thủ ngữ (ngôn ngữ ký hiệu Việt Nam) để giao tiếp trong cuộc sống. Cách này có nhiều điểm hạn chế như: người tương tác buộc phải biết thủ ngữ, thời gian tương tác lâu, dễ nhầm lẫn. Đặc biệt, nhu cầu lớn nhưng nước ta rất ít các trung tâm dạy thủ ngữ.

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 1

Nhóm nghiên cứu và các giảng viên tư vấn gồm TS Quản Thành Thơ và TS Võ Thanh Hằng.

Đức cho biết, dự án “Thiết bị giao tiếp thông minh dành cho người khiếm thanh, khiếm thính – Speak your mind” (SYM) là thiết bị giao tiếp sử dụng công nghệ AI để chuyển ngôn ngữ ký hiệu sang văn bản và giọng nói phát ra từ các thiết bị điện thoại thông minh để những người khiếm thanh, khiếm thính dễ dàng trao đổi thông tin với mọi người.

Sản phẩm là một thiết bị tích hợp phần mềm thông minh nhằm hỗ trợ người khiếm thanh có thể tương tác với mọi người một cách dễ dàng và thuận tiện hơn bằng cách chuyển đổi thủ ngữ thành văn bản và giọng nói. Thiết bị bao gồm bao gồm hai thành phần: mô-đun camera được gắn trên nón và ứng dụng trên điện thoại Android.

Theo Hoàng Long, chuỗi hình ảnh thủ ngữ của người dùng được ghi nhận từ camera sẽ đi qua bộ nhận diện các điểm chốt của bàn tay MediaPipe của Facebook và được trích xuất thành các đặc trưng. Mô hình AI được huấn luyện trước bằng mạng học sâu sẽ dự đoán từ tương ứng. Kết quả này sẽ xuất ra dưới dạng văn bản và giọng nói thông qua Text2Speech API của Google.

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 2

Mô phỏng hoạt động của thiết bị qua chiếc nón.

Camera nhỏ gọn và các linh kiện điện tử được lắp đặt trong hộp nhựa gắn vào nón của người dùng. Vật liệu sử dụng cho hộp chứa linh kiện điện tử là nhựa sinh học (Polylactic Acid – PLA) không độc hại, không gây ảnh hưởng đến sức khỏe người tiêu dùng và có khả năng dễ phân hủy, thân thiện với môi trường

Khi người dùng nhấn nút khởi động của thiết bị, camera này sẽ ghi nhận và chuyển dòng hình ảnh vào ứng dụng của chúng tôi đã cài đặt sẵn trên điện thoại thông minh của người dùng. Ứng dụng sẽ sử dụng các công nghệ ở trên để chuyển dòng hình ảnh thủ ngữ thành văn bản và giọng nói tương ứng hiện lên màn hình và phát ra loa. Bằng cách này, người đối diện có thể hiểu được điều mà người khiếm thanh, khiếm thính cần truyền đạt mà không cần phải học qua thủ ngữ. Ngoài ra, ứng dụng còn có chức năng lưu lại thủ ngữ cùng với văn bản và phát âm tương ứng. Chức năng này giúp cho những người muốn học thủ ngữ có thể lưu trữ bài học một cách dễ dàng. Nói cách khác, hệ thống của chúng tôi vừa là thiết bị dịch thủ ngữ sang văn bản và lời nói, vừa là ứng dụng hỗ trợ học thủ ngữ hiệu quả.

Đối tượng khách hàng mục tiêu trước mắt của sản phẩm hướng đến trong 3 năm tới là cá nhân những người khiếm thanh, khiếm thính và phụ huynh của những người bị khiếm thanh, khiếm thính tại Việt Nam.

Theo đánh giá của nhóm tư vấn gồm TS Võ Thanh Hằng (Khoa Môi trường và tài nguyện) và TS Quản Thành Thơ (Phó Khoa Khoa học và kỹ thuật máy tính), tính độc đáo và sáng tạo của SYM còn là toàn bộ sản phẩm được mã hóa bằng tiếng Việt, dễ dàng sử dụng đối với khách hàng. Bên cạnh đó, thiết bị cũng tích hợp các ngôn ngữ khác nhau đáp ứng các đối tượng khách hàng.

Quang Đức cho biết, giá thành sản phẩm thấp cũng là một ưu thế của dự án: “Nhóm người điếc/khiếm thính có thu nhập bình quân cao nhất ở mức 3 triệu đồng một tháng, so với mức thu nhập chung trên cả nước 5,4 triệu đồng một tháng.”

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 3

Tổng quan giao diện của ứng dụng trên thiết bị Android.

Dựa vào chi phí cố định 1 sản phẩm (dao động khoảng 405.600 VND) và chi phí biến động, phân khúc thị trường cùng những dòng sản phẩm cạnh tranh cùng phân khúc, SYM định giá sản phẩm phân phối đến tay người dùng chỉ từ 800.000 – 1 triệu đồng. Một nghiên cứu tiến hành tại Hà Nội, Thái Nguyên, Nghệ An, TP.HCM và Đà Nẵng 2017 với 574 người khuyết tật chỉ ra rằng những người khuyết tật nói chung, người khiếm thanh, khiếm thính nói riêng rất khó khăn để tiếp cận các dịch vụ y tế, giáo dục, tỷ lệ thất nghiệp cao, cảm nhận bị kỳ thị ảnh hưởng đến đời sống vật chất, tinh thần.

Dự án của nhóm đang tham gia cuộc thi “Sinh viên với quyền sở hữu trí tuệ S&IP” năm 2021 với chủ đề “Từ ý tưởng đến cơ hội kinh doanh” do Trung tâm Sở hữu trí tuệ và Chuyển giao Công nghệ (IPTC) ĐHQG TP.HCM phối hợp cùng Khu Công nghệ phần mềm (Khu CNPM) ĐHQG TP. HCM và Trung tâm Nghiên cứu Đào tạo và Hỗ trợ tư vấn, Cục Sở hữu trí tuệ, Bộ KH - CN tổ chức

MỚI - NÓNG
Thí sinh chưa đỗ tốt nghiệp THPT 2024 sẽ có đề thi riêng
Thí sinh chưa đỗ tốt nghiệp THPT 2024 sẽ có đề thi riêng
SVVN - Bộ GD - ĐT đã có thông tin chính thức về việc tổ chức thi tốt nghiệp THPT cho thí sinh chưa đỗ kỳ thi năm 2024. Theo đó, từ năm 2025, những học sinh chưa đỗ Kỳ thi Tốt nghiệp năm 2024 và những năm trước đó sẽ được tổ chức thi tốt nghiệp đúng nội dung chương trình giáo dục phổ thông đã được học, theo tinh thần đảm bảo đầy đủ quyền lợi của học sinh.

Có thể bạn quan tâm

Mãn nhãn, xúc động với 'biên niên sử' về lực lượng Cảnh sát Cơ động

Mãn nhãn, xúc động với 'biên niên sử' về lực lượng Cảnh sát Cơ động

SVVN - Chương trình nghệ thuật '50 năm Cảnh sát Cơ động - Những chặng đường vinh quang' là một trong những hoạt động văn hóa, nghệ thuật điểm nhấn trong chuỗi hoạt động chào mừng kỷ niệm 50 năm Ngày truyền thống lực lượng Cảnh sát Cơ động (15/4/1974 – 15/4/2024). Chương trình nói về lực lượng Cảnh sát Cơ động từ những ngày đầu mới thành lập, trải qua các giai đoạn trưởng thành, phát triển cho đến hôm nay.
Muôn kiểu tránh nóng của sinh viên TP. HCM

Muôn kiểu tránh nóng của sinh viên TP. HCM

SVVN - Những ngày này, nhiệt độ tại TP. HCM luôn ở mức cao, phổ biến từ 37 - 39 độ C. Thời tiết nắng nóng, ngột ngạt khiến nhiều sinh viên tìm cách “chạy trốn”. Từ che chắn đến “ẩn nấp” ở thư viện, quán cà phê... đều được sinh viên áp dụng để chống chọi với cái nắng khắc nghiệt.
Hành trình theo ‘dấu chân mặt trời’ của 2 nữ runner 'Top 8 vận động viên phong trào cự ly HM' hướng tới ‘TPM 2024’

Hành trình theo ‘dấu chân mặt trời’ của 2 nữ runner 'Top 8 vận động viên phong trào cự ly HM' hướng tới ‘TPM 2024’

SVVN - Không chỉ là hai trong 8 runner nữ có vinh dự được xếp pen E (Elite) chung với tuyển quốc gia tại "Giải Vô địch Quốc gia và Cự ly dài báo Tiền Phong" (Tiền Phong Marathon - TPM) lần thứ 65, năm 2024, tại Phú Yên, Nguyễn Thị Hưởng và Lê Thị Lai còn được biết đến là hai nữ runner có tiếng trong làng chạy phong trào, cùng nhiều thành tích cao ở các giải chạy lớn, nhỏ.
Cựu sinh viên Nhân văn nhắn nhủ sinh viên Nhân văn trước ngưỡng cửa thế giới việc làm

Cựu sinh viên Nhân văn nhắn nhủ sinh viên Nhân văn trước ngưỡng cửa thế giới việc làm

SVVN - Anh Nguyễn Văn Đạt có 8 năm kinh nghiệm làm việc tại Tập đoàn Thế giới di động, đang là Giám đốc Phát triển mạng lưới kiêm Giám đốc Đối ngoại Công ty cổ phần Thời trang YODY. Anh là 1 trong số 5 diễn giả khách mời tại talkshow "Chuyển đổi việc làm: Cơ hội, thách thức cho người lao động và doanh nghiệp" do trường Đại học Khoa học Xã hội & Nhân văn - ĐHQG Hà Nội tổ chức. Đây là chia sẻ của anh dành riêng cho chuyên trang Sinh Viên Việt Nam, báo Tiền Phong.
Gen Z sử dụng mạng xã hội sao cho hiệu quả?

Gen Z sử dụng mạng xã hội sao cho hiệu quả?

SVVN - Tại chương trình "Hỗ trợ tâm lý học đường - đưa chuyên gia đến với trường học", diễn ra ở trường THCS-THPT Hai Bà Trưng (quận Tân Bình, TP. HCM), ThS Tâm lý Trần Thị Thanh Trà - giảng viên trường ĐH Mở TP. HCM cho biết: “Theo thống kê của Google vào tháng 6/2023, gần 80% người dân Việt Nam sử dụng mạng xã hội, thời lượng trung bình là 3 giờ đồng/ngày”.
Báo Tiền Phong và Keppel đưa hai hệ thống máy lọc nước sạch đến người dân tỉnh Bến Tre và Trà Vinh

Báo Tiền Phong và Keppel đưa hai hệ thống máy lọc nước sạch đến người dân tỉnh Bến Tre và Trà Vinh

SVVN - Nhân Ngày Nước thế giới (22/3) với chủ đề “Leveraging water for peace” - “Nước cho hòa bình”, báo Tiền Phong phối hợp Tập đoàn Keppel cùng Tỉnh Đoàn Bến Tre, Tỉnh Đoàn Trà Vinh tổ chức trao tặng hai hệ thống máy lọc nước nhiễm mặn có công suất sản xuất 12.000 lít nước sạch mỗi ngày.