Nam sinh trường Nhân văn phát triển hệ thống AI dự báo điểm chuẩn đại học cập nhật theo thời gian thực

SVO - Xuất phát từ trải nghiệm thực tế và sự thấu hiểu khó khăn của học sinh khi đứng trước ngưỡng cửa xét tuyển, Nguyễn Đức Anh (sinh năm 2004) - sinh viên khoa Quản trị thông tin, Trường Đại học Khoa học Xã hội và Nhân văn, Đại học quốc gia Hà Nội đã phát triển hệ thống trí tuệ nhân tạo dự báo điểm chuẩn theo thời gian thực.

Ý tưởng về hệ thống bắt nguồn từ chính trải nghiệm bị "ngợp" trong biển thông tin tuyển sinh của Đức Anh. Ban đầu, nam sinh chỉ dự định làm một công cụ nhỏ để tự động hóa việc lọc dữ liệu điểm chuẩn các năm. Bước ngoặt đến khi Đức Anh nhận được sự dẫn dắt của thầy Trần Đăng Ninh - giảng viên Học viện Kỹ thuật và Công nghệ An ninh. Dưới sự định hướng chuyên sâu, dự án đã thoát khỏi khuôn khổ một công cụ thông thường để phát triển thành một đề tài nghiên cứu khoa học nghiêm túc, kết hợp giữa xử lý dữ liệu lớn và giải quyết bài toán xã hội.

Qua quá trình nghiên cứu, Đức Anh nhận thấy điểm chuẩn đại học không chỉ là những con số vô tri trên giấy mà còn phản ánh trực tiếp quy luật cung - cầu của thị trường lao động và xu hướng tâm lý xã hội.

anh-ca-nhan.jpg
Nguyễn Đức Anh - sinh viên khoa Quản trị thông tin Trường Đại học Khoa học Xã hội và Nhân văn - ĐHQG Hà Nội đã phát triển hệ thống AI dự báo điểm chuẩn đại học cập nhật theo thời gian thực.

"Nếu chỉ cho học sinh xem điểm của năm ngoái, thì đó là thông tin 'chết'. Cơ duyên thực sự đến khi mình bắt đầu thu thập, phân tích hàng ngàn bài báo giáo dục và nhận ra sự tương quan rõ rệt giữa mức độ quan tâm của truyền thông với sự biến động điểm chuẩn. Từ đó, mình quyết định đưa thêm các mô hình học máy (Machine Learning) vào dự án, biến một công cụ tra cứu tĩnh thành một hệ thống 'sống' có khả năng dự báo", Đức Anh chia sẻ.

Từ một đề tài nghiên cứu khoa học, Đức Anh và cộng sự đã phát triển thành công nền tảng trực tuyến diemthi.techtreesolution.com. Hệ thống này không chỉ hỗ trợ tra cứu và dự báo điểm chuẩn, mà còn giúp thí sinh đánh giá rủi ro và xác định dải điểm an toàn cho hầu hết các trường đại học trên cả nước.

Kiên nhẫn 'đãi cát tìm vàng' với dữ liệu thô

Đức Anh cho biết, thay vì lạm dụng những thuật toán phức tạp nhưng kém hiệu quả, hệ thống trí tuệ nhân tạo của sản phẩm ưu tiên tính ổn định, vận hành theo quy trình ba bước: Thu thập, xử lý - lưu trữ, và phân tích - dự báo.

Các đoạn mã tự động sẽ định kỳ quét thông tin từ các nguồn chính thống. Dữ liệu thô sau đó được làm sạch, đưa vào cơ sở dữ liệu có cấu trúc. Cuối cùng, khối dữ liệu khổng lồ được chạy qua các mô hình xử lý ngôn ngữ tự nhiên để chấm điểm mức độ "hot" của từng ngành, kết hợp với phổ điểm thi năm 2026 nhằm xuất ra dải điểm dự báo an toàn.

giaodien-du-bao-diem-chuan.png
giaodien-chinh.png
Hệ thống dự báo điểm chuẩn theo thời gian thực được hàng chục nghìn người sử dụng.

"Khó khăn lớn nhất là việc thu thập và làm sạch dữ liệu, bởi thông tin tuyển sinh của mỗi trường lại có một định dạng khác nhau. Trong lĩnh vực AI, quy luật "dữ liệu đầu vào rác thì kết quả cũng sẽ là rác" là một thách thức không nhỏ, đặc biệt với ngôn ngữ tiếng Việt đa dạng và nhiều từ lóng", Đức Anh nói.

Để giải quyết bài toán này, nam sinh không vội vàng ném tất cả vào mô hình huấn luyện mà dành phần lớn thời gian ở bước tiền xử lý. Đức Anh xây dựng các bộ lọc từ khóa, phân loại tin tức theo cụm chủ đề rõ ràng và kiên nhẫn huấn luyện mô hình với những tập dữ liệu nhỏ có độ chính xác cao trước khi mở rộng quy mô.

Dự báo thời gian thực giúp gỡ khó cho thí sinh

"Điểm sáng nhất của dự án được ghi nhận tại Hội nghị Nghiên cứu khoa học sinh viên không nằm ở công nghệ quá cao siêu, mà ở tư duy ứng dụng thời gian thực để giải quyết vấn đề thực tế của học sinh và phụ huynh", nam sinh chia sẻ.

Cứ mỗi 12 tiếng, các thuật toán sẽ tự động rà quét tin tức mới nhất và lập tức xử lý để cập nhật lại cơ sở dữ liệu lõi. Nhờ nguồn dữ liệu được làm mới mỗi nửa ngày, mức điểm dự báo của một ngành sẽ biến động liên tục dựa trên sức nóng thực tế của xã hội. Thí sinh luôn nắm bắt được độ rủi ro hay an toàn của ngành học ở ngay thời điểm hiện tại, từ đó có cơ sở vững chắc nhất để chốt danh sách nguyện vọng.

Chia sẻ về dự định phát triển tương lai, Đức Anh cho biết: "Trước mắt, mình vẫn tập trung tối ưu hóa 'trái tim' của hệ thống là công cụ tra cứu thông qua các bộ lọc, đảm bảo trải nghiệm người dùng thật mượt mà. Về dài hạn, mình có hai mục tiêu chính. Thứ nhất là tiếp tục mở rộng tập dữ liệu huấn luyện từ mạng xã hội để mô hình dự báo nhạy bén hơn. Thứ hai, mình dự định sẽ dành tâm huyết phát triển thêm phiên bản trên thiết bị di động (Mobile App) để học sinh ở mọi vùng miền đều có thể tiếp cận hệ thống dễ dàng".