Draft viết bài dự thi thạc sĩ

Note

Content

🎓 BÀI LUẬN DỰ ĐỊNH NGHIÊN CỨU TRÌNH ĐỘ THẠC SĨ

1. Mục tiêu học sau đại học (SĐH)

Mục đích trả lời câu hỏi:

*2. Lý do lựa chọn cơ sở đào tạo

3. Kinh nghiệm làm việc

4. Hướng dự định nghiên cứu

Ý tưởng về dự định nghiên cứu:
Suy nghĩ, cân nhắc, chọn lọc để đi đến xác định đề tài.
Gồm 7 nội dung:

  1. Lý do chọn đề tài
  2. Mục tiêu đề tài
  3. Đối tượng nghiên cứu
  4. Phương pháp dự định nghiên cứu
  5. Kế hoạch nghiên cứu
  6. Kết quả dự kiến đạt được
  7. Đề xuất giao viên hướng dẫn

4.1. Đặt tên đề tài

4.2. Lý do chọn đề tài

*4.3. Mục tiêu nghiên cứu

4.4. Nhiệm vụ nghiên cứu

4.5. Đối tượng nghiên cứu

4.6. Phương pháp nghiên cứu

4.7. Kết quả dự kiến đạt được

5. Tài liệu tham khảo

Ví dụ trích dẫn theo APA 7th Edition:

Truong, D. T., & Cheng, G. (2016). Detecting domain-flux botnet based on DNS traffic features in managed network. Security and Communication Networks, 9(14), 2338–2347.

6. Đề xuất giảng viên hướng dẫn


MultiHop RAG (Tang and Yang, 2024) datasets.

Phát triển trợ lý tuyển sinh đại học tại Việt Nam với năng lực suy luận có thể truy vết dựa trên trí tuệ nhân tạo


2.x. Kết quả dự kiến đạt được

Phần này trình bày các kết quả dự kiến của đề tài sau khi hoàn thành toàn bộ kế hoạch nghiên cứu 6 tháng, bao gồm: (i) kết quả kỹ thuật/hệ thống; (ii) kết quả khoa học/học thuật; và (iii) giá trị ứng dụng đối với thí sinh, phụ huynh và nhà trường. Đồng thời, phần này chỉ ra những đóng góp chính mà đề tài kỳ vọng mang lại so với hiện trạng tư vấn tuyển sinh hiện nay.


1. Hệ thống trợ lý tuyển sinh có khả năng suy luận và giải thích được

Đề tài dự kiến xây dựng và vận hành được một hệ thống trợ lý tuyển sinh (chatbot) cho thí sinh Việt Nam, dựa trên kiến trúc Retrieval-Augmented Generation (RAG) và mở rộng bằng GraphRAG. Hệ thống không chỉ trả lời câu hỏi về ngành học, phương thức xét tuyển, điểm chuẩn, chỉ tiêu, học phí, thời hạn nộp hồ sơ… mà còn trả lời theo ngữ cảnh từng trường, từng năm, và từng phương thức tuyển sinh cụ thể.

Điểm quan trọng hơn là hệ thống không chỉ “trả lời” mà còn “giải thích tại sao trả lời như vậy”. Cụ thể:

Điều này trực tiếp giải quyết vấn đề đã nêu ở phần Lý do chọn đề tài: thông tin tuyển sinh hiện nay phân tán, thay đổi nhanh, khó tin cậy, và người hỏi rất khó tự kiểm chứng.

Kết quả dự kiến:


2. Kho dữ liệu tuyển sinh chuẩn hóa, có kiểm định và có thể tái sử dụng

Đề tài dự kiến hình thành một kho dữ liệu tuyển sinh đã được làm sạch, gắn nhãn và version hóa. Kho dữ liệu này bao gồm:

Không chỉ dừng ở việc “thu thập”, đề tài còn tổ chức dữ liệu theo đồ thị tri thức (knowledge graph), tạo ra các thực thể như Trường (University), Ngành (Program), Phương thức xét tuyển (AdmissionMethod), Chỉ tiêu (Quota), Điểm chuẩn/Điểm sàn (CutoffScore/FloorScore), Học phí (Tuition), Học bổng (Scholarship), Mốc thời gian (Deadline), Chính sách ưu tiên (Policy), v.v.

Giá trị của đóng góp này:

Nói cách khác: dữ liệu không chỉ phục vụ hệ thống trong luận văn, mà còn có thể trở thành nền tảng dùng chung cho các đề tài tiếp theo (ví dụ: dự báo xu hướng tuyển sinh, hệ thống gợi ý ngành học).


3. Bộ tiêu chí đánh giá cho bài toán tư vấn tuyển sinh dựa trên RAG/GraphRAG

Đề tài không dừng ở việc xây hệ thống, mà còn đề xuất một khung đánh giá có thể lặp lại và so sánh.

Cụ thể, đề tài dự kiến xây dựng:

Kết quả dự kiến:


4. Chứng minh định lượng rằng GraphRAG giải quyết được vấn đề thực tế

Một trong các kết quả dự kiến quan trọng là đưa ra được bằng chứng định lượng và định tính cho luận điểm: GraphRAG (có cấu trúc đồ thị tri thức + truy vết bằng chứng + ràng buộc theo timestamp mới nhất) hiệu quả hơn so với RAG truyền thống trong bối cảnh tư vấn tuyển sinh Việt Nam.

Kỳ vọng có thể chứng minh:

Điều này trả lời trực tiếp cho câu hỏi “đề tài có thật sự giải được vấn đề xã hội được nêu ở phần Lý do chọn đề tài hay không?”.


5. Đóng góp khoa học và hướng xuất bản

Từ kết quả nghiên cứu, đề tài kỳ vọng đóng góp các nội dung sau:

  1. Đóng góp phương pháp luận

    • Đề xuất một quy trình kỹ thuật đầy đủ cho việc xây dựng trợ lý tư vấn miền hẹp, từ thu thập dữ liệu chính thống → làm sạch → chuẩn hóa → xây dựng đồ thị tri thức → truy xuất đa tầng → sinh câu trả lời có giải thích.
    • Áp dụng logic Multi-hop (MultiHop-RAG) vào miền tuyển sinh Việt Nam, vốn có tính chất nhiều điều kiện ràng buộc, thay đổi theo từng năm, và đòi hỏi so sánh liên trường.
  2. Đóng góp dữ liệu

    • Tập dữ liệu tuyển sinh được chuẩn hóa, có versioning, gắn nguồn, có thể audit.
    • Bộ câu hỏi đánh giá (benchmark QA) phân loại theo Inference / Comparison / Temporal / Null, dùng để kiểm thử khả năng suy luận đa bước trong GraphRAG.
  3. Đóng góp kỹ thuật XAI trong tư vấn giáo dục

    • Cơ chế sinh câu trả lời kèm bằng chứng, timestamp và đường suy luận (evidence path) – tức giải thích không phải kiểu “tự suy đoán của mô hình”, mà là giải thích dựa trên nguồn chính thống.
    • Cách mô hình từ chối trả lời có điều kiện khi bằng chứng mâu thuẫn hoặc thiếu, thay vì “bịa cho đầy đủ”.
  4. Khả năng công bố / xuất bản

    • Một báo cáo kỹ thuật dạng “technical report / workshop paper” mô tả pipeline và benchmark, có thể hướng tới workshop/track về RAG, LLM for education, NLP cho tiếng Việt, hoặc các diễn đàn nghiên cứu ứng dụng AI trong giáo dục đại học.
    • Bộ dữ liệu (hoặc mô tả bộ dữ liệu + schema + quy trình thu thập + tiêu chí đánh giá minh bạch) có thể đóng gói thành phụ lục kỹ thuật của luận văn và, nếu cho phép công bố, có thể chia sẻ dưới dạng dataset kèm giấy phép (ví dụ: chỉ chia metadata + cấu trúc, không phát tán nguyên văn nếu có vấn đề bản quyền).
    • Phần so sánh RAG truyền thống vs GraphRAG trong bối cảnh câu hỏi tuyển sinh tiếng Việt đa bước có thể trở thành một case study giá trị, vì hiện chưa có nhiều benchmark dạng multi-hop tiếng Việt trong miền giáo dục đại học.

Nói cách khác: đề tài không chỉ dừng ở một sản phẩm dùng nội bộ, mà còn có tiềm năng trở thành một đóng góp được công nhận ở dạng “cách tiếp cận + bộ đánh giá + bài toán ứng dụng thực tiễn tại Việt Nam”.


6. Giá trị ứng dụng và khả năng chuyển giao

Ngoài ý nghĩa nghiên cứu, hệ thống còn có giá trị sử dụng trực tiếp: