Tiến độ

Công việc

Link:


Tiến độ

Tuần 1 - 7.4

Tuần 2 - 13.4


Khó khăn: Có nhiều kiến thức và kĩ thuật trong lĩnh vực này và chưa tìm hiểu hết và nắm rõ được

Tuần 3 - 20.4

Tuần 4 - 27.4

Tuần 5

Tuần 6 4.5

Tuần 7 11.5

Note


Tuần tới
Đầu tiên là hướng đến là

Questions

Trong quá trình em tìm hiểu và tham khảo


Thầy cho em xin kinh nghiệm là em nên đánh topics và tags


Sai xót



Tuần 8.



Tạo ra thử project của 1 gmail và resquest thử xem nó như thế nào. 2 cái nó có trung 1 bill không

Tuần 8 18.5

Tuần 9 25.5

Tuần 10 1.6

Viết code về Graph rag bao gồm xử lý data chunk, Query engine, Visualize đường đi lại, tìm ra được.
Test và tìm lỗi trong code
Thực nghiệm với 1 trường BKU và test ra các kết quả
Xây dựng data để làm benchmark


TUần 9- 8/6

Lấy của duy để có gợi ý làm

- điều chỉnh boost điểm rerank cho yếu tố thời gian (mới > cũ)
- xây dựng benchmark cho 2 phần là retrieval và generation:
+ retrieval: Recall@k, MRR và Hit@k
+ generation: ROUGE-L, BERTScore, ChrF và Avg Similarity (so với eval chuẩn nhưng chưa có) và Avg LLM latency
- gặp vấn đề với bộ QA chưa đủ chính xác (do dùng Gemini), khó khăn trong việc tạo nên bộ benchmark chuẩn khi không có bộ evaluation đủ tốt
- tìm hiểu và thấy được tập dataset https://huggingface.co/datasets/thangvip/vilawqa-syllo đầy đủ thông tin, đang trong quá trình tìm hiểu và tái sử dụng 1 số lượng nhỏ dữ liệu (dataset có 1000 dòng với 5 columns: question, syllogysim_answer, domain, refs, reference_texts)
- tìm hiểu tạo tập evaluation để tạo cặp QA cho các câu hỏi pháp luật
- tiếp tục điều chỉnh prompt tối ưu
- thiết lập prompt cho model Gemini để tạo các cặp QA bao gồm nguồn cho câu trả lời với input là các văn bản pháp luật gốc đã được làm sạch

Tạo ra thêm data để test đủ hơn nhiều khía cạnh trong knowledge.
Cần làm data embedding để lấy đánh giá.
THì neoj4 tách thử thể và benchmark thế nào. Cần chỉ số gì để so sánh.


Cần là benchmark cho dữ liệu.
Thực nghiệm với nhiều Embedding model


Cần đi sâu 1 vô một model đi sâu vào data của model mình lấy tầm 3B gì đó để có


NEoj4 -> ....

Còn generate bằng model 2.5 - Tầm Tầm 2 Tiếng. Để generate.


Tuần 10 15/8

Dữ liệu

Nhận xét:

ragas_results_20flash_gemi_emb2

Metric Average Count <0.5 Count ≥0.5
faithfulness 0.9450 8 280
answer_relevancy 0.3763 125 163
context_recall 0.4647 139 149
context_precision 0.5069 142 146
semantic_similarity 0.8115 0 288
answer_correctness 0.3805 211 77

Hạn chế:

Thầy nói l


12/7/2025

Trường Chunk cũ Chunk mới Tăng/Giảm % thay đổi
VLU 79 271 +192 +243%
TDTU 78 399 +321 +411%
NTTU 77 180 +103 +134%
HCMUE 74 354 +280 +378%
OU 65 231 +166 +255%
HCMUTE 59 188 +129 +219%
UMP 50 206 +156 +312%
UEH 47 242 +195 +415%
UIT 47 221 +174 +370%
BKU 43 216 +173 +402%
UFM 28 189 +161 +575%
HCMUS 27 149 +122 +452%
FTU2 24 107 +83 +346%
FPT 23 124 +101 +439%
PNTU 16 75 +59 +369%
Tổng 737 3,152 +2,415 +327%

Saved combined data to: [E:\LLM_clone\KLTN\notebook\analyzeData\SemanticChunks\All_university.xlsx](file:///E:/LLM_clone/KLTN/notebook/analyzeData/SemanticChunks/All_university.xlsx)
KỊCH BẢN HỘI THOẠI CHATBOT TUYỂN SINH (PHÂN THEO 9 INTENT)


🔹 INTENT 1: Thông tin chung về trường

Mục tiêu: Giới thiệu cơ bản về tên trường, địa chỉ, sứ mệnh, website, liên hệ.


🔹 INTENT 2: Ngành đào tạo và chương trình học

Mục tiêu: Giới thiệu ngành học, chuyên ngành, mô tả ngành, thời gian đào tạo.


🔹 INTENT 3: Chỉ tiêu tuyển sinh

Mục tiêu: Thông tin số lượng chỉ tiêu, ngành, hình thức tuyển sinh.


🔹 INTENT 4: Điều kiện nhập học và học phí

Mục tiêu: Cung cấp điều kiện đầu vào, giấy tờ, mức học phí, học bổng.


🔹 INTENT 5: Lịch trình tuyển sinh

Mục tiêu: Cung cấp các mốc thời gian nhận hồ sơ, thi, nhập học...


🔹 INTENT 6: Chính sách hỗ trợ sinh viên

Mục tiêu: Giới thiệu các chính sách vay vốn, học tập, việc làm sau tốt nghiệp.


🔹 INTENT 7: Cơ sở vật chất

Mục tiêu: Cung cấp thông tin về thư viện, KTX, phòng lab, cơ sở đào tạo.


🔹 INTENT 8: Chương trình đào tạo đặc biệt

Mục tiêu: Liên kết quốc tế, thạc sĩ, học song bằng.


🔹 INTENT 9: So sánh trường theo mục tiêu cá nhân

Mục tiêu: Hướng người học chọn đúng trường/ngành phù hợp định hướng cá nhân.


23/5/2025

9/8

https://medium.com/@rajveer.rathod1301/evaluating-llm-responses-with-deepeval-library-a-comprehensive-practical-guide-e55ef1f9eeab

16/8

CÒn những gì

HCMUE, FTU2, HCMUS, UIT , VLU
https://chatgpt.com/c/68a9c739-664c-8326-b1f3-b504911c1330?model=gpt-5-thinking