Tạo tăng cường truy xuất RAG (Retrieval Augmented Generation)

LLM có thể đưa ra kết quả không chính xác trong thực tế, đối mặt với thách thức như hiểu được lập luận pháp lý phức tạp, đảm bảo tính minh bạch và tránh các phản hồi gây hiểu nhầm. Làm thế nào để mô hình ngôn ngữ lớn có thể trả lời các câu hỏi pháp luật một cách chính xác?

Trong phạm vi đồ án này, em sử dụng RAG để để tăng cường khả năng truy xuất tri thức từ các văn bản pháp luật, giúp mô hình ngôn ngữ lớn đưa ra câu trả lời chính xác hơn, có căn cứ pháp lý rõ ràng và giảm thiểu hiện tượng hallucination so với mô hình LLM truyền thống. Thay vì “đoán”, LLM sẽ dựa vào dữ liệu thật từ đó cung cấp nguồn dẫn chứng rõ ràng cho người dùng.

alt text

Tuy nhiên RAG đơn giản thì độ chính xác chưa cao và vẫn có thể sai sót vì vậy em sử dụng Agentic RAG để tăng độ chính xác và hạn chế ảo giác vì miền tư vấn pháp luật yêu cầu độ chính xác cao.

alt text

Sơ đồ Agentic RAG dự án này:

https://github.com/20206205Tech/code-chatbot-service/blob/main/docs/diagram.png