Hệ thống RAG (Retrieval-Augmented Generation) cho phép nạp tài liệu nội bộ — văn bản hành chính, công văn, quyết định, báo cáo, hợp đồng — và hỏi đáp có trích dẫn nguồn, kiểm soát quyền theo phòng ban. Xây dựng từ Foundation Framework custom Python + Google Vertex AI Gemini + Qdrant vector search.
Upload PDF/DOCX → OCR tự nhận diện loại văn bản, trích xuất thực thể (người, ngày, tổ chức, số tiền), đề xuất phòng ban quản lý và mức nhạy cảm.
Mọi câu trả lời đều kèm [1][2] với link tới đoạn văn nguồn. Không bịa, không nói chung chung.
Tài liệu nội bộ chỉ hiển thị với thành viên phòng quản lý + người được chia sẻ. Hỗ trợ 4 mức nhạy cảm: public / internal / restricted / confidential.
Bản nháp → Chờ duyệt → Đã duyệt → Đang dùng → Lưu trữ. Audit trail đầy đủ ai sửa gì khi nào.
Public (visitor), Research (cộng đồng nghiên cứu), Staff (nội bộ) — mỗi bot có phạm vi tài liệu riêng để tránh leak.
Trace từng query, đo độ tin cậy LLM, eval bộ 200-câu chuẩn so với baseline. Biết khi nào model trượt.
Bạn cung cấp 50-100 tài liệu mẫu. Chúng tôi build cây phân loại (taxonomy) phù hợp.
Subdomain riêng ({tổ-chức}.hcm.it.com), credentials riêng, dữ liệu cô lập.
Bulk upload qua admin UI. Staff phòng ban duyệt lifecycle workflow.
Eval 1-2 tuần với staff thật. Tinh chỉnh prompt + taxonomy theo feedback.