Model Card
Model Card — AI Mentor + Composer
Tài liệu mô tả mục đích, ranh giới, guardrails, đánh giá và xử lý dữ liệu của hệ AI Mentor + Composer mà hieu.asia đang vận hành.
1
Mục đích
- Diễn giải lá số (Tử Vi/Bát Tự/Thần Số Học/MBTI) thành insight cá nhân hoá.
- Hỗ trợ tự phản tư + decision brief + mentor chat.
- Soạn báo cáo và Cẩm Nang PDF.
2
Không dùng cho
- Chẩn đoán bệnh tật hay tư vấn y tế.
- Khuyến nghị mua/bán đầu tư cụ thể.
- Tư vấn pháp lý/tranh chấp.
- Quyết định hôn nhân/ly hôn/cưới hỏi thay người dùng.
- Phân tích về người thứ ba khi không có sự đồng ý.
3
Input
- Chart JSON (kết quả của engine deterministic).
- User context (chủ đề, tình huống, mục tiêu).
- Prompt version (hard-coded versioned).
- Mentor memory (nếu user đã đồng ý lưu).
4
Output
- Markdown report cấu trúc 9 mục H2.
- Mentor chat reply (≤ 600 chars).
- Decision Brief JSON (5 trường: realProblem, chartSignal, options, smallestNextStep, caveats).
5
Guardrails
- Chart faithfulness validator (block sao bịa).
- Safety classifier (6 categories: self_harm, mortality, medical, financial_specific, relationship_decisive, legal_specific).
- Generic-answer detector (≥2 palace refs + 1 user context + 1 action + 1 caveat).
- Refusal policy (mortality/medical/legal/financial_specific).
- Rate limit per endpoint.
6
Human review
- Prompt review trước mỗi production push.
- Sample audit ngẫu nhiên mỗi tháng (~30 reports).
- User-reported bug review trong 3 ngày làm việc.
- Algorithm changelog cập nhật mỗi engine release.
7
Known limitations
- Giờ sinh không chính xác làm giảm confidence (xem /methodology cho confidence score).
- Dị biệt giữa trường phái Tử Vi (Bắc/Trung Châu/Tử Vân/Liễu Vô) — engine dùng Bắc phái.
- AI có thể diễn giải thiếu sắc thái Tử Vi sâu sắc — vẫn cần chuyên gia cho deep reading.
- Palm Reading beta — chỉ là lớp tham chiếu phụ.
- Bát Tự beta — chưa quyết định kết luận chính.
8
Evaluation
- Golden chart dataset (đang mở rộng từ 32 → 100 lá số).
- Safety adversarial tests (100 prompts).
- User "đúng với tôi" feedback (per-section).
- Internal metrics: hallucinated star rate, generic rate, unsafe rate, refund reason breakdown.
9
Data handling
- Minimization: chỉ thu input bắt buộc.
- Retention: ảnh palm 7 ngày, mentor chat 90 ngày, audit log 12 tháng.
- Vendor processors: xem /privacy.
- User export/delete bất cứ lúc nào tại /account.
10
Model routing
- Primary: Anthropic Claude Opus.
- Fallback: OpenAI GPT (khi Anthropic 429 hoặc unavailable).
- Vision (palm): Google Gemini.
- Tất cả model có thể thay đổi — methodology không bind model cụ thể mà bind capability + guardrail.
Model card này được review cùng với prompt version. Đọc thêm /methodology cho tổng quan và /methodology/ai-safety cho safety policy chi tiết.