Email thông báo tạo tài khoản, nhận bài, duyệt bài có thể vào Spam. Vui lòng kiểm tra Spam mail và Report Not Spam để email của hội thảo vào Inbox lần sau.

27 November 2025
Trường Đại học Ngoại ngữ - Tin học TP.HCM
Asia/Ho_Chi_Minh timezone

Bridging AI and Cultural Heritage: A Domain-Specific Chatbot for Classical Sino-Vietnamese Novels

Not scheduled
20m
Phòng B.42

Phòng B.42

Tiểu ban 3: Trí tuệ Nhân tạo và Ngôn ngữ học Tính toán trong phát triển Kinh tế, Văn hóa và Xã hội Tiểu ban 3

Description

This paper presents the development of a domain-specific chatbot in the field of Sino-Vietnamese classical literature, with a focus on the fiction genre. We fine-tuned multiple large language models (LLMs) on a dataset constructed from Yuenan Hanwen Xiaoshuo Jicheng — Collected Classical Chinese Novels of Vietnam. By applying instruction-tuning techniques and conversational formatting, the models were adapted to understand, interpret, and respond to queries related to Yuenan Hanwen Xiaoshuo Jicheng in Vietnamese. Experimental results show that the fine-tuned models demonstrate strong capabilities in literary comprehension, content explanation, and user interaction. The chatbot system achieved a highest BERTScore (F1) of 78.5%, indicating its potential as an effective tool for supporting the study and dissemination of Sino-Vietnamese classical literature.

Từ khóa

Sino-Vietnamese classical literature
Yuenan Hanwen Xiaoshuo Jicheng
Domain-specific chatbot
LoRA fine-tuning
NLP for Cultural Heritage

Thông tin các tác giả

  1. Ủ Cao Kỳ Long, currently a master's student at VNUHCM – University of Science, 227 Nguyễn Văn Cừ Street, Chợ Quán Ward, Ho Chi Minh City, Vietnam. Email: ucaokylong.hardcore@gmail.com
  2. Huỳnh Thanh Xuân, currently a master's student at VNUHCM – University of Science, 227 Nguyễn Văn Cừ Street, Chợ Quán Ward, Ho Chi Minh City, Vietnam. Email: xuanhuynh233@gmail.com
  3. Phạm Hoàng Vũ, currently a master's student at VNUHCM – University of Science, 227 Nguyễn Văn Cừ Street, Chợ Quán Ward, Ho Chi Minh City, Vietnam. Email: phamhoangvu1811995@gmail.com
  4. Lưu Thiện Đức, currently a master's student at VNUHCM – University of Science, 227 Nguyễn Văn Cừ Street, Chợ Quán Ward, Ho Chi Minh City, Vietnam. Email: ducluuthien@gmail.com

Authors

Cao Ky Long U (VNUHCM-University of Science) Duc Luu Hoàng Vũ Phạm Xuân Huỳnh (Trường Đại học Khoa học tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh)

Presentation materials