关闭

王东波教授团队荀子古籍大语言模型获中央网信办备案

2025/05/20 来源:信息管理学院 作者:

512日,江苏省委网信办对外公布江苏省第七批通过国家生成式人工智能服务备案的5款大模型,荀子古籍大语言模型位列其中。

荀子古籍大语言模型由南京农业大学王东波教授团队主导研发,是江苏省首个完全以高校为主体完成国家生成式人工智能服务备案的大语言模型。该模型依托南京农业大学的高性能算力基础设施支持,结合课题组在古籍数字化领域​​十余年的数据积累,实现了古籍传承与人工智能技术的深度融合。这一成果不仅彰显了高校在科研创新中的重要地位,也为江苏省大模型产业注入了学术化、专业化的新动能。​​

作为古籍智能处理领域的开创性成果,荀子是国内首个全开源的专注于古籍活化利用的垂直大语言模型。其核心功能涵盖古籍智能标引、信息抽取、诗歌生成、高质量翻译、词法分析、自动标点等场景。例如,模型可自动识别《史记》中的人物关系并生成知识图谱,或对未句读的文言文进行精准断句和翻译,极大提升了古籍在广大群众中的推广传播效率。此外,该模型的开源性、公益性特点,使其成为古籍活化的标杆工具,为古籍数字化研究提供了更加坚实的基础。

在全国范围内,荀子古籍大语言模型是第二个以高校为主体成功备案的大语言模型。研发团队依托国家社科基金重大项目,构建了覆盖《四库全书》等传世古籍的40亿字混合语料库,并通过创新的古籍-现代汉语混合训练技术,突破了通用大模型在古文理解与生成中的瓶颈。这一成就不仅填补了古籍领域大语言模型的空白,更标志着高校在人工智能技术攻关中的重要作用,为后续产学研合作提供了示范。

王东波教授介绍,荀子古籍大语言模型的备案,具有三大核心价值的体现:一是以南京农业大学学术积累为根基,推动古籍研究从数字化向智能化转型的学术引领;二是以首创ACHeval评测基准和混合训练策略,兼顾古文处理与现代汉语能力的技术突破;三是通过全面开源模式降低古籍研究门槛,助力全球学者探索中华文明的文化传承。

据悉,荀子古籍大语言模型将深化人工智能技术在​​古籍整理、保护、转化、增强上的应用,进一步推动古籍活化在人工智能时代的创新性发展。


阅读次数:99

【 转载本网文章请注明出处 】

编辑:

审核:

校对:

图片:

通知公告

通知公告