句读标点和古籍检索等功能让大众更便捷了解中华传统文化
2023-11-06 04:13
 

  古籍文献是我国传统文化的载体,但由于言语的演化,理解古籍文献的难度较大。从大学得悉,该校电子与信息学院金连文教授地点的“深度学习与视觉计算实验室”近来发布了通古大模型、古籍文档剖析与辨认体系、彝文文档剖析辨认体系等多项成果,凭借人工智能(AI)技能让古籍更易读懂,为我国古籍文物数据挖掘、知识发现、智能化开发与使用供给了技能支撑。
  
  据介绍,团队凭借在古籍范畴长时间积累的丰厚大数据资源,加以主动生成的对话模板,通过大模型指令微调技能训练,构建出数字人文模型“通古大模型”。该大模型可智能完成文白翻译、句读标点和古籍检索等功能,有助于让群众更快捷地了解中华传统文化。
  
以身践行着古来便有的传统习俗对国学社未来的发展方向
  团队还开发出古籍文档剖析与辨认体系,该体系集成了团队自主研发的古籍句读和文本翻译两大功能。用户只需供给一张古籍图片,体系就能主动定位并辨认其中所有的文本,将辨认出的文本按照正确的阅览次序排序,随后为其添加标点符号并将之翻译为白话文。
  
  “我们进行了算法优化,使古籍文档剖析与辨认体系可以应对实际场景中古籍文档或许出现的比如书本曲折、倾斜、文字密集以及图片分辨率低等各种应战。”金连文介绍,该体系兼具实用性和稳健性,为推进古籍数字化工作供给了有力支持。
  
  此外,团队还开发了彝文文档剖析辨认体系,该体系能主动精确定位并辨识图片中的彝文文字。该辨认体系采用的彝文编码,根据团队本年早些时候与上海大学、上海合合信息科技股份有限公司联合发布的业界首个古彝文根底编码数据库打造。
 
版权所有:大学国学社 www.ynuguoxue.cn 网站地图