人民日报出版社主管 人民周刊杂志社主办

010-65363526rmzk001@163.com
首页 > 栏目 > 科学 > 正文

中华经典资源库、古汉语大语言模型等成果涌现

生僻字更易输入 文言文更快释读

本报记者 丁雅诵    2025-04-09 09:08:00    人民日报

“頔”寓意美好、“燊”表示炽盛、“鋆”意为金子……古籍里的这些生僻字,曾因无法输入电脑,给文化传承、学术研究,乃至人们日常生活带来不便。数字时代,如何让汉语言文字更完整地活跃在“云”端?

日前,教育部围绕推进语言文字信息化发展举办新闻发布会。“从‘铅与火’到‘光与电’,中文信息处理技术不断创新发展。”北京大学王选研究所所长汤帜介绍,北京大学作为国家语委中文文字字体设计与研究中心的依托单位,设计开发国家重大基础性规范《通用规范汉字表》的配套字库,研制人口信息生僻字超大字库解决方案,在第二代居民身份证、护照上应用,协助解决银行、税务等社会应用系统的人名、地名缺字问题。

语言文字信息化是经济社会信息化的重要组成部分,是数字中国建设的基础性工作。记者了解到,近年来,教育部联合有关部门发布了国家通用语言文字和民族语言文字信息化规范标准100多项,推动建成国家语委媒体语言语料库、冬奥会多语言术语库等,上线国家语言资源服务平台、中国语言文字数字博物馆等,持续推动语言文化资源共建共享。

随着智慧化学习的广泛开展,语言文化优质资源惠及更多人。教育部语言文字信息管理司司长刘培俊介绍,为推进语教融合,教育部打造“中华经典资源库”,总浏览量超6000万;打造“中小学语文示范诵读库”,惠及全国约1.6亿中小学生和上千万教师及社会大众;上线中国语言文字数字博物馆,收纳海量资源,构建全民学习新课堂。

此外,数智赋能也让国家通用语言文字推广普及效率不断提升。目前,普通话测试方式已实现从人工到智能的转变,机辅测试已服务超过9200万人次。广东省教育厅副厅长朱建华介绍:“我们支持研发普通话水平智能测试舱、声纹分析系统等,打造了全国首个以智能化为核心的普通话水平测试智慧考场,能够做到‘随到随考’。”

语言文字信息化让古籍里的文字展现出新的活力。打开“AI太炎”古汉语大语言模型,输入待分析的古籍文本,系统便能根据用户选择进行释读,包括字词释义、文白翻译、句读标点、用典分析等。北京师范大学党委常委、副校长康震介绍,“‘AI太炎’依靠自主可控、安全可信的技术路线,理解力强、准确率高,能够高质量完成多种文言文理解任务,目前已广泛应用于学术科研、基础教育、编辑出版等多个领域。”

近日,教育部、国家语委、中央网信办共同印发《关于加强数字中文建设  推进语言文字信息化发展的意见》。意见提出创新应用自然语言处理、大语言模型、多模态信息处理、知识图谱、语料加工等5项前沿技术。

“我们要将数字中文建设作为全面推进语言文字信息化发展的突出重点,服务大语言模型等人工智能技术创新应用‘制高点’,夯实国家关键语料基础设施‘新基建’,全方位释放语言文字在经济社会发展中的数据要素价值。”刘培俊说。

 

《人民日报》(2025年04月09日 第 04 版)

(责编:张若涵)

相关热词搜索:

上一篇:相隔一万多公里,如何分发量子密钥
下一篇:最后一页

人民周刊网版权及免责声明:

1.凡本网注明“来源:人民周刊网”或“来源:人民周刊”的所有作品,版权均属于人民周刊网(本网另有声明的除外);未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品;已经与本网签署相关授权使用协议的单位及个人,应注意作品中是否有相应的授权使用限制声明,不得违反限制声明,且在授权范围内使用时应注明“来源:人民周刊网”或“来源:人民周刊”。违反前述声明者,本网将追究其相关法律责任。

2.本网所有的图片作品中,即使注明“来源:人民周刊网”及/或标有“人民周刊网(www.peopleweekly.cn)”“人民周刊”水印,但并不代表本网对该等图片作品享有许可他人使用的权利;已经与本网签署相关授权使用协议的单位及个人,仅有权在授权范围内使用图片中明确注明“人民周刊网记者XXX摄”或“人民周刊记者XXX摄”的图片作品,否则,一切不利后果自行承担。

3.凡本网注明“来源:XXX(非人民周刊网或人民周刊)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

4.如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 联系电话:010-65363526 邮箱:rmzk001@163.com