北京大学数据分析研究中心长期致力于推动数字人文的发展。 在古汉语大语言模型的研发方面,中心设计了76类古汉语任务,整理了超过200万条微调数据。 中心针对不同任务训练了不同的模型。当前展示的是中心目前参数量最大、泛化性能最好的模型。