资治通鉴知识服务系统
《资治通鉴》二百九十四卷,北 宋司马光等撰,记载了周威烈王二十 三年(前403)至后周世宗显德六年(959)间1363年的历史,在收集史 料、考订事实、编排年月及文字剪裁 润色等方面,都代表了我国古代编年 体史书的最高成就,是古代历史研究 的最重要典籍之一。元代胡三省对《资治通鉴》进行了详细的校勘和注 释,是公认最好的注本。
系统设计理念
本系统基于知识本体(ontology)和语义网络(semantic network)技术,通 过对《资治通鉴》文本的深度加工和知识 重组,将文本内所有的人名、地名、职官、 机构、时间、事件等类型数据进行本体化处理,实现基于语义的检索、基于信息重组的分类导航、基于扩展知识服务的阅读浏览功能。
与一般的数据库不同,本系统通过本 体化标记和关联,可以进行全景分析、人 物相关性分析、事件-时间统计分析等大 规模数据分析,是利用计算机分析技术对 传统古籍进行知识挖掘的成功探索。
系统内容特色
原始数据可靠
文本数据来自《资治通鉴(全20册)》(〔宋〕司马光编著〔元〕胡三省音注, ISBN 978-7-101-08112-1,总字数600万),是目前最权威的整理本,由中华书局有限公 司出版,并授权在本系统使用。
本体标记科学规范 数量庞大
各种类型的文本标记和本体数据库建设,由北京大学数据分析研究中心相关领域专家提出规范、监制实施并进行数据核验。 本体和标记的类型丰富,数量极为庞大,具体如下:
类型 | 本体数量 | 标记数量 |
时间 | 3,451,135 | 60,607 |
地名 | 52,858 | 219,385 |
机构 |
2,621 |
|
职官 | 21,749 | 48,450 |
人物 | 36,482 | 284,345 |
文献 |
4,322 |
32,831 |
事件 | 21,595 | |
合计 | 3,590,762 | 645,618 |
便捷导航和友好阅读
系统提供了知识分类导航-辞典式阅读和文本卷次导航-篇章式阅读两种导航、阅读方式。文本中所有时 间、地点、职官、人物和文献均作为知识点进行了标记, 并用不同颜色的下划线标注。点击某一标记,会在右侧 显示该标记的详细信息和在全书中出现的所有位置。
多条件检索和语义检索
检索功能分人物、地点、职官、事件和全文检索。
各类检索下又包含若干检索条件,可以进行单条件或组合条件检索。全文检索支持语义检索,如检索人物“李世民”, 能同时找到确指同一人的世民、秦王、敦煌王、文皇帝 等结果。这是一般关键字检索或同义词检索无法做到的。
数据分析之全景分析功能
针对人物、地点、职官、时间等本体类 型,生成相应的全景 分析图,以图表的方 式,详细展示该本体 与其他各类本体之间 的关系。点击链接, 可以实现本体之间的 快速跳转。右图为人 物本体“李世民”的 全景分析图。
数据分析之 人物相关性分析功能
分析人物与人物之间的关系。如输入“李世民”和 “李渊”,系统以图表的方式,展示两人的血缘关系、 职官关系以及共同参与的事件。
数据分析之 事件-时间统计分析功能
分析事件与时间之间的关系,以朝代、月、日、节日、节气等为横坐标,自动生成结果图。通过分析图表,可以得到不同类型事件在历史上的发展轨迹,进一步揭 示数据背后隐藏的丰富知识。