日常工作中,图书馆面临着各种数据处理和服务需求,比如数据对比、数据集抽取、统计分析、数据屏蔽等。
图书馆购买了大量数据库和纸本资源之后,数据也只是停留在系统里,很难响应上面的需求。
这时候,就需要进行数据集成、质量管理、数据融合等科学的数据治理工作。
那么,有没有什么办法,可以更高效地治理文献元数据,让数据更好地为图书馆所用呢?
叮!维普智图有以下解决思路:
要让数据赋能服务,重点在于让图书馆“掌握能力”,而不只是“购买产品”。
应以数据为基础,构建新型基础设施,通过文献中心实现数据的全生命周期精细化管理,才能有效支撑图书馆服务。
文献中心是什么?
数据管理平台(DALIB)是图书馆数据基础设施,文献中心是它的核心模块之一。
维普智慧图书馆整体解决方案架构图(简略)
展开来讲,文献中心就是一套完整的文献数据治理工具,可以做到:对图书馆各类纸本和数字文献资源,以篇目级的元数据颗粒度,进行集成、规范、融合、分析与应用。
所以,文献中心可以为图书馆提供一个范围全面、质量可靠、时效及时、内容准确的馆藏文献元数据仓库,帮助图书馆开展智慧服务。
文献中心
如何帮我们治理数据?
文献中心采用数据仓库模型,
分层进行图书馆文献元数据的治理。
第一层:数据提取(ETL):收割各应用/系统数据加载到仓库,并确保两边数据的一致性。
打个比方
粮食收购商从不同的农户(数据源)那里收购了各类粮食(数据),然后将它们储存在粮仓(数据仓库)中。
这一环节,通过ETL数据加载工具,馆员可收割、集成文献元数据,定义要集成的数据范围(见下图),核对原始数据,监控集成情况。
第二层:贴源层(ODS):收割、导入或者录入后的原始数据。
打个比方
粮仓管理员对收购来的粮食进行登记入库,设定粮食的分级标准(设置数据类型、分类标准),为后续加工做准备。
这一环节,馆员可通过数据标准化工具确定图书馆行业数据的加工标准,设置数据类型、分类标准,管理数据模板。
第三层:数据仓库(DW):治理、整合、去重后的数据,并已做过标准治理。
打个比方
粮食加工厂对仓库中的粮食进行筛选、去杂、清洗,确保粮食原料的质量符合标准。
经过这一步,图书馆已经获得了标准化的文献元数据。基于此,馆员可进行元数据的汇总和管理,通过查询工具查询、修正数据。
第四层:数据集市(DM):面向服务需求,从数据仓库中抽取的小范围数据集合。
打个比方
粮食加工厂对粮食进行初步加工,形成各种基础产品(特定主题的数据集),如面粉、米粉、油脂等,以满足下游食品加工厂的不同需求。
要面向一个特定主题进行阅读推广?或为某个学院提供专业相关的科研文献数据?
抽取工具来帮忙!馆员可从数据仓库中抽取对应的数据集,为用户提供服务。
第五层:数据服务(APP):统计分析与数据供应。
打个比方
食品加工厂将基础粮食产品进一步加工为食品,如面条、面包、点心等,以满足不同消费者的口味和需求(数据供应)。
要订购新资源?先了解一下目前的馆藏建设情况?
数据分析工具必不可少。馆员可使用馆藏统计、资产画像分析、元数据对比查重等功能,掌握图书馆的文献服务支撑情况,获得资源建设决策的数据支持。
数据还能做什么?
开放,带来更多可能。文献中心的各类型知识库、数据集可通过智慧图书馆开放平台对外开放,供第三方应用调取使用。
图书馆的服务领域和能力也因数据开放而拓展,个性化的知识服务、定向的学术研究支持、跨界学术合作……
数据可复用、可挖掘
支撑多种服务场景
通过以上丰富易用的数据治理工具,图书馆构建了自己的数据基座,实现了文献元数据的高效整合与管理。
那么治理后的数据又将何去何从?如何满足馆员和读者的实际需求?
首先是数据可复用。基于这些标准化且高质量的数据,图书馆可更高效地开展知识发现、阅读推荐、学院学科数字图书馆等服务,并大幅提升服务水平。
再者是数据可挖掘、可分析。在文献中心,通过数据可视化呈现,图书馆可直观了解馆藏建设和资源分布情况,从而在采购资源时做出科学决策。
还记得开头馆员小维面临的重重困难吗?你蹲的后续来啦!
总之,文献中心是智慧图书馆多源文献资源数据的管理平台,也是创新应用的数据源泉,可为未来个性化服务、智能决策、教学科研知识服务等提供有力支撑!
免费试用
看到这里,各位馆员是否也跃跃欲试了呢?
感谢您的关注和支持噢!