发布时间: 2023-09-13

智慧图书馆的全数据体系研究

《图书馆情报工作》2023年第13期刊发杨新涯等《智慧图书馆的全数据体系研究》。文章认为,数据是智慧服务的基石,智慧图书馆从理论研究走向实践阶段,更加需要数据的支撑,因此开展智慧图书馆全数据体系的研究,强化智慧图书馆所需的完整的数据构建与治理,这对智慧图书馆的建设和发展具有重要意义。文章从数字阅读的细节和零数据两个点状单元,论证了更加细粒度、更加重视被忽略的数据等与可见的数据共同形成全数据体系,对于智慧图书馆管理和服务具有十分重要的价值,提出智慧图书馆的全数据体系和图书馆应具备的关键数据能力。

智慧图书馆全数据体系的初步架构


1. 文献元数据

纸质文献和数字文献是图书馆最重要的两类文献,纸质文献一般指以纸本为载体的书、报、刊,数字文献包括电子图书、电子期刊、学位论文、标准及视频等。纸质文献的元数据在文献采访、编目、典藏后生成,可通过图书馆内部的业务系统获取,具有来源和管理流程稳定、维护方便的特点。数字文献的元数据由数据库商提供,由于数据库商对元数据的保护意识较强,特别是对于电子期刊篇级文献元数据的保护,导致图书馆对数字文献的元数据获取比较被动,并且各个数据库商在元数据提交方式、数据格式、更新周期方面可能存在不一致性,使得数字文献元数 据具有获取困难、时效性难以保证、数据清洗难度大等特点。虽然纸质文献和数字文献的元数据在来源和获取难易程度上区别显著,但在纸电合一的刚需前提下,二者必须进行有效集中,构建统一标准下的集中式文献元数据库,包括内容、载体、权利和关系等描述数据。


2. 文献内容数据化数据

文献的全文数字化为知识传播提供了极大的便利,但从文献中提取的知识仍然需要读者进行大量阅读和分析,知识获取的高效性问题一直困扰着众多读者。将主要以 PDF 形式传播的文献转化为计算机可以量化计算、分析组织的结构化数据,即文献内容数据化数据,是突破上述困境的有效途径。文献内容数据化数据的生成一般以数字化文献为依托,利用深度学习、自然语言处理等关键技术,完成对文献内容的词汇抽取、实体及关系识别、篇章结构识别等处理后形成数据集或数据模型,用于数据的二次组织和呈现。因此,文献内容数据化数据来源于对文献的数据化处理,具有对技术要求高、获取难度大、数据灵活度高、利用价值大的特点。


3. 全面信息管理系统的运行数据

实现图书馆运行管理的全面信息化是智慧图书馆构建的基本目标之一。随着图书馆信息管理系统的不断完善,图书馆的运行数据从原始的手工记录状态逐步过渡到计算机管理状态,图书馆可以比较便捷地通过查看若干信息管理系统的运行日志或统计分析结果获取到图书馆的运行数据。由于不同的业务单元分布于不同的系统内,单个信息系统获取到的运行数据可能存在单一化的不足,不能全面反映图书馆的运行状况,如独立的用户数据、资源数据以及各级事实数据。可以通过建立统一的运行数据中心实现数据的交互融合,以帮助图书馆高效地掌控运行情况。因此, 运行数据的底层来源就是各个独立的信息管理系统, 表层来源就是运行数据中心,其具有分布广泛、数据量大的特点。


4. 读者行为数据

读者行为数据是图书馆服务效果的直观体现,是图书馆全数据体系的核心组成部分。按读者行为发生的场所分类,可以将读者行为数据分为实体空间行为数据和虚拟空间行为数据两大类,实体空间行为数据包括到馆数据、纸本图书借阅数据、线下活动参与数据、设施设备使用数据等,虚拟空间行为数据包括系统的访问数据、检索数据、阅读数据、下载数据、评论数据、收藏数据、线上活动参与数据等。这些数据依托于读者卡被记录和管理,用于分析和判断读者偏好及其接受服务的情况。读者行为数据的来源既包括图书馆的管理系统,如业务系统的借阅行为数据,也包括各个服务系统,如空间管理系统的座位预约数据,其具有分布广泛、数据量大、数据交互性强、数据价值高的特点。


5. 支撑智慧图书馆系统的知识库

知识库的构建实际上是将数据规范组织后转化为知识的过程,知识库的重点是对数据的序化,体现的是对数据的利用能力。按知识库的用途可以将图书馆的知识库分为五大类,分别是:①馆务支持类,用于支持图书馆基本业务的开展,如咨询知识库;②智慧服务类知识库,如推荐知识库;③成果管理类知识库,如机构知识库;④教学辅助类知识库,如课件知识库; ⑤科研辅助类知识库,如专题知识库。这些知识库共同支撑起智慧图书馆系统的智慧能力。由于涉及面广,数据内容多,可以充分利用图书馆的共建共享体系,多个图书馆任务分担,共建知识库。


6. 零数据

图书馆的零数据主要有零借阅数据,包括零借阅图书和零借阅读者,零到馆数据、零被引数据等,产生的原因包括服务宣传不到位、服务与需求的偏差、系统故障等。零数据提示了图书馆以往工作的欠缺,通过零数据开展反向服务,将为图书馆工作带来新的突破。它由于数据值为 0,通常不被记录,需要通过非 0 数据间的比对来获取,如零借阅图书,通过馆藏图书数据与借阅数据的比对产生,因此其具有产生的间接性、利用的高价值性等特点。笔者近两年对零数据的价值及其应用进行了系统研究,认为零数据一旦 产生必然代表着问题的出现,并且通过对症下药及时采取措施,问题将会迅速得到改善,关注零数据对发现突出问题和改进工作的作用非常显著。零数据主要 的价值和应用具体体现在以下方面:①强化运行监控,避免出现零效能运转,零数据的产生极大可能表明设备故障或服务设计与读者偏好出现严重偏差,需要立即采取措施排除故障;②帮助深入分析用户并挖掘潜在用户,活跃用户使用图书馆主要靠内在需求驱动,事实上并不是图书馆服务客观真实价值的反映,而唤醒零数据的沉睡读者,帮助其更好地了解和使用图书馆服务才是图书馆价值的体现;③优化文献资源配置和推广,文献资源是图书馆最重要的组成部分,关注资源使用的零数据将有利于合理采购资源、陈列资源和推广资源。


企业微信截图_20230914101257.png


智慧图书馆六种关键的数据能力


1. 数据的集中管理能力

2. 数据的整合应用能力

3. 文献资源的数据化能力

4. 提高智慧服务感知度的行为数据应用能力

5. 知识库的数据共建共享能力

6. 零数据的分析能力

通过智慧图书馆构建全数据体系以及六种关键的数据能力,提升图书馆的数据管理、数据分析、数据服务效能,实现图书馆的全面信息化管理,将有助于缩小大型图书馆、中型图书馆和小型图书馆之间由于人力、财力和物力资源的不平衡带来的差距,这也是建设智慧图书馆的重要目标。


数据已然影响着各行各业的创新发展,毋庸置疑 数据也是实现智慧图书馆的必备条件。目前图书馆在数据管理方面还存在数据不全面、数据应用困难等短板,这在智慧图书馆实践的过程中都亟待解决。但就以往的情况来看,众多图书馆普遍关注智慧服务的形式、内容以及效果,将智慧服务寄托于信息化系统、智能化设备等软硬件的堆砌和重复使用,却一直疏于数据基础工程的构建,结果将是让读者迷失于大量割裂的系统和设备中,无法感知智慧带来的益处。


表层智慧的达成,本质上来源于对数据的有效整合和利用。智慧图书馆需要在全数据体系的构建与数据深度交互的前提下,创新性地对图书馆管理和服务内容进行顶层设计和集中展示。期待更多的学者和行业专家加入到智慧图书馆的全数据体系的研究和实践中,推进标准化建设,同时倡导图书馆之间、图书馆与技术公司之间的深度合作,共同推动数据驱动的智慧图书馆的构建。




摘编自:[1]杨新涯,文佩丹,卓应忠.智慧图书馆的全数据体系研究[J].图书情报工作,2023,67(13):29-35.

在线咨询
您的每一次提问,都能得到满意的回答!
申请试用
免费试用,体验智慧服务!
意见反馈
我们期待您的声音!