您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页数字图书馆集中存储系统的规划和建设探讨

数字图书馆集中存储系统的规划和建设探讨

来源:化拓教育网


数字图书馆集中存储系统的规划和建设探讨

【摘要】数字化图书馆的发展,要求对图书馆的数字资源存储系统进行统一规划和建设。文章分析了图书馆的数字资源类型和存储需求,介绍了几种主要的存储技术,并提出了数字图书馆的集中存储系统方案。

【关键词】数字图书馆;存储技术;NAS;SAN

数字图书馆是当前国内外图书馆发展的方向和重点,与传统的图书相比,数字资源具有信息存储量大,检索方便的特点,可依托于互联网进行远程传递和信息共享,这在很大程度上提高了资源的利用率。

随着这些年数字化建设和服务的深化发展,数字馆藏的容量,由早期的GB,到现在的以TB乃至PB为单位来计算,对存储空间的需求不断膨胀,与此同时,存储技术也在不断的发展,从性能到应用模式都有了质的提升,存储逐渐从主机系统中剥离出来,与网络技术融合成为的系统。将各类数字资源的存储作为一个整体来规划,设计一个切实可行的存储系统方案,实现数据的集中存储、分析和共享,成为数字图书馆建设的首要任务。

1.图书馆数字资源的类型及存储需求

图书馆的馆藏数字资源大致可以分为四大类:外购的数字化资源、自建的数字化资源、随书光盘及多媒体、应用系统的数据库。

外购的数字化资源是数字图书馆的主要组成部分,它可以是目录或索引,也可能是全文,或者是某个数据库的本地镜像,如CNKI学术期刊全文数据库、超星数据库、学位论文全文数据库、万方数据库等电子期刊与图书数据。这类资源占用存储空间很大,用户访问量也高,而且增长迅速。

自建的数字化资源,指的是图书馆自己加工制作的数字资源,如馆藏图书的数字化产品、特色资源数据库、专题研究数据库等。

随书光盘及多媒体,包括教学视听资料、随书光盘等多媒体资源,这类资源访问频率不算高,但读取数据流量非常大,需要较高的传输性能才能保障良好的利用效果。还有现在越来越多的视频流媒体资源,这类资源直观、有趣味性,更容易让读者所接受,因而访问频率较高,数据的流量也较前更大,需要有非常好的传输性和网络带宽,才能保证数据流的流畅回放。

应用系统的数据库,这是数字图书馆的核心数据,包括图书馆集成管理系统的数据库、数字资源平台及网站数据库、专题库等。这类资源占用的存储空间较少,增长量也不大,但对存储的性能和数据安全性,有非常严格的要求。

以一个中型图书馆为例,其数字馆藏的规模和存储的需求大致如表1:

2.主要存储技术的介绍和比较

目前存储应用的体系结构,主要有

直连式存储(Direct Attached Storage

简称DAS)、网络接入存储(NetworkAtt-ached Storage,简称NAS)和存储区域网(Storage Area Network,简称SAN)三种模式。

2.1 DAS方式

DAS是以服务器为中心的存储体系,外部数据存储设备(如磁盘阵列、光盘机、磁带机等)服务器的一部分,通过SCSI等接口电缆直接挂接在服务器内部总线上。该服务器同时也是应用程序的运行平台,即数据访问与操作系统、文件系统和服务程序紧密相关。

DAS方式能够解决单台服务器的存储空间扩展、高性能传输需求,此外,DAS还可以构成基于磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。但DAS方式的缺点在于,不同服务器不同应用上的存储资源相互隔离,容易形成孤岛,不利于数字资源的统一管理和存储空间的调配,此外,它依赖于服务进行数据的I/O读写和存储维护管理,占用服务器资源(包括CPU、系统I/O等),容易影响各应用服务器的性能。目前,DAS仍然是图书馆的数字资源的存储模式之一,但已远远不能满足数字图书馆发展的需求。

2.2 NAS方式

NAS是一种专业的网络文件存储及文件备份设备,或称为网络直联存储设备、网络磁盘阵列。NAS将存储设备通过标准的网络拓扑结构连接,可以无需服务器直接上网,整个系统的管理和设置较为简单。应用服务器通过NFS格式(Unix,Linux的网络文件系统)和CIFS格式(基于Windows的普通互联文件系统)、HTTP等访问该存储设备,在局域网环境下、NAS可实现异构平台之间的数据级共享。另外,通过NAS服务器可设定用户的访问权限,控制文件的读写,以保证数据的安全性。

NAS存储系统操作简单,容易管理、配置灵活、数据备份简单,适于文件共享,以及分布式的应用环境。NAS方式的主要缺点来自于数据的存储必须依赖现有的网络结构。当进行大数据量存储时,网络负载大大增加,影响到整个网络的通讯,自身的存取速度也随之下降,无法提供快速数据服务,不大适用于数据流量大且对响应速度要求较高的数字资源。

2.3 SAN方式

SAN采用了光纤通道(Fibre Channel)技术,通过光纤交换机连接存储阵列

和服务器主机,建立专用于数据存储的区域网络,然后这个网络再与特定的局域网进行连接。数据存取通过SAN网络在相关服务器和后台的存储设备之间高速传输,对于LAN的带宽占用几乎为零,而且服务器可以访问SAN上的任何一个存储设备,提高了数据的可用性。

采用SAN方式的存储系统,可以使数据的存储、备份等活动在原先的局域网之外,从而将减轻局域网络的负载,保证原有网络应用的顺畅进行;同时SAN网采用光纤传输通道,可以得到高速的数据传输率,适用于对性能和可靠性要求较高的应用。S AN将企业的存储和服务器平台分开,可实现24 x 7不间断的系统可用性和集中管理,在这个平台的基础上,还可以应用一套统一的灾难恢复解决方案,同时可经济高效地扩展存储空间,因此适用于存放图书馆的关键数据库。但SAN方式要发挥其最大优势,需要有专用的备份与存储管理软件来支持,SAN交换机的端口数量随服务器数量的增加而增加,每个接入的服务器还配置较昂贵的HBA卡,除此以外,其复杂的管理软件需要定制安装和专业人员维护,这使得SAN的建设费用较前两种方式昂贵了许多。

3.数字图书馆的集中存储系统方案

通过以上几种存储技术的介绍和比较,总的来说,NAS和SAN方式的集中存储系统模式,能较好地满足目前数字图书馆建设和服务的需求,但单纯采用SAN或NAS还是无法达到理想的效果。为保证数字资源在不同硬件平台、不同操作系统下无缝连接和使用,图书馆在进行存储系统的规划和建设的过程中,应该结合自身的资金、技术力量、应用方向等实际情况,认真设计存储方案,选择适合的存储设备。

理想的存储系统方案,是采用NAS+SAN存储方式,这是在目前技术水平下最佳的方案,也是数字图书馆数据存储系统的发展方向,它可以将存储架构的开放性、存储硬件的兼容性、存储软件的适应性融合在一起,SAN提供速度,NAS提供在文件处理时的协作性,它们的结合为关键存储系统的实施提供了完美的解决方案。

以表1中各类数字资源的规模和存储需求为例,可以采用表2的集中存储系统结构:

限于技术力量和资金,目前相当一部分图书馆在规划存储系统时,采用的还是纯NAS的存储系统方案,因为NAS基于IP协议,可以很方便地接入局域网,部署与管理方便,成本也相对便宜。更重要的是NAS可以直接对文件进行I/O读写,所以具有文件检索的优势,可以支持目前数字图书馆的大部分应用系统数据库和电子图书、电子期刊、多媒体等数字资源。此外,中小型图书馆偏向于继续使用DAS方式的存储系统,因为DAS实现容易、管理集中且费用最便宜。纯SAN的存储系统,可以提供更高速的网络服务,对于视频点播和光盘浏览等支持较好,以这方面的数字资源服务为重点、资金充足、规模较大的图书馆,也可以考虑采取这种方案。

表2 集中存储系统结构

资源类型 存储容量 存储接入方式

外购的数字资源 10T~100T NAS

自建数字资源 5T~50T SAN

应用系统的数据库 5T以内 SAN

随书光盘及多媒体 5T~1P NAS

4.结语

图书馆馆藏数字资源不断增长的同时,提供的数字化服务内容也日益丰富。规划和构建集多种技术产品为一体的集中存储系统,是图书馆提供多样化和深层次服务的基础,也将促进数字图书馆的建设和发展。

参考文献

[1]刘玉照,刘建准,岳修志.基于SAN与NAS混合模式的数字图书馆网络存储系统研究[J].图书馆工作与研究,2006(05):18-21.

[2]马东.基于IP-SAN架构的数字图书馆混合存储系统构建研究[J].河南图书馆学刊,2008(02):107-109.

[3]刘荣发.数字图书馆光纤存储系统建设与性能优化[J].现代图书情报技术,2008(07):70-74.

[4]金文新.高校图书馆存储系统的构建及其数据安全和备份方案研究[J].情报资料工作,2009(01):40-43.

[5]窦天芳等.清华大学图书馆集中存储系统的规划与实施[J].大学图书馆学报,2008(04)63-67.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务