分类筛选
分类筛选:

关于大学图书馆方面本科论文开题报告范文 和856字段的网址管理以武汉大学图书馆为例相关论文写作技巧范文

版权:原创标记原创 主题:大学图书馆范文 类别:发表论文 2023-12-29

《856字段的网址管理以武汉大学图书馆为例》

本文是大学图书馆有关论文例文与武汉大学和856字段和图书馆类硕士论文开题报告范文。

摘 要 文章针对MARC记录856$u子字段的网址失效问题,从网址来源及图书馆管理的角度分析856字段网址管理的复杂性;探讨符合需求的856字段网址应具有的特性;阐述网址管理应遵循的原则及策略;介绍武汉大学图书馆西文书目库856字段的网址管理实践.

关键词 856字段 网址管理 X URL 武汉大学图书馆

引用本文格式 程颖. 856字段的网址管理探索——以武汉大学图书馆为例[J]. 图书馆论坛,2016(10):102-106.

Exploration on the Management of Network Address in Field 856

——Taking Wuhan University Library as an Example

CHENG Ying

Abstract For the invalid URI in subfield 856$u,this paper analyzes the complexity of network address management in field 856 from the view of website sources and library management,and discusses the essential characteristics of valid network address in field 856. Then it states the principles and strategies of network address management,taking the management practice of western language bibliographic database in Wuhan University Library as an example.

Keywords 856 field;network address management;X;URI;Wuhan University Library

随着网络技术和数字技术发展,开放存取观念深入人心,越来越多的信息资源可从网上获取,于是越来越多的MARC记录著录了856$u子字段.856$u子字段是统一资源标识(Uniform Resource Identification,URI)[1],最普遍的形式为统一资源定位符,它最大的缺点为当信息资源的网址发生变更时,原网址就变成无效网址.由于信息资源的网址有时会发生改变,因此,856$u子字段的网址失效问题频现.由于图书馆受网速、网络技术及人力资源等局限,难以对856字段网址进行有效管理.目前相对856字段的网址研究较少,少数几篇文章只针对某种类型的资源,如清华大学图书馆将电子期刊856$u子字段全部采用X(X为Exlibris公司推出的链接系统)网址[2],兰州理工大学图书馆将纸本资源856$u子字段采用电子资源的网址[3],但均未对所有资源856字段的网址失效问题给出系统性的解决方案.武汉大学图书馆致力于清理和维护所有资源856字段的失效网址,探索856字段的网址管理方案,以便更稳定、有效地为用户揭示信息资源的网上信息,为此,笔者以武汉大学图书馆西文书目库为例讨论856字段的网址管理实践.

1 网址分析

1.1 网址管理的复杂性分析

1.1.1 网址来源角度

856$u子字段的网址来源繁杂,主要有以下几种:(1)商业数据库.比如Springer、EBSCO、Elsevier等商业数据库.当套录的MARC数据856字段为商业数据库网址而本地没有订购该资源时,该网址失效.(2)免费及开放存取资源.比如联合国文件、世界银行金融报告、Google图书.随着开放存取运动发展,网上免费的及开放存取的资源越来越多,它们与商业数据库相比,资源更新更加快捷,但存放目录易发生变化,且不易监控与管理.(3)公共服务机构.比如联机计算机图书馆中心、中国高等教育文献保障系统.这类机构的网址有时也会出现失效的情况.(4)本地或区域性的网络服务.本地或区域协作开发的网络信息资源服务往往只对本地或某区域有效,若该类网址被上传到联机合作编目中心并被其它机构下载,则会变为失效的网址.(5)零散的网站.零散网址来源于各种不同的独立网站,各网站的特性及网址组成结构存在差异,难以提取其共同特征,往往必须对各网址进行逐条分析及逐条维护,管理更加复杂.

1.1.2 图书馆管理角度

由于856字段与网络技术紧密联系,因此,它与MARC记录的常规字段不同,难以用传统的编目模式进行管理.另外,856字段的网址数量不断增长,如武汉大学图书馆西文书目库中的856字段网址数量达47万余条,受网速局限,检测这些网址需耗费较多时间,特别是网址指向国外网站或资源全文,因此,逐条维护如此多的网址是一个耗时很长的工程.由于编目员往往有日工作量压力,难以逐条维护856字段的网址.少数图书馆对856$u子字段采用稳定的X网址,但由于X知识库主要面向西文电子图书和电子期刊,不可能给所有资源提供X网址,因此不能完全依靠X来解决网址失效问题.

1.2 网址需求分析

1.2.1 不符合需求网址的原因

856字段的网址管理应不限于管理失效的网址,理由是有些网址虽然有效,但并不符合用户需求,如网址指向另一个不相关的资源,因此将网址管理归结于管理不符合需求的网址.网址不符合需求的主要原因如下:

(1)受限.原因是MARC数据上传时未滤掉适用于本地的网址,而编目员从书目中心套录这些MARC数据时未删除这些网址.针对这类问题,CALIS联合目录中心曾规定本地系统电子资源的检索网址不在联合目录中反映[4].受限主要分为三种情况:一是IP地址受限,即访问资源的用户IP地址不在允许访问的IP范围之内;二是登录受限,即需要输入用户名和登录才能访问资源;三是服务受限,指某种网络资源的服务在某个区域内暂停,如中国大陆地区不能获得Google图书的服务.

(2)网址改变.浏览这类网址时网页通常显示“page not found”.网址改变主要有三种情况:一是服务器关闭或网址改变;二是资源的存放路径改变,如世界银行金融报告的存取目录曾发生变化;三是文件改名.

(3)拼写错误.这是由于键入网址时疏忽大意,造成字符串拼写错误或符号错误,如网址“http://govinfo.library.unt.edu/ota/Ota_4/DATA/1985/8509.PDF.”的末尾多了句点,去掉句点则可正常访问.

(4)数据库商及出版商的调整.主要有三种情况:一是由于数据库商间的收购、重组以及数据库平台的转换与升级而造成服务器地址的改变;二是由于资源的版权及出版商发展策略的调整而造成资源被移除或替换,如Edward Elgar、Ashgate、Gower 出版社调整电子书发展策略而退出MyiLibrary联盟,造成MyiLibrary数据库中的一些电子书被下架;三是数据库商正在整合资源,造成网址不稳定,如施普林格科学与商业媒体集团与麦克米伦科学与教育出版集团合并,Palgre Connect的电子书被整合到Springer电子书数据库的过程中出现少数资源的DOI网址失效.

(5)网址指向不符.有两种情况:一是网址指向与MARC记录所揭示的资源不对应,如网址虽然可正常访问,但其指向数据库主站或检索界面,并没有提供对应资源的任何信息;二是网址指向与对应的$3、$y及$z等子字段的描述不匹配,如$3子字段描述为书评,网址却指向订购信息.

1.2.2 符合需求网址的特性

(1)有效性.指网址不能失效或受限访问,电子资源不像纸本资源可获得物理纸质的文献,当电子资源的856字段网址无效时,可认定该MARC记录为无效记录,需将其删除或屏蔽.

(2)对应性.指网址应指向MARC记录所揭示的资源,不能指向不相关的资源或无关页面.

(3)精准性.当MARC记录对应的资源有多个相关页面时,则网址指向应与$3、$y及$z等子字段的描述相匹配,并指向最切合的页面.

(4)集成性.为完整揭示资源,应尽可能提供所揭示资源的信息集成化网页,如对连续出版物可提供各卷期的集成展示页面,便于查看各卷期的信息.

以上特性中,前3个是必备特性,第4个为有则必备.据此,符合需求的网址应为如下组合式:有效性AND对应性AND精准性OR 集成性.若856字段的网址不符合该组合式,则需进行维护.

2 网址管理的原则及策略

2.1 指导原则

(1)主动管理.运用网络技术和链接技术,将以用户反馈为主的被动管理模式变革为以提前预防、定期清理和加强网址稳定性为主、用户反馈为辅的主动管理模式.

(2)高效管理.采取批量检测与人工维护相结合的办法,先利用软件、工具、服务、平台及编写程序代码,高效地批量过滤出不符合需求的网址,再由人工进行维护,以提高网址管理的效率.

(3)保留原始信息.当856字段原始网址不符合需求时,先不要立即删除,或用其它网址代替,而应尽可能地从原服务器的网站上找到正确网址并予以修正,以保留原始信息.

(4)针对性管理.根据网址来源、网页的HTTP返回代码、网址的组成结构及服务器主站的特性等因素制定针对性的网址管理方案,如对免费及开放存取资源,因其易变换资源的存放路径,需回主站重新检索以找到正确网址.

(5)稳定性管理.尽可能采用OpenURL及DOI等稳定网址,以保障网址的长期有效性;若无法提供稳定网址,则需加强网址监控,定期清理和维护不符合需求的网址.

(6)预防性管理.不能仅维护书目库中的网址,在MARC数据入本地书目库前应提前规范不符合需求的网址.

(7)聚类管理.隶属同一主站的网址往往具有共同特征及相似的网址组成形式,因此可一并进行管理.

(8)关联性管理.可参考相关资源及信息而获得符合需求的网址,如纸本资源与其对应的电子资源网址可相互参考.

2.2 管理策略

(1)套录数据时预筛选网址.编目员手工套录MARC数据时,可在不检测网址的情况下预筛选网址.预筛选可采取3种方式:一是当856的$3、$y及$z等子字段有IP地址限制、需用户名和登录及服务受限等描述时,可直接删除该856字段;二是若同一主站的所有网址均失效,则将该主站的网址加入网址黑名单,如Springer数据库的清华镜像站在本地早已失效,则将其主站网址“http://springer.lib.tsinghua.edu.cn”加入黑名单,这样编目员套录数据时碰到黑名单中的网址可直接删除;三是将一些公共服务网站、免费及开放存取资源的网站列入白名单,提醒编目员注意保留这些网址,如将LC、OCLC、CALIS、WorldBank及联合国等机构的网址列入白名单.不论是白名单还是黑名单,都需不断地维护,以保障名单中网址的完整性和可靠性.

(2)MARC数据批导入前检测网址.对数据库商提供的电子资源MARC数据,在其导入书目数据库前需批量检测其856字段网址的有效性,并将无效网址反馈数据商修改后,才能将MARC数据导入图书馆集成系统中.

(3)定期清理和维护书目库中的网址.书目库中的网址管理周期越长,不符合需求的网址就会积累得越多,因此,需综合考虑书目库中的网址总量、网址稳定性的差异、人力及技术条件等因素,以确定符合本地实际情况的网址维护周期,对零散网址、免费及开放存取资源的网址则需缩短维护周期.

(4)管理X系统.X是ExLibris公司推出的基于OpenURL一站式开放链接服务系统[5].由于OpenURL为稳定网址,可用来替换856字段不符合需求和不稳定的网址,因此需管理好X系统:第一,保障资源的完备性.X中激活的资源不能仅局限于本馆订购的资源,而应为本馆可访问的资源,包括赠送资源、免费及开放存取资源、纸本期刊的捆绑电子版,以便为尽可能多的资源提供稳定的网址链接及更齐全的资源服务.第二,保障资源的精确性.严格按照数据库商提供的资源清单来激活资源,若某资源的实际访问情况与资源清单有所出入,应及时与数据库商核实.第三,保障资源的及时性.一方面要求数据库商及时告知资源的日常变化情况,以进行X日常更新与维护;另一方面,要求各数据库商在每年年初提供资源的年度变化清单,包括新赠资源、删除及替换的资源,并在X中进行年度大规模的更新.

3 武汉大学图书馆西文书目库网址维护实践

3.1 网址维护流程

步骤1:提取856字段.将书目库中所有MARC记录的856字段下载到一个文本文件中.

步骤2:批量检测网址.Xenu死链接检测工具和ALEPH系统的URL检查服务提供网址检测功能,其中ALEPH的URL检查服务以文件形式返回856$u子字段的网页HTTP错误代码,可清楚了解该网址无效的原因,选用它来初步检测步骤1得到的856字段文件,以提取HTTP错误代码的网址.

步骤3:分析HTTP错误代码的网址.分析步骤2得到的HTTP错误代码的网址,对因请求参数有误、语义有误或服务器暂时停止响应等原因而误报的网址,需提取共同特征,如ECCO(Eighteenth Century Collections Online,18世纪作品在线)数据库电子书因服务器不理解网页请求语法而误报为HTTP错误代码400,而该库实际上均可正常访问,该库网址共有的字符串为“http://find.galegroup.com”.

步骤4:过滤有效网址.根据误报网址的共同特征编写脚本程序将其批量剔除,以得到更精准的HTTP错误代码网址,并减少后续人工维护的工作量,如ECCO数据库可通过匹配共有的字符串“http://find.galegroup.com”,以批量滤掉有效的ECCO库网址.

步骤5:制定网址处理方案.分析步骤4得到的最终HTTP错误代码网址,查看其网页错误的显示说明,制定各种类型、各种来源网址的处理方案.

步骤6:维护网址.对HTTP错误代码网址不能立即删除,需根据各网址的实际情况逐条进行人工处理.

3.2 HTTP错误代码分析

HTTP状态码为RFC2616规范定义的3位数字表示的网页服务器响应状态码,其中错误代码以数字4和5开头,4字头代码表示请求错误,5字头代码表示服务器错误[6].根据对武汉大学图书馆西文书目库中856$u子字段的HTTP返回错误代码的统计和分析(见表1),制定处理方案:(1)403代码通常为IP地址受限,可删除该代码的网址.(2)404代码往往因资源改变了存放路径而显示找不到网页,需找到检索入口重新检索.(3)500代码占错误代码的大部分,500代码的网址情况较繁杂,部分网址无法显示网页,部分网址却有效,因此需重点清理此代码的网址.

3.3 网址处理

人工逐条处理856$u子字段的HTTP返回错误代码的网址,可采取以下方法处理:

(1)修正拼写错误.对明显的网址拼写错误,如多出的标点符号,可直接修改.

(2)重新检索.一些不符合需求的网址往往可通过在原库中找到检索入口重新检索而找到正确网址,重检适用于以下情况:一是原网址指向错误,如指向服务器主站、检索主页或同一主站的另一资源,如一些联合国文档的856字段网址指向联合国文档系统的检索主页,则需在检索主页中重新检索;二是服务器主站网址改变,如H-NET (Humanities & Social Sciences Online)库主站网址由“http://www.h-net.org”改为“https://networks.h-net.org/”,则需在新网站中重新检索;三是资源的存放路径改变,如世界银行Worldbank的一些免费文档;四是存放资源的文件改名.重检的先决条件是必须找到检索入口,当原网页未提供检索入口时,可采取两种方法找到检索入口:(1)从同一主站且可正常访问的另一资源的网页中找到检索入口;(2)用逐层删除法找到检索入口.网址的组成形式通常为“http://服务器地址:端口号/目录1/目录2/目录3/....../目录N/文件名”,逐层删除法以“/”符号将网址分层,再从网址尾部从后往前删除一层,然后检查网址是否有检索入口,若没有则再从后往前删除一层,直至删到服务器地址为止.

(3)试探正确网址.当无法找到重检入口时,可试探正确网址,如网址“http://firstsearch.global.oclc.org/dbname等于WILSONSELECTPLUS;FSIP”显示找不到网页,也找不到重检入口,但隶属同一个数据库的另一资源可正常访问,其网址为“http://firstsearch.oclc.org/journal等于0033- 5606;screen等于info;ECOIP”,分析该网址组成形式,将该网址中区分不同资源个体的特征项“journal等于”后的ISSN号替换为找不到网页期刊的ISSN号,则可试探出正确网址.

(4)删除网址.删除网址应谨慎,删除不符合需求的网址有5种情况:一是服务器拒绝用户的请求;二是受限访问,包括IP受限、登录受限及服务受限;三是资源被移除或下架;四是网址拼写明显错误且无法改正,如网址为“792614.htm”;五是运用各种方法都无法在原库中找到正确网址.

(5)替换网址.若MARC数据揭示的资源在X中已激活,且其856$u子字段的网址包含在X来源之中,则以X网址代替该856$u子字段的网址.

(6)补充网址.若删除856$u子字段的网址后该MARC记录再无856$u子字段,为更好地揭示资源,应尽可能地补充有效网址,若MARC记录揭示的资源在X中已激活,则在856$u子字段添加X网址;若MARC记录揭示的资源在X中未激活,则纸本资源与其对应电子资源的网址可相互复制.

参考文献

[1][4] CALIS联机合作编目中心. CALIS西文图书编目业务培训教材(普通班)[Z]. 北京:CALIS联机合作编目中心,2009:150-152.

[2] 贾延霞,吕肖华,杨慧,等.电子期刊编目方法新尝试——以清华大学图书馆的实践为例[J].图书馆建设,2011(4):43-46,50.

[3] 李征. 856字段对馆藏纸本资源与电子资源的双向有效揭示[J]. 图书馆建设,2010(2):43-46.

[5] 黄美君,姜爱蓉.合适的链接 最佳的服务——X与CrossRef/DOI交互作用探讨[J].图书情报工作,2006,

50(3):91-94.

[6] Did Gourley,Brian Totty,Marjorie Sayer,et al.HTTP权威指南[M]. 陈涓,赵振平,译. 北京:人民邮电出版社,2012:10,62-70.

作者简介 程颖,女,硕士,武汉大学图书馆馆员.

收稿日期 2016-06-07

(责任编辑:邝玥)

大学图书馆论文参考资料:

大学论文题目

图书馆建设杂志

大学物理论文2000字

大学心理学论文

大学生涯规划论文

大学心理论文

汇总,此文为一篇关于对写作武汉大学和856字段和图书馆论文范文与课题研究的大学硕士、大学图书馆本科毕业论文大学图书馆论文开题报告范文和相关文献综述及职称论文参考文献资料有帮助。

和你相关的