德国国家科技图书馆发展战略及救赎1 章节 数据科研逐步沦为第四范式的一最重要特征,20世纪末科学研究开始构成从实证主义向数据科学移往的发展趋势1];21世纪初数据密集型科研活动减缓了发展步伐。数字化、信息化的科研数据管理工作渐渐沦为图书馆及信息机构所注目的重点之一。目前许多国家也已认识到科研数据管理的潜在价值,并实施了涉及政策措施将其下降到了宏观战略层面规划考量。
美国在其2016年5月实施的《大数据研究发展战略规划》中具体部署了挖出科研数据价值2]的战略活动;欧盟在2016年5月开会的迈进对外开放科学体系会议中,明确提出重点在科研数据的优化器重3];我国也在2015年9月公布的《关于增进大数据发展的行动纲要》认为构成大数据驱动型的科技创新模式4]。在这种数据驱动科研的背景下,探究管理科研数据的明确途径和实践中方法具备积极意义。德国国家科技图书馆在这方面既有前期的良好基础,又有全新的项目进展。
数据驱动科研对于科研活动所带给的变化早已对图书馆及信息机构的服务方式和内容产生了影响。2016年3月,中国科学院文献情报中心刘细文副主任在中国数据馆员培训班上回应针对数据科学背景下新兴的科研市场需求,图书馆必须调整馆员培育方向5]。
同年7月,中国图书馆学会专业图书馆分会年会从理论和实践中层面对基于大数据和科学知识电子货币的新型科学知识服务展开辩论6]。同年9月,中国科学院文献情报中心朱向阳主任在中国机构知识库会议上做到了为题《对外开放科学中的科学知识服务》的报告,其中也明确提出必需大力发展面向公众的、大数据的新型科学知识电子货币服务。
国内图书馆界早已意识到大数据对科研活动的影响,并在大力谋求获取管理科研数据以更佳服务科研人员的方法路径7]。德国国家科技图书馆的涉及实践中有有一点图书馆及信息机构参照糅合之处。 通过对德国国家科技图书馆相结合产品线号召并对系统战略规划涉及实践中的观测,本文以期超过以下3个目的:①为实地考察他国杰出实践中案例获取不切实际方法;②为了解理解德国国家科技图书馆有糅合意义的作法及产品提供线索; ③为国内图书馆类似于产品及服务的国际交流合作获取参照。
本文遵循战略层-战术层-作业层的层次逻辑,对德国国家科技图书馆的宏观愿景规划、中观产品发展以及微观实践中方式展开观测,检视其以产品研发活动推展战术部署和战略构建的运作机制,最后通过反省国内涉及实践中成果为国内图书馆适应环境数据驱动科研的新环境获取糅合。 2 观测视角一宏观战略 本文对德国国家科技图书馆宏观战略方面的观测从3个方面积极开展:①检视其制订战略的指导标靶,即的组织定位;②解读其制订战略的基础相结合,即历史基础;③实地考察其所制订战略的详尽内容,即现行战略。 2.1 的组织定位 德国国家科技图书馆(GemEinsamen Bibliotheksverbund, 以下全称TIB)是一所国立图书馆,作为汉诺威莱布尼兹大学所属的高校图书馆,同时也分担了反对国家信息战略的责任服务于全国的科研人员及其运作的科研活动。
相结合高校学科建设与科研实力,TIB明确提出特别强调实践中方法的战略目标,即为用户获取科学知识创意、有效地的、通畅的获取数据、信息和科学知识的途径,并使其需要以一种适合的结构化方式延伸出有更大的信息空间8]。 2.2 历史基础 2011年前后,TIB基于对数据环境变化和机构科研市场需求的考量,部署了向分布式大数据集的对外开放门户改变的发展策略。其中采行了一系列措施,主要是通过产品开发来构建该策略改变,重点在于前进科研数据永久标识符(digital object identifier,DOI)的用于和管理机制。
微观层面上,在馆内前进DOI的用于。对数字化资源展开系统标记和结构修复,优化涉及门户网站(如GetInfo)并以此为基础展开涉及信息电子货币的伸延;宏观层面上,以普遍的图书馆合作构建科研数据的规范管理。
2009年牵头涉及机构正式成立DataCite,利用DOI为科研团体获取可信赖的科研数据定位、证书和提到的服务,反对DOI以及设施元数据的创立和发给,反对针对科研数据的检索和找到,推展科研数据的传播和分享。目前已沦为获取DOI的国际领先机构,成员单位普遍产于于全球20多个国家和本文由毕业论文网http://www.lw54.com收集整理地区。 TIB大力前进DOI应用于是对其更进一步战略转型所作出的铺垫。
事实上,DOI只有在与其他技术产品结合时才能充分发挥其链接学术资源的关键作用,从而更进一步构建产品性能的伸延9]。以比较完备的DOI应用于机制为跳板,TIB以求之后积极开展其现阶段战略部署。
2.3 现行战略 TIB公布的《2015-2017年战略规划(2015-2017 Strategy)》10]集中体现了对于时代环境和自身作为的思维。规划中共制订了六大发展重点,关于这六大发展重点概括出有的若干目标和实践中重点(闻表格1)。
TIB实践中发展的重点工作较为集中于,总结为元数据标准制订、科研数据管理、非文本资源管理和数据长年留存4个方面。3 观测视角二战术部署 针对大数据时代科研活动的新生科学知识市场需求,TIB将其所积极开展的4个领域的产品研发活动,还包括:对外开放科学(open science)、数据科学(data science)、非文本资源(no-textual materials)和可视化分析(visualization analysis)展开调整扩展,4个领域协同前进数字化/网络化发展。
3.1 对外开放科学产品线 对外开放科学是数据驱动科研的最佳实践中方法。数据驱动科研的背后,就是要解决问题一系列针对科研数据的留存、流通、管理、确保等市场需求和问题11]。TIB对外开放科学部门的重点工作是前进对外开放科学基础设施为相结合的科研协同环境。
TIB正式成立的对外开放科学实验室(Open Science Lab),长年与还包括莱布尼兹研究网络2.0在内的多个获取研究人员或者研究基础设施的机构维持合作关系。 Open Science VIVO Beta12](2014年3月至今)利用关联对外开放数据(linked open data),为科研社群获取协同、完全一致、多样的信息展出。
通过在主要德语研究机构上及时捕捉科研活动及成果信息,利用关联数据本体的扩展和接入,构建仅有欧洲境内科研机构、人员、项目等信息的网络统合。目前该网络内共计597位研究人员、19家机构和766项研究成果。该网络在欧美研究社群中普遍用于。 CoScience13](2014年3月-2015年3月)是为协助科研人员分享科研方法、存储科研经验、推展新兴科研工具的数字化信息服务项目。
在项目的两期工程中,共计与13家高校图书馆、信息机构和数字化项目达成协议合作。通过开放平台文档和对外开放视频讲座两种方式,为科研人员构建经验方法,引领研究人员间的科学知识分享。 3.2 非文本资源产品线 TIB明确提出的打破文本(move beyond text)战略14]具备现实意义。
图书馆的科学知识资源依然是其最重要的资本和基础15]。大数据时代的前进使得图书馆馆藏资源某种程度局限于传统的印本资源,而是涵盖了具备多种数据类型、地理分布存储的普遍意义的数据资源。 TIB正式成立的非文本资源部门注目各类数字化科技信息。
针对其中的非文本资源积极开展了一系列收集、标引、读取和储藏实践中,将非文本资源视为与传统文本资源同质的文化遗产16]。下面分别列出3个重点领域(仅有维度的科研数据、影音多媒体资料以及3D数据)的涉及实践中。 RADAR(Research Data Repository)17](2013年9月-2016年8月)是相结合莱布尼兹信息基础设施创建的一个通用型科研数据知识库,获取多维科研数据留存(最低留存时限15年)、出版发行、证书和跟踪工作。
并与图书馆、研究机构、出版商和开放平台展开数据统合,构建科研数据的分布式存储和一体化提供。 AV-Portal18](2014年至今)是一个针对影音多媒體科研数据的分布式构建门户。其视频资源覆盖面积自然科学和工程等多个学科,对视频质量展开严格控制,视频内容主要牵涉到计算机可视化、教学资料、建模仿真、实验过程、专访和会议记录等。
检索视频资源时,可以构建对视频内容的概览、视频语音内容的语种翻译成并反对对视频资源每一帧的内容检索。用户可以权利上载资源,资源公布必须审查,部分资源反对对外开放提供。 DURAARK(Durable Architectural Knowledge)19](2013年2月-2016年1月)是一个针对建筑学类3D模型长年留存的数据库。
从语义层面对建筑的3D模型资源展开的组织和标引工作,创建新的元数据格式对建筑的数据信息以三维立体模型的形式展开长年留存,以期构建对建筑信息多维简单的提供。 3.3 数据科学产品线 在TIB积极开展的数据科学产品开发活动中,大量的成果是以数据科学为工具对数据展开的深度分析与挖出。
在该领域产品研发过程中,TIB某种程度面临简单的处置对象数据类型。与非文本资源产品注目的重点完全相同,其不仅针对传统文本信息,更加最重要的是对诸如科研数据、影音内容、3D信息、建模模块及软件多种数字化的科技数据源展开检索、查找和留存20]。 基于数据科学领域机器学习、模式识别和统计学方面21]的工具,TIB针对科研数据的分析、的组织和检索工作展开了语义化探寻,研究成果多应用于检索工具和系统中。 AV-Portal是数据科学产品的集大成者。
在其两个工作重点:文本(数据)挖出和科学知识管理(语义分类、本体等)方面皆有所应用于。文本挖出工具主要是对非结构化的数据展开整理,使之结构化并挖出其中的潜在联系;科学知识管理则主要对现有馆藏资源展开语义层面的改良22]。
该门户反对对经过质量掌控的科学视频展开还包括场景、文字、语音和图像在内的多维度的数据辨识23],以有所不同的粒度对对象的有所不同特征展开分析处置,构建对信息展开较慢、完全一致、交互地读取;从语义层面对资源展开分类的组织,拓展检索方法;反对基于DOI的针对科学影片和片段的提到,制做影片及科研辅助资料的上载。多媒体检索方法和语义数据分析的技术使得这些非结构化的资源的组织和检索工作以求更佳地构建。
刊登请求标明来源。原文地址:http://www.lw54.com/html/fazhan/20170418/6951739.。
本文来源:开云|kaiyun-www.47129.vip