数字图书馆是将有价值的图像、文本、语言、影像、影视、软件和科学数据库等媒体信息进行收集,组织规范性的加工和压缩处理,进行高质量保存和管理,并提供在广域网上高速横向跨库连接的电子存取服务。随着目前传统图书馆逐渐向多功能数字图书馆演变,在建设数字图书馆所涉及到有关技术中,首先是解决信息资源的数据压缩和存储。数字图书馆所涉及的数据类型有文本、图像、语音、视频等,而且所面临的数据是海量的。这么大的数据量需要很大规模的数据库来存储和处理。在数字图书馆中,文本数据所占的比重并不是很大,真正大的是多媒体数据。在传统图书馆中,多媒体信息主要保存在录像带、磁带、CD、VCD、DVD等载体上,这些载体不仅难以长期保存,而且不便于查询和使用,更不用说能够在网络上传输了。因此,必须对多媒体数据进行压缩,使数据库的规模保持在可管理的范围内。而流媒体技术的产生和发展正为数字图书馆建设过程中解决多媒体信息处理问题提供了一套完整而有效地解决方案。
1、流媒体技术概述
1.1 流媒体技术原理
流媒体(StreamingMedia)是随着互联网的普及而迅速流行起来的一种新技术。它是指采用流式传输的方式在Internet播放的媒体格式。流式传输方式是将音频、视频等多媒体信息经过特殊的压缩方式分成一个个压缩包,由视频服务器向客户端计算机连续、实时地传送。通过这种技术可以把声音、图像资料经过计算机进行编码整理后放到网络服务器上,用户可以一边下载一边收听、收看,而不需把完整的音像资料下载到自己机器后才能使用。典型例子就是网上电影点播,歌曲点播,电台电视台的网上直播等。我们把流媒体技术引入图书馆的多媒体信息资源管理,正是基于易于管理、使用方便的原则。简单来说就是:把现有多媒体信息资源进行编码后变成体积相对较小的流媒体文件并放到网络服务器上,读者通过馆内的计算机进行点播式收听、收看。
流式传输的实现需要缓存,因为Internet以包传输为基础进行断续的异步传输,对一个实时A/V源或存储的A/V文件,在传输中它们要被分解为许多包,由于网络是动态变化的,各个包选择的路由可能不尽相同,故到达客户端的时间延迟也就不等,甚至先发的数据包还有可能后到。为此,使用缓存系统来弥补延迟和抖动的影响,并保证数据包的顺序正确,从而使媒体数据能连续输出,而不是因为网络暂时拥塞使播放出现停顿。通常高速缓存所需容量并不大,因为高速缓存使用环形链表结构来存储数据:通过丢弃已经播放的内容,流可以重新利用空出的高速缓存空间来缓存后续尚未播放的内容。
流式传输的实现需要合适的传输协议。在流式传输的实现方案中,一般采用HTTP/TCP来传输控制信息,而用RTP/UDP来传输实时声音数据。流式传输的过程一般是这样的:用户选择某一流媒体服务后,Web浏览器与Web服务器之间使用HTTP/TCP交换控制信息,以便把需要传输的实时数据从原始信息中检索出来;然后客户机上的Web浏览器启动A/V Helper程序,使用HTTP从Web服务器相关参数对Helper程序初始化。这些参数可能包括目录信息、A/V数据的编码类型或与A/V检索相关的服务器地址。
1.2 流媒体技术的特点
(1)播放效率高:流媒体把声音、视频等信息由服务器将经过特殊方式压缩的多媒体文件打成一个个压缩包,向用户端连续、实时传送。流媒体文件从服务器向客户端进行实时播放时,用户不必等到全部文件下载完毕,只需延时几秒或几十秒钟便可在客户机上播放,文件的其余部分由客户端计算机在后台继续接收,直至播放完毕或用户取消播放,这样可减少用户大量等待的时间。
(2)所需带宽小:多媒体文件采用流媒体格式传输时,体积大大缩小,所以传输的带宽要求也较低,采用普通的Modem拨号上网也可以进行视频点播。
(3)所需存储空间少:流媒体运用了特殊的CODEC(Coder Decoder)技术,与同样的.wav文件和.avi文件相比,同样内容的流媒体文件,体积只有它们的5%左右。加上流媒体采用的是“边传输、边播放、边丢弃”技术,流媒体数据包达到客户端后经过解码器还原出视频信息后即丢弃,所以只需要少量的缓存,不占用太多的存储空间。
(4)可实现双向交流:流媒体服务器和客户端流媒体播放器之间的交流是双向的。服务器在发送数据时还在接收用户发送来的反馈信息,在播放期间双方一直保持联系。
(5)版权保护:由于采用了“边传输、边播放、边丢弃”技术,媒体信息并不会存储到客户端的计算机上,这在一定程度上保护了信息的版权。
1.3 三种最常用的流媒体技术介绍
目前的流媒体技术主要有RealNetworks公司的RealMedia,Microsoft公司的WindowsMedia,Apple公司的QuickTime三种。
RealMedia是目前在Internet上相当流行的跨平台的客户/服务器结构的多媒体应用标准,它采用音频/视频流和同步回放技术来实现Intranet上全带宽地提供最优质的多媒体,同时也能够在Intranet上以28.8Kbps的传输速率提供立体声和连续视频。RealMedia包括三类文件:RealAudio,RealVideo及RealFlash。该软件要求播放格式为 Mpeg-1,Mpeg-2,Avi,Mov,或通过RealProducer压缩成RM格式,RealNetworks在2002年推出的新版播放器 Realone可以支持更多的播放格式,播放效果大为改进。
Microsoft公司的WindowsMedia能保证在各种不同带宽环境下提供高质量的数据流,其核心是Advanced Stream Formart(即ASF,高级流格式)。ASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体的内容发布。它的播放器是WindowsMedia Player,是一个基于DirectShow体系结构的多媒体播放器,也是Windows操作系统默认的媒体播放器。它支持包括CD音频曲目文件、 ASF、MPEG-1、MPEG-2、WAV、AVI、MIDI、MP3等,同时可播放QuickTime文件。
Apple公司的QuickTime是数字媒体领域事实上的工业标准,可以通过Intranet提供实时的数字化信息流,工作流与文件回放功能,它由三个不同部分组成:QuickTime电影文件格式、Quick Time媒体抽象层以及QuickTime内置媒体服务系统。QuickTime播放器主要包括浏览器插件和独立的应用程序。前者用来下载和播放媒体文件,后者用来编辑和回放媒体文件。它支持MPEG、AVI、MOV、WAV、MP3等视音频文件,并支持格式转换,也能很好地支持基于HTTP、RTP、 FTP等协议的在线视频和音频点播功能。
2、流媒体技术在数字图书馆建设过程中的应用
在数字图书馆建设中,要将多媒体音像资料数字化并在现实中得到有效的应用,必须建立一套完整的架构。其中包括物理架构、软件架构和管理架构。其工作流程是:建立流媒体信息服务平台、信息资源的流媒体转化、流媒体信息发布与后台管理
2.1 流媒体信息服务平台构建
数字图书馆中的流媒体信息服务平台的网络拓扑结构可以多种多样,而且在设计应用系统时应考虑用户群体的因素,它决定了整个系统服务体系的类型、开发规模和系统需求。根据用户规模,预测可能的并发数据流量,确定合适的服务器,并据此选择相应的系统方案。无论是怎样的结构,他都应当包含以下几个部分:
(1)流媒体服务器
流媒体系统核心还在服务器。在流媒体网络系统中,节目源、流媒体服务器和用户终端设备是系统主要的应用环节。流媒体服务器是由流服务器硬件平台和运行其上的流服务软件平台配合提供流式服务。流媒体服务器对视频/音频码流进行存储、管理和分发作用。图书馆的数字化的核心在于海量的数据存储。数据是图书馆最重要、最宝贵的资源,图书馆的数据存储具有数据量庞大、数据增长迅速、数据类型复杂等特点。因此建设好流媒体服务器是很重要的,它要能顶得住巨大数据量。
(2)流媒体数据库
流媒体数据库用于存放流媒体的各种检索信息,使客户能快速地获取需要的流媒体信息。根据所选择的操作系统的不同,可以选用不同的数据库系统。如果是 Windows操作系统可以选用ACCESS数据库,如果是LINUX操作系统则可以使用SQL数据库。对于大型图书馆应当使用能力更强的数据库系统。
(3)流媒体编码工作站
通过比较各系统方案的压缩效率和性能,选择相同带宽条件下,传输性能好、画面清晰,速度流畅的解决方案。
2.2 流媒体信息智能检索系统
随着数字图书馆的建设,流媒体信息资源将越来越多,如果这个系统只是一些信息的简单堆积,那么他也就没有什么实际应用价值。当读者通过关键词或关于所需信息的描述,可以在Internet上很方便地定位相关信息源。毫无疑问,流媒体信息中也包含有合适检索的信息,用户能据此找到他所感兴趣的内容。通过开发高效的流媒体信息检索系统,对于流媒体信息检索系统应当包含视频分析、视频索引、视频匹配三个部分。
从视频中抽取关键帧,并分析其中的内容特征来作为索引。在此基础上通过关键帧类聚和结构化,提供对视频内容的摘要和内容浏览。最后,结合相关反馈和语义模板检索,实现关键帧语义查询。通过相关反馈的学习,系统可以自己改进语义模板库,使检索的准确率越来越高。结合一些传统的检索方式,使读者能够更加有效地检索和浏览流媒体信息。
2.3 流媒体信息后台管理与支持
数字图书馆所要面对的流媒体信息是海量的,要将如此庞大的信息源有效地组织起来,并能为读者服务,必须拥有良好的信息服务系统。该信息服务系统应当包括信息处理、信息发布和信息维护。
(1)信息处理:信息处理是将传统图书馆原有的多媒体信息转化为流媒体信息。原有的多媒体信息主要保存在录像、磁带、CD、VCD、DVD等载体上,需要通过视频、音频工作站将其转化为流媒体信息。这些工作站应当配有视频、音频采集卡。采集设备包括电视摄像机、立体声录音机、VCD、DVD、录像机等。
(2)信息发布:信息发布是将处理好的流媒体信息发布到数字图书馆信息平台上。根据馆藏量的大小和读者的多少,相应采用合适的信息发布平台和数据库系统。在馆藏量和读者群不大的情况下,可以使用成本相对较低的ASP+ACCESS系统。对于大型图书馆,应当使用稳定性更好、检索能力更强的UNIX系统。
(3)信息维护:信息维护是流媒体信息能够在数字图书馆中得到有效应用的保证。流媒体信息的文件大小、数据结构较其他媒体复杂许多。要保证流媒体信息能够在数字图书馆中得到有效的应用,必须配备专门的管理人员对数据和系统进行监控和维护。作好对流媒体信息的归档和做索引的工作。
【参考文献】
[1] 卡德森,郑朝阳.《基于流媒体技术的几种应用方式》.有限电视技术,2003,(2):16-22.
[2] 秦建宁,苗喜德编著.《图书馆现代技术应用教程》.西南交通大学出版社,2003.
[3] 黄晁等.《智能流媒体视频服务系统》.计算机工程与应用,2002,(9):1-4.