本书属于高等学校各个专业研究生和本科生的信息检索素养课程教学通用教材,内容包括三大部分:*部分信息检索素养基础知识篇,第二部分信息检索素养基本原理篇和第三部分信息检索素养实践应用篇,共13章内容。本书较好地把现代信息检索素养知识的基础性与前沿性、原理性与实践性、全面性与主题性、引导性与启发性进行了贯通与融合。在基于大量信息检索专题、图表、实例及其数学理论依据进行充分阐述和说明的基础上,突出国内与国外、理论与实践紧密结合的信息检索素养教学要求。考虑到不同专业和不同层次学生的实际教学需要,教学内容组织依据循序渐进和主题性教学相结合的原则,可以适当选用部分章节组织教学。例如,针对计算机学科专业、图书情报学专业、信息管理专业本科生和各个专业的研究生层次学生,可以把第二部分信息检索素养基本原理篇作为重点来组织各个教学章节内容。
本书内容丰富、线索清晰、结构完整、语言精练、主题鲜明,是高等学校各个专业研究生和本科生的信息检索素养教学通用教材。既可以作为信息检索素养基础必修课教材,也可以作为部分专业和图书馆用户教育的选修课教材,同时可作为信息系统设计与开发、数据采集与挖掘、信息检索与咨询服务、图书情报机构等从业人员的学习与培训参考用书。
1.基于循序渐进和主题性教学原则。本书较好地把现代信息检索素养知识的原理性与实践性、全面性与主题性、引导性与启发性进行了贯通与融合。在基于大量信息检索原理与知识的专题、图表、实例、案例及其数学理论依据进行充分阐述和说明的基础上,突出国内与国外、基础与前瞻、知识与技能紧密结合的信息检索素养教学要求。 2.适用面广。考虑到不同专业和不用层次学生的实际教学需要,本书内容可作为高等学校各个专业研究生和本科生的信息检索素养课程通用教材。 3.本书内容丰富、线索清晰、结构完整、语言精练、主题鲜明。本书既可作为信息检索素养基础必修课教材,也可以作为部分专业和图书馆用户教育的选修课教材,同时还可作为信息系统设计与开发、数据采集与挖掘、信息检索与咨询服务、图书情报机构等从业人员的拓展学习与培训参考用书。
前言在信息化社会越来越发达的今天,面对几何级数膨胀的海量信息资源,如何有效地检索、获取、评估、传播、共享和利用信息,成为了每个人重要的基本素养和能力要求,因为信息需求是每个人学习、工作、生活及其社会活动中十分重要而且迫切的需求。作为信息时代的大学生,需要重视信息检索素养的知识学习与能力培养。信息检索素养的理论知识学习与基本能力形成,不仅直接影响着大学生的在校学业表现,也较大程度上影响着他们今后的学习、工作与事业发展(例如终身学习、创新创业等持续性需要)。大学生信息检索素养是大学生信息素养的核心内容之一,具有多学科交叉融合的特性。信息检索起源于图书馆学、情报学的信息检索原理与技术,早期直接服务于高校图书馆或社会公共图书馆的信息检索用户教育与技能培训,后来广泛应用于数据库研发与服务企业、搜索引擎等信息服务产业,在当今高速发展的计算机科学、软件工程、网络工程、通信工程、管理学、应用数学、统计学、语言学等多学科交叉融合的基础上,信息检索在数据挖掘、大数据处理等领域不断深化并发挥着日益强大的潜能。大学生信息检索素养教育正是基于这种时代背景和学科发展提出来的,也是面向大学生的传统信息素养教育和信息检索教育的不断深化与交叉融合的发展结果。基于循序渐进和主题性教学原则,本书较好地把现代信息检索素养知识的原理性与实践性、全面性与主题性、引导性与启发性进行了贯通与融合。在基于大量信息检索原理与知识的专题、图表、实例、案例及其数学理论依据进行充分阐述和说明的基础上,突出国内与国外、基础与前瞻、知识与技能紧密结合的信息检索素养教学要求。考虑到不同专业和不同层次学生的实际教学需要,本教材属于高等学校各个专业研究生和本科生的信息检索素养课程通用教材,内容包括三大部分: 第一部分信息检索素养基础知识篇,第二部分信息检索素养基本原理篇和第三部分信息检索素养实践应用篇。本书逻辑清晰,内容丰富,结构完整。首先,从信息检索素养的基本概念、内涵、发展动因、特点、核心内容与能力表现、信息检索素养的评价标准以及信息化社会对大学生的信息检索素质需要出发,进一步论述信息检索与知识产权、信息检索与大学生学术不端行为、信息检索基础知识、信息检索方法与策略等内容来培养学生的信息检索意识、信息检索道德与信息检索基础。第二,通过信息检索的基础数学原理的引入,使得信息检索有了更加严谨的逻辑论证,检索过程和信息需求的本质描述也更为精确,从而使得信息检索的理论与实践获得持续性的基础支撑。通过文本分类与文本索引构建、图像信息检索、音频信息检索、视频信息检索和Web信息搜索一般性原理来构建大学生特别是研究生的信息检索基本原理知识。第三,通过搜索引擎的检索应用、七大类特种文献信息资源检索和图书与学术期刊论文检索的大量实例与检索案例来培养和锻炼大学生的信息检索素养实践技能。本书教学内容的规划、组织与编著,是在作者讲授研究生信息检索原理与应用课程和本科生大学生信息检索课程的十多年教学改革与实践经验基础上逐步积累形成的。同时,在教材编著过程中,参考和借鉴了大量国内外专著、教材、学术期刊论文、学位论文、学术观点和典型网络数据库检索平台等成果,在此一并向他们表示真挚的谢意!本书内容丰富、线索清晰、结构完整、语言精练、主题鲜明,是高等学校各个专业研究生和本科生的信息检索素养教学通用教材。既可以作为信息检索素养基础必修课教材,也可以作为部分专业和图书馆用户教育的选修课教材,同时可作为信息系统设计与开发、数据采集与挖掘、信息检索与咨询服务、图书情报机构等从业人员的学习与培训参考用书。在本书编著过程中,得到桂林电子科技大学研究生院领导及教学督导委员会的关心与支持,获得2016年桂林电子科技大学研究生教育质量工程专项(YXYJ2900)、2016年广西学位与研究生教育改革与发展专项(2016XWYJ12)和2015年广西高等教育本科教学改革工程项目(2015JGA207)的支持与资助。本书能够顺利出版,感谢清华大学出版社的大力支持与良好合作,感谢出版社编辑们的辛勤工作与付出!本书主要基于循序渐进性教学与主题性教学相结合的编写原则,在大学生信息检索素养的原理性与实践性、全面性与主题性、引导性与启发性等方面难免有疏漏或不妥之处,恳请读者批评指正。 /大学生信息检索素养教程前言/
作者2016年7月于桂林
目录
第一部分信息检索素养基础知识篇
第1章大学生信息检索素养概述3
1.1信息检索素养概述4
1.1.1信息检索素养的基本概念4
1.1.2大学生信息检索素养的内涵5
1.1.3信息检索素养的发展动因6
1.1.4信息检索素养的特点7
1.2信息检索素养的主要内容9
1.2.1信息检索意识9
1.2.2信息检索能力10
1.2.3信息检索道德10
1.3信息检索素养的评价标准11
1.3.1有信息检索素养的人11
1.3.2信息检索素养评价标准的必要性12
1.3.3大学生信息检索素养评价标准13
1.4我国当代大学生的信息检索素养现状14
1.4.1信息检索意识较弱14
1.4.2获取信息的检索能力不强14
1.4.3加工与利用信息的能力较差14
1.4.4信息道德和信息法规意识急需培养14
1.5大学生信息检索素养教育与培养的意义15
1.5.1信息化社会对大学生的信息检索素质需求15
1.5.2创新创业能力培养的需要16
1.5.3掌握有效信息和开展科研与学术活动的需要171.5.4提供科学方法与正确决策的需要18
1.5.5终身学习的需要19
本章小结19
本章思考与练习题21
/大学生信息检索素养教程目录/
第2章信息检索与知识产权22
2.1信息与知识产权22
2.1.1信息22
2.1.2知识产权26
2.1.3知识产权信息27
2.1.4知识产权信息的概念特征28
2.1.5知识产权信息的内容29
2.2信息检索与利用的法律规范和信息道德29
2.2.1信息检索与利用的相关法律制度30
2.2.2知情权问题31
2.2.3国家秘密问题32
2.2.4商业秘密问题33
2.2.5隐私权保护问题33
2.2.6信息复制权保护问题34
2.3信息检索与利用过程中的道德自律34
2.3.1法律约束的局限性35
2.3.2信息道德自律问题的提出35
2.3.3信息道德的培养和内省原则36
2.4信息检索与利用同知识产权保护的相互影响36
2.4.1信息检索与利用对知识产权保护既制约又促进36
2.4.2知识产权保护对信息检索与信息资源共享的制约和促进37
2.5大学生信息检索素养与学术不端行为的关联38
2.5.1大学生学术不端行为的界定38
2.5.2大学生学术不端行为的表现39
2.5.3信息检索素养教育对大学生学术不端行为的作用40
本章小结41
本章思考与练习题43第3章信息检索的基本知识44
3.1信息检索的含义44
3.1.1检索的概念44
3.1.2信息检索的含义45
3.1.3信息检索用户的基础素养46
3.1.4信息检索的领域与范畴47
3.1.5信息检索的类型48
3.2信息检索涉及的相关支撑领域49
3.3信息检索的前沿与热点问题51
3.3.1信息检索的发展趋势51
3.3.2信息检索的热点问题55
本章小结57
本章思考与练习题58第4章信息检索的方法与策略59
4.1信息源及其类型59
4.2信息源的出版发行与共享类型61
4.3信息源类型的辨别64
4.4检索工具67
4.4.1检索工具的基本功能67
4.4.2检索工具的类型69
4.5信息检索途径73
4.6信息检索方法82
4.7信息检索策略84
4.8信息检索质量与评价87
4.8.1信息检索质量与评价指标88
4.8.2影响检索效果的因素89
本章小结91
本章思考与练习题91
第二部分信息检索素养基本原理篇
第5章信息检索的基础数学原理95
5.1简单布尔检索95
5.1.1基本原理95
5.1.2布尔检索模型的特点97
5.2信息检索模糊集合论98
5.2.1模糊检索的数学描述99
5.2.2信息文档对标引词的隶属度100
5.2.3提问检索词的相关性描述100
5.3扩展布尔检索102
5.3.1基于两个标引词的情形102
5.3.2推广到n个标引词空间103
5.4信息检索代数模型106
5.4.1信息检索向量空间模型106
5.4.2潜在语义索引模型113
5.4.3神经网络检索模型117
5.5概率论检索模型122
5.5.1经典概率检索模型123
5.5.2贝叶斯网络检索模型125
5.6其他检索模型的一般数学原理129
5.6.1进化计算与遗传算法129
5.6.2粗糙集理论136
5.6.3浏览检索模型140
本章小结142
本章思考与练习题144第6章文本分类与文本索引构建145
6.1文本分类概述146
6.2朴素贝叶斯文本分类148
6.2.1贝叶斯分类器148
6.2.2条件概率和乘法定理149
6.2.3极大后验假设和极大似然假设149
6.2.4贝叶斯定理150
6.2.5多项式朴素贝叶斯151
6.3朴素贝叶斯分类模型改进153
6.3.1改进方法153
6.3.2朴素贝叶斯分类的提升模型155
6.3.3基于特征相关的改进加权朴素贝叶斯分类156
6.4贝努利文本分类模型157
6.5多项式文本分类模型与贝努利文本分类模型的性质比较159
6.6文本分类特征选择161
6.6.1文本分类特征选择的作用161
6.6.2特征选择的方法162
6.6.3特征选择方法类型163
6.6.4文本互信息选择164
6.6.52统计量特征选择165
6.6.6基于频率的特征选择方法166
6.7文本的索引构建167
6.7.1基于块的排序索引方法167
6.7.2基于内存单次扫描的索引构建方法171
6.7.3顺排文档索引172
6.7.4倒排文档索引178
本章小结186
本章思考与练习题187第7章图像信息检索189
7.1图像基础知识189
7.1.1图像色彩三要素190
7.1.2图像的三种基本类型192
7.1.3常用图像文件格式192
7.2图像检索概述196
7.2.1图像检索一般模型196
7.2.2基于文本方式的图像检索197
7.2.3基于知识和视觉特征的图像检索198
7.2.4基于内容的图像检索198
7.2.5图像内容描述的标准化 199
7.3基于图像内容特征提取200
7.3.1基于颜色特征的图像检索200
7.3.2基于纹理特征的图像检索204
7.3.3基于形状特征的图像检索206
7.3.4基于空间特征的图像检索214
7.3.5单个特征图像检索的不足215
7.4基于多特征的图像检索 216
7.4.1综合颜色和形状特征的图像检索216
7.4.2综合形状和空间特征的图像检索216
7.4.3综合形状和纹理特征的图像检索217
7.4.4综合颜色、形状和空间的图像检索217
7.5基于视觉特征的图像检索系统218
7.5.1基于视觉特征的图像检索系统整体架构218
7.5.2图像分割技术219
7.5.3相似性度量224
7.5.4图像索引226
7.5.5相关反馈技术232
7.6典型的图像检索系统233
7.7图像检索技术的发展方向234
7.7.1融合人工反馈 234
7.7.2高层语义和低层视觉特征结合234
7.7.3面向网络图像检索235
7.7.4图像检索性能评价与检索服务平台235
本章小结236
本章思考与练习题237第8章音频信息检索239
8.1音频的特点239
8.1.1音频信息的基本特征239
8.1.2音频信息的内容层次240
8.2音频信息检索技术的分类和发展241
8.2.1基于文本的音频检索241
8.2.2基于内容特征的音频检索243
8.3音频信息检索架构与模型244
8.3.1音频信息检索架构244
8.3.2向量空间模型借鉴245
8.3.3概率模型借鉴246
8.4表示级的音频检索247
8.4.1基于直接匹配的音频样例检索247
8.4.2基于索引的音频样例检索249
8.4.3基于GPU通用计算的音频样例快速检索256
8.5语义级的语音文档检索263
8.5.1语音文档检索的预处理263
8.5.2语音文档检索的索引和搜索技术266
8.5.3语音文档检索中的容错方法270
本章小结274
本章思考与练习题275第9章视频信息检索277
9.1数字视频的相关基础知识277
9.2基于内容的视频检索系统结构280
9.3视频镜头分割281
9.3.1非压缩域的镜头分割方法282
9.3.2压缩域中镜头分割方法285
9.4镜头切换286
9.5关键帧提取及语义提取287
9.5.1关键帧提取的基本原理和准则287
9.5.2关键帧提取的方法287
9.5.3视频语义提取290
9.6视频特征提取291
9.6.1全局运动矢量的计算方法292
9.6.2视频运动估计293
9.6.3运动矢量估计的常用算法296
9.7视频聚类301
9.8视频结构索引302
9.8.1视频结构索引的机制303
9.8.2索引信息的存储303
9.9视频摘要305
9.10视频语义检索模型308
9.10.1底层特征提取模块308
9.10.2底层特征向高层语义映射模块 308
9.10.3视频语义查询模块 310
9.10.4语义词典的应用 311
9.11典型的视频检索系统311
本章小结312
本章思考与练习题314第10章Web信息搜索316
10.1搜索引擎概述316
10.1.1搜索引擎基本结构317
10.1.2传统搜索引擎基本类型318
10.1.3智能搜索引擎基本类型319
10.2搜索引擎主要支撑技术324
10.2.1分词技术324
10.2.2网络蜘蛛325
10.2.3索引技术325
10.2.4词频相关指数326
10.2.5自动推理技术326
10.2.6本体知识系统327
10.2.7专家系统328
10.3Web采集329
10.3.1Web采集概述329
10.3.2采集器的功能与特点329
10.3.3Web采集330
10.3.4域名解析332
10.3.5待采集URL池335
10.3.6分布式索引336
10.3.7连接服务器339
10.3.8Web图340
10.4主要网页排序算法342
10.4.1PageRank 网页排序算法343
10.4.2TopicSensitive PageRank算法343
10.4.3Hilltop算法344
10.4.4HITS算法345
10.4.5SALSA算法346
10.4.6BFS算法347
10.4.7PHITS算法347
本章小结348
本章思考与练习题349
第三部分信息检索素养实践应用篇
第11章
常用搜索引擎的检索应用353
11.1百度搜索引擎的检索应用353
11.2搜狗搜索引擎的信息检索与利用372
11.3Google搜索引擎的检索应用384
11.4Infoseek搜索引擎392
11.5雅虎搜索引擎信息检索应用396
本章小结399
本章思考与练习题400第12章特种信息资源检索401
12.1科技报告信息资源检索401
12.1.1科技报告的概念与特征401
12.1.2科技报告的类型与编码402
12.1.3国内科技报告与商业报告资源的信息检索403
12.1.4国外科技报告资源检索 409
12.2会议文献资源检索413
12.2.1会议文献资源的概念413
12.2.2会议文献的特点与类型414
12.2.3国外会议文献的检索415
12.2.4国内会议文献的检索419
12.3学位论文检索423
12.3.1学位论文概述423
12.3.2国外重要学位论文数据库检索424
12.3.3重要国内学位论文数据库检索426
12.4专利文献资源检索434
12.4.1专利与专利文献概念434
12.4.2专利文献的类型与作用434
12.4.3国际专利分类436
12.4.4专利搜索引擎438
12.4.5国外大型专利数据库系统445
12.4.6国内专利资源数据库系统检索455
12.5标准信息资源检索462
12.5.1标准信息资源的概念与特点462
12.5.2标准信息资源的分类463
12.5.3美英等国标准信息资源检索464
12.5.4中文标准信息资源检索467
本章小结471
本章思考与练习题472第13章图书与学术期刊论文信息资源检索474
13.1大型中文图书目录检索系统474
13.1.1中国国家图书馆联机公共目录查询系统474
13.1.2CALIS联合目录公共检索系统481
13.1.3北京大学图书馆公共查询系统482
13.1.4清华大学图书馆馆藏目录检索系统483
13.2典型中文数字图书检索超星数字图书馆486
13.3典型中文学术期刊论文检索495
13.3.1CNKI中国学术期刊网检索496
13.3.2维普中文科技期刊数据库检索499
13.4典型外文电子图书检索系统502
13.4.1CADAL外文图书检索502
13.4.2世界电子图书馆检索502
13.4.3ebrary(电子图书馆)检索504
13.4.4OCLC FirstSearch检索506
13.4.5其他典型外文电子图书检索系统简述508
13.5典型外文学术期刊检索系统510
13.5.1Web of Science数据库检索510
13.5.2IEL数据库检索513
13.5.3EBSCO学术资源平台检索518
13.5.4Wiley在线图书馆检索518
13.5.5其他典型期刊学术论文检索系统520
本章小结525
本章思考与练习题526参考文献527