信息检索
消息-数据-信息-知识-智慧-文献
文献是记录有知识的一切载体。
文献的分类
- 按载体形式:印刷型或称纸型(纸张),缩微型,电子型,声像型
- 出版形式(重要):图书(篇幅达到48页以上),期刊(占比最大),报纸,会议文献,政府出版物,学位论文,档案,专利文献,标准文献,产品资料。【除图书与期刊外,都是特殊文献】
- 文献加工级别分类:零次文献(未公开的),一次文献(原始文献),二次文献(检索性文献,将一次文献组织起来),三次文献(参考性文献,类似于文献综述)
文献类型的识别,如何识别。
ISBN
(国际标准书号),ISSN
(国际标准连续出版物号)CN
(国内统一刊号)。只有ISSN而无国内统一刊号在国内被视为非法出版。
信息检索概念
概念
- 广义:信息检索包含信息存贮和信息查找两个过程。
- 狭义:信息检索仅仅指信息查找的过程。
文献标引——数据标注,查准率与查全率。
信息检索工具(参考性工具书,检索性工具书)是在一次文献基础上加工而成的二次或三次文献。OPAC(联合公共目录检索系统)
- 参考性工具:辞书、类书、政书、百科全书、年鉴、手册、表谱、图录、名录等
- 检索性工具:书目、索引、文摘等
目录的作用:揭示、报道单位出版物的外表特征。可以找到原文馆藏。
索引的作用:从各个角度揭示文献的内容,为用户提供文献线索。
文摘的作用
- 具有压缩、指引一次文献的功能
- 便于相关文献集中阅读。掌握某一类信息的总体情况。
- 有些情况下是原始文献的代用品
- 避免漏检和误检
- 消除语言障碍
Web of Science,LISTA
信息检索原理及语言
中国图书馆图书分类法,主题词款目举例。主题词与关键词最大的区别就是主题词经过了规范化处理。
主题检索语言:关键词语言
、标题词语言
、单元词语言
、叙词语言
此处“主题”非彼处“主题”。中国期刊网的“主题”检索途径,似乎是主题语言,但却不是。新主题:包括一篇文章的所有主题特征,同时在检索过程中嵌入了专业词典、主题词表、中英文对照词典、停用词典等工具,并采用关键词截断算法,将低相关的文献进行进行截断。
DOI标识期刊,DOI是一个永久性的标识号。
ORCID:其意义同科学文献领域的DOI(数字唯一标示符)是一样的。DOI好比是科技文献的身份证,一文一证;ORCID好比是科研人员的学术身份证,一人一证。
语义网络
语义网络是以图解的形式对知识进行表达, 知识中的概念、属性、实体以节点表示,概念与概念或实体之间存在关系则以弧 线表示,形成一幅网络结构形式的有向描述图。
本体提供领域中所有词汇对应的基本术语和关系从而描述该领域,再利用这些术语和关系结合形成规则,用以规范和定义必要词汇外延。
语义检索是把信息检索与人工智能技术、自然语言技术相结合的检索概念空间是一种包含语义关系的计算机可识别和操作的概念集合。
本体提供一组术语和概念来描述某个领域,知识库则使用这些术语来表达该领域的事实。
中文核心期刊【后面四个是国外四大检索工具】
检索字段解释,AND * OR 等等,给出检索式要能解释其中的意图。参考👉:https://zhuanlan.zhihu.com/p/690909739
高校财经数据库,INFOBANK
专利分类:发明专利、实用新型专利【有的国家没有此项】、外观设计专利。专利特点:专有性、地域性、时间性。
IPC:国际专利分类。在专利检索上非常重要
常用标准检索数据库:中国知网,万方标准。标准有作废的问题。