CiteSeerX

2018年8月22日22:33:38CiteSeerX已关闭评论 991 views

CiteSeerX


专注计算机和信息科学领域的文献检索平台

CiteSeerX 是一个公共搜索引擎和数字图书馆和科学和学术论文的存储库,主要侧重于计算机和信息科学。最近已经扩展到其他学术领域,如经济学,物理学和其他领域。

CiteSeerX 取代了CiteSeer,所有对CiteSeer的查询都被重定向。 CiteSeerX 是一个公共搜索引擎和数字图书馆和科学和学术论文的存储库,主要侧重于计算机和信息科学。[2]然而,最近CiteSeerX 已经扩展到其他学术领域,如经济学,物理学和其他领域。它于2008年发布,基于之前的CiteSeer搜索引擎和数字库,基于新的开源基础架构,SeerSuite和新算法及其实现。它由宾夕法尼亚州立大学信息科学与技术学院的研究人员Isaac Councill博士和C. Lee Giles博士开发。它继续支持CiteSeer概述的目标,即在公共网络上积极地抓取和收集学术和科学文档,并通过引用和引文的影响对文档进行排序来引用查询。最近,引入了表搜索功能。它得到了美国国家科学基金会,美国国家航空航天局和微软研究院资助。

CiteSeerX 继续被评为世界顶级知识库之一,并于2010年7月评为第1名。它目前拥有超过600万份文档,其中有近600万独特作者和1.2亿次引用。

CiteSeerX 还与其他研究人员共享其软件,数据,数据库和元数据,目前由Amazon S3和rsync共享。它的新模块化开源架构和软件(以前在SourceForge上可用,但现在在GitHub上可用)基于Apache Solr和其他Apache和开源工具构建,这使它成为文档收集,排名,索引和信息提取等新算法的测试平台。

基本信息

网站名称: CiteSeerX
学科类型: 学术搜索
网站分类: 学术搜索
国家地区: 美国
收录时间: 2018-08-22
网站地址: http://citeseerx.ist.psu.edu

详细介绍


CiteSeerX

CiteSeerx是一个不断发展的科学文献数字图书馆和搜索引擎,主要关注计算机和信息科学的文献。 CiteSeerx旨在改善科学文献的传播,并在获取科学和学术知识方面提供功能,可用性,可用性,成本,全面性,效率和及时性方面的改进。 CiteSeerx不是仅创建另一个数字图书馆,而是尝试提供可用于推广其他数字图书馆的资源,如算法,数据,元数据,服务,技术和软件。 CiteSeerx开发了新的方法和算法来索引Web上的PostScript和PDF研究文章。

发展历史:

CiteSeer是第一个通过自主引文索引提供自动引文索引和引文链接的数字图书馆和搜索引擎。

CiteSeer于1997年由Steve Lawrence,Lee Giles和Kurt Bollacker在新泽西州普林斯顿的NEC研究所开发。该服务于2003年转移到宾夕法尼亚州立大学信息科学与技术学院。从那时起,该项目由Lee Giles教授领导。

在作为公共搜索引擎服务近十年之后,最初仅作为原型的CiteSeer开始超越其原始架构的功能。自成立以来,最初的CiteSeer已经成长为750,000多个文档的索引,并且每天提供超过150万个请求,从而推动了系统功能的限制。基于对原始系统遇到的问题和研究社区需求的分析,为“Next Generation CiteSeer”或CiteSeerx开发了一种新的架构和数据模型,以便在可预见的未来继续保留CiteSeer的传统。

主要特色功能:

自主引文索引(ACI)

CiteSeer使用ACI自动提取引文并创建引文索引,可用于文献检索和评估。与传统的引文索引相比,ACI在成本,可用性,全面性,效率和及时性方面提供了改进。

自动元数据提取

CiteSeer自动提取作者,标题和其他相关元数据以进行分析和文档搜索。

引文统计

CiteSeer计算数据库中引用的所有文章的引文统计和相关文档,而不仅仅是索引文章。

参考链接

CiteSeer是第一个允许使用自动生成的引文链接浏览文档的人。

作者消除歧义

使用可伸缩方法,作者可以自动消除其他作者的歧义。

引文背景

CiteSeer可以显示给定论文的引用背景,允许研究人员快速,轻松地查看其他研究人员对感兴趣的文章(不再可用)的评论。

跟踪通知

CiteSeer为给定论文提供新引文的自动通知,以及与用户配置文件匹配的新论文。

相关文件

CiteSeer使用引用和基于单词的度量来查找相关文档,并为每个文档显示活动且不断更新的参考书目。

全文索引

CiteSeer索引整篇文章和引文的全文。支持完整布尔,短语和邻近搜索。

查询敏感摘要

CiteSeer提供了如何在文章中使用查询术语而不是通用摘要的上下文,从而提高了搜索效率。

及时更新

CiteSeer会根据用户提交和定期抓取定期更新。

强大的搜索功能

CiteSeer对内容上的所有复杂查询使用现场搜索,并允许使用作者姓名首字母提供更灵活的名称搜索。

收集文章

CiteSeer自动从公共Web收集研究论文,但也通过提交系统接受提交。

文章的元数据

CiteSeer自动提取并提供所有索引文章的元数据。

个人内容门户

CiteSeer提供某些功能,如个人收藏,类似RSS的通知,社交书签和社交网络设施。可以进行个性化搜索设置和机构数据跟踪。用户文档可以通过易于使用的文档提交系统提交

使用介绍

CiteSeerX的检索界面简洁清晰,默认为文献(Documents)检索,还支持Authors、tables检索。

默认选择文档搜索。 要搜索特定作者,请选择“作者”按钮。

在文本框中键入要搜索的主题或名称

选中“包含引文”框(可选)

若选择“IncludeCitations”进行搜索,期刊文献等检索范围会扩大,不仅包括学术文献全文的数据库,还会列出数据库中每篇论文的参考文献。

点击“AdvancedSearch”,进入高级检索界面。

高级检索会增加检索的精确度,除了支持作者、作者单位、篇名等基本检索之外,还支持文本内容以及用户为论文定义的标签等更为详细的检索。

表搜索:

CiteSeerx允许用户搜索嵌入在文档中的表。 用户可以在表格中或表格周围的片段中搜索关键字和文本。

赞助支持:

过去得到的赞助和支持有:美国国家科学基金会奖CNS-0958143,微软研究院,NASA。

目前由AllenAI赞助。

 

CiteSeerX

CiteSeerX

CiteSeerX

CiteSeerX

 

附加资料


引文搜索引擎CiteSeerX调查评析

参考资料


 

weinxin
扫码,关注科塔学术公众号
致力于成为国内领先的科研与学术资源导航平台,让科研工作更简单、更有效率。内容专业,信息准确,更新及时。
avatar