微软学术搜索

2018年8月22日22:33:38微软学术搜索已关闭评论 537 views

微软学术搜索


构建了学术图谱体系,更加适用于学术领域的垂直搜索

基本信息

网站名称: 微软学术搜索
学科类型: 学术搜索
网站分类: 学术搜索
国家地区: 美国
收录时间: 2018-08-29
网站地址: https://academic.microsoft.com/

详细介绍


微软学术搜索Microsoft Academic是Microsoft Research开发的免费公共网络搜索引擎,用于学术出版物和文学。 该工具于2016年重新推出,采用全新的数据结构和搜索引擎,采用语义搜索技术。 它目前为3.75亿个实体编制索引,其中1.7亿个是学术论文。[1] Academic Knowledge API使用REST端点从底层数据库中提取信息,以用于高级研究目的。

该服务取代了早期的Microsoft研究项目Microsoft Academic Search,该项目于2012年结束了开发。

文献计量学家的初步评论表明,新的Microsoft Academic Search是Google Scholar,Web of Science和Scopus的竞争对手,用于学术研究以及引文分析。

微软学术搜索

微软学术搜索 微软学术搜索

 

常见问题

MA 2.0版有什么新内容?

Microsoft Academic(MA)于2017年7月进行了重大更新。此更新包括三个主要功能:

帐户和配置文件 - 您现在可以通过声明您创作的出版物来创建帐户,登录和创建公共配置文件。声明您的出版物将有助于提高搜索准确性,并将向全世界展示您的作品。

个性化 - 通过使用帐户启用,个性化为每个登录用户提供自定义主页。 MA编制学术活动,研究新闻和新出版物/引文。根据您的出版历史记录,MA会在您的个性化主页上显示最相关的项目,以及来自作者的新闻和您选择关注的事件。

改进的搜索功能 - 新版MA不仅仅是简单搜索。它提供了建议和相关结果,以帮助您发现更多感兴趣的奖学金。

此版本已预览了一段时间,现在它已成为访问MA的新方法。

MA与其他学术搜索引擎有何不同?

Microsoft Academic(MA)利用机器学习,语义推理和知识发现方面的进步,帮助您以比以往更强大的方式探索学术信息。

MA是语义搜索引擎,而不是基于关键字的搜索引擎。

传统搜索引擎主要依赖于关键字匹配。通常,它们会将您在搜索字段中键入的关键字与索引内容中找到的字词进行匹配。搜索结果的准确性取决于您键入的关键字的质量,这将成功搜索的责任放在用户身上。

MA是不同的,因为它采用自然语言处理来理解和记住每个文档中传达的知识。然后,MA应用称为语义推断的技术来识别用户的意图并主动传递与用户意图相关的结果。因此,MA可以处理复杂的查询,并可以提供丰富且知识渊博的答案。

例如,查询“机器学习”。 MA将其解释为旨在发现机器学习领域最具影响力的研究。很多这样的出版物甚至可能在其标题甚至文本正文中都不包括“机器”和“学习”这两个词。因此,传统搜索引擎可能无法找到它们。 MA是不同的。它经过培训可以理解论文的含义,而不仅仅是寻找关键词匹配。您可以将MA的结果与其他搜索引擎进行比较,以查看差异。当然,如果语义解释不适合您的目的,您可以通过点击搜索底部的“未找到您要查找的内容?点击此处查看Bing结果”链接,指示MA回归Bing支持的关键字搜索结果。

MA使您能够了解研究领域,而不仅仅是搜索论文。

MA不仅限于搜索论文。它提供有关最相关的作者,机构,出版物和研究领域的相关信息。 MA的语义搜索功能可确保相关信息与初始搜索高度相关。

由于MA背后的技术是如此不同和强大,MA使您能够快速找到需要数周才能使用基于关键字的搜索引擎进行编译的答案。例如,您如何在过去十年中找到微软着名的机器学习研究人员及其着名的论文?大多数人需要问该领域的专家。但是,如果你在2007年之后输入“关于微软机器学习的论文”,MA会在几秒钟内提供答案。

Microsoft Academic的数据来自哪里? 什么是Microsoft学术图谱?

MA使用由人工智能(AI)驱动的机器阅读器扫描并从Bing发现和索引的所有学术出版物中提取知识。 Bing将各种来源的数据编入索引,从发布者网站到个人作者的个人主页。 MA的AI代理然后将这些数据清理并组织到我们称为Microsoft Academic Graph(MAG)的图形数据库中。

您如何确定相关出版物?

MA通过评估文本中的学术概念来计算论文之间的相似性得分。您可以通过在Academic Knowledge API中尝试我们的Similarity方法来测试我们的方法。

你如何计算引用次数?

由于Web上可用的大规模学术数据的嘈杂性,出版物的真实引用计数与任何给定学术数据库索引的引用文档的简单计数不同。 MA使用Microsoft Academic Graph中的大量出版物来估计每个出版物的更准确的引用计数。该估算使用统计模型,该模型利用各个出版物的本地统计数据和整个学术图表的全球统计数据。 Madian Khabsa和C. Lee Giles撰写的文章“公共网络上的学术文献数量”提供了基于Microsoft Academic Search中数据语料库的统计估计的另一个很好的例子。

为什么新网站没有图表可视化?

我们正在努力开发一组新的图形可视化,这些可视化将很快在MA和PowerBI上提供。与此同时,如果您想尝试新的方法来可视化我们的学术知识图表,请使用Academic Knowledge API来尝试您的想法。

期刊排名在哪里?

期刊排名是MA中不可或缺的动态体验。要尝试新的期刊排名体验,只需使用任何研究领域作为查询。您将在搜索结果页面左侧看到该字段中的期刊排名以及作者,大学,会议和相关字段的排名。 MA根据实际标记在您搜索的研究领域的论文计算期刊评级,而不是基于期刊中的所有论文。这是因为MA认识到即使同一期刊中的论文也可能属于不同的研究领域。

为什么不报告h指数,EI / SCI和期刊影响因子?

研究文献提供了大量证据,表明这些指标充其量只是研究影响和学术影响的粗略近似,因为在这个时代,大量的出版物和引用数据很少且难以获得。通过利用Bing中微软网络爬虫的规模,并将数据集公开提供给整个研究界,微软研究院希望能够研究新的评估学术的方式。

为什么很多论文没有PDF下载链接?

MA提供指向论文或网页的链接。如果没有“查看链接”或“查看PDF”选项,则表示我们了解某篇论文,因为它已被图中的另一篇论文引用,但我们尚未在线查找副本。

为什么作者隶属关系有时与论文中出现的不同?

我们的算法可能会使用作者最后的已知联系,或者当无法从PDF文件中自信地识别作者信息时将关系留空。当您发现错误时,请提交反馈表,以帮助研究团队培训机器学习系统以更好地执行。

为什么有些出版物没有会议地点?

如果通过多个会议地点正式发布论文(例如,在期刊上发表的联合会议或会议论文集),则会议地点字段将留空。我们不断改进算法和建模技术,以处理同一出版物的多个会议地点。

为什么您的出版日期有时会出错?

许多出版物在出现在会议或期刊之前在线发布。因此,MA倾向于使用“第一次看到”日期作为发布日期。

如何添加或编辑有关作者,出版物,期刊或会议的信息?

请创建个人资料并声明您撰写的论文。对于您想要编辑但发现您没有权限的任何其他内容,请使用右下角的按钮提交反馈表单。

 

附加资料


Microsoft Academic A multidisciplinary comparison of citation counts

参考资料


Microsoft Academic: Is the Phoenix getting wings?

weinxin
扫码,关注科塔学术公众号
致力于成为国内领先的科研与学术资源导航平台,让科研工作更简单、更有效率。内容专业,信息准确,更新及时。
avatar