21世纪20年代的图表:数据库、平台和知识的进化


图表和知识图表是21世纪20年代的关键概念和技术。它们看起来会是什么样,它们能让我们前进吗?

自2000年代初以来,我们一直在跟踪图表的发展,自2018年以来,我们一直在出版《图表年》通讯。图表有许多应用,涵盖分析、人工智能和知识管理。

所有这些都建立在一个共同的基础上:数据。这就是为什么图形数据库是所有图形应用程序的关键使能器。反过来,这也是为什么我们一直致力于跟踪图表数据库的进展。为了开始2020年第一年的图表时事通讯,我们有一点点的一切。

来自易趣、Github、谷歌和联合国的用例。来自阿兰戈、自动气象站、剑桥语义学、星云图、近地天体4j、本体、甲骨文和星域的更新和新版本。新的研究和想法。


多语种持久性,也就是根据手头的任务交替使用数据模型和数据管理的行话,正在成为新的常态。在关系数据库、键值数据库、文档数据库、柱状数据库和时间序列数据库之后,数据结构的这种进化扩散中的最新链接是图。

在过去的几年里,图表数据库和知识图表一直在掀起波澜,并被纳入宣传周期。然而,他们的历史可以追溯到很久以前,这仅仅是个开始。

5 Technology Trends for the Roaring 20s, Part 2: AI, Knowledge Graphs, Infinity, and Beyond

知识图可以解决数据治理等关键挑战,但最终,它们可以作为数字基础,将知识获取和组织的理念与数字时代的数据管理实践相统一。

知识图和图表有时可以互换使用。它们不应该是——它们是两码事。正如所指出的Kurt Cagle in his Dictionary of Graph Terms知识图是语义图,与意义明确相关。

这意味着选择一个能够促进语义处理的基底是一个好主意。以下是知识图平台如何发展以支持不同的查询语言,促进互操作性,并努力满足用户的需求。

Knowledge Graph Evolution: Platforms That Speak Your Language

知识图表是21世纪20年代最重要的技术之一。以下是它们的发展过程,供应商和标准机构都在倾听,平台也能流利地使用多种查询语言

Neo4j刚刚发布了它所谓的“迄今为止图形技术市场上最重要的产品发布。”这是否成立由你决定。然而,事实是,Neo4j 4.0解决了一些长期的痛点。乍一看有些矛盾,这与知识图表平台的演变有关。Neo4j从图形数据库历史中抽出一页,加入到自己的进化中。

Neo4j 4.0 Adds Enterprise Fabric to Its Graph Database

在其新版本中,Neo4j解决了企业采用的关键问题。可扩展性、安全性、管理和架构变化都在这里。一种奇怪的似曾相识的感觉也是如此。

更多图表数据库新闻:Oracle为甲骨文产品许可证持有者免费提供图形数据库和图形分析产品。AWS已经实现了一系列新特性,并在一个地方列出了它们。一个新的开源图形数据库,NebulaGraph,引起了一些关注。阿朗戈布认为多模型可以应对知识图的挑战。

The Multi-Model Knowledge Graph

本文描述了一些挑战,以及多模型的灵活数据表示如何解决这些挑战

谷歌不仅向世界介绍了术语知识图。它还雇佣了这一领域的关键人物,并引导着世界上最具影响力的模式——schema.org——的演变。

最近,schema.org v . 6发布了,有许多小的但有用的改进。如同Aaron Bradley notes,新类型指南,建议可能对数字营销感兴趣。正如伍兰克的数据所示,2000万个网站中有28%已经在使用结构化数据

Schema.org Releases

本页列出了schema.org的最新版本。

一个广为人知的早期知识图表采用者是易趣。这里,它的工程团队的一些成员分享了他们的见解。正如他们所指出的,对于易趣来说,应用程序/基础设施知识图是一个异构属性图,它提高了架构的可见性、运营效率和开发人员的生产率。

eBay’s New Approach to Managing a Vast Service Architecture

了解易趣的建筑知识图是如何开发的;易趣从中获得的利益;以及我们现在和将来看到的这种方法的用例。

Github在2019年9月收购塞姆勒时获得了一个名为CodeQL的语义代码分析引擎。这是免费的研究和开源开发,以帮助安全研究人员找到新的简历和开发人员自动安全检查他们的代码库。GitHub使用一个语义库来分析代码,构建一个图,并从中学习。

How Code Analytics Could Help GitHub Decipher Its Semantic Code Graph of Open Source

为了让新功能发挥作用,GitHub正在生成一个所有公共转发的语义代码图。这为理解和改进编码模式、质量和安全性提供了巨大的机会

联合国正在研究链接数据,以便通过语义查询使其数据更加有用(和可发现)。DESA的可持续发展目标分类法是与整个联合国系统的技术专家合作编制的。开发了面向可持续发展目标的国际化资源标识符系统、相关目标和指标以及可持续发展目标接口本体。

部署这些通用标识符是为了提供基础设施的一个关键要素,使联合国系统各组织和相关利益攸关方能够将其可持续发展目标资源映射到语义网上不断增长的可持续发展目标知识库。A demo app is also available

UN Library Launches Linked Data Services Platform

搜索引擎如何检索结果,我们如何使联合国公布的结果与这些搜索者相关?链接数据是与其他数据相互链接的结构化数据,通过语义查询使其更加有用(和可发现)。

西曼·克拉曼是一位独立的知识图谱专家,他参与了联合国项目。克拉曼长期以来一直致力于将语义网的好处(比如URIs和模式)带给图形化编程语言。到目前为止,大多数相关分析都将GraphQL视为链接数据的接口。克拉曼说,这是有道理的,但还有另一种方法

What Can the Semantic Web Do for GraphQL?

如果GraphQL资源用URIs——全球(语义网/链接数据)标识符进行注释,表示来自共享词汇的概念,比如schema.org或其他专用本体,会怎么样?

以可视化和协作的方式处理知识图和创建本体总是可以使用一些好的工具。告诉一个封闭的小组来模拟这个世界,他们会的,通常没有外界的反馈。结果可能是强大的,但是导致很少有人使用的本体论。Zazuko人认为这最好使用一个协作的网络平台来完成,这就是为什么他们发布了开放源码的本体管理器。

Open Source Release of Our Zazuko Ontology Manager

今天我们宣布我们的Zazuko本体管理器的开源版本。这是我们已经努力了一段时间的事情,自从我们开始为我们的一个客户工作以来,我们计划将其作为开源软件发布。

艾伦人工智能研究所一直在开发一个语境中参考文献的语义学者图:一个包含8110万篇学术出版物的大型语境引用图,包括810万篇开放存取论文的解析全文,涵盖广泛的科学领域。

一个相关的努力:L3S研究中心不是在静态的PDF文章中表现研究,而是在动态的知识图中工作。The Open Research knowledge graph represents ideas, approaches, methods in machine-readable form

GORC: A Large Contextual Citation Graph of Academic Papers

我们介绍了上下文中参考文献的语义学者图(GORC),这是一个包含8110万篇学术出版物的大型上下文引用图,包括810万篇开放存取论文的解析全文,涉及广泛的科学领域。

知识图表的另一个视角。确切地说,Weaviate是在一个盒子里或者一个Docker容器里构建开源知识图表。它使用预先训练好的图形嵌入模型,用户可以对他们的特定领域数据进行进一步训练,通过REST应用编程接口进行访问,并在云中或内部部署。

Weaviate on Google Cloud’s Stack chat

鲍勃·范·卢伊特是谷歌云栈聊天的嘉宾,他谈论了《衰退》和我们如何使用谷歌云@ SeMI技术。

要在收件箱中获得年度图表简讯,请订阅here