构建图谱

本协议支持所有符合RDF规范的图数据库。

将上一章构建出来的RDF数据导入图数据库,即可得到一个简单的社交图。

图 7-3 一个简单的社交图

使用Neptune

Amazon Neptune 是一项快速、可扩展的图形数据库服务。Neptune 可高效存储和导航高度互连的数据。它的查询处理引擎针对领先的图形查询语言 Apache TinkerPop™ Gremlin 和 W3C 的 RDF SPARQL 进行了优化。Neptune 通过这些图形框架开放和标准的 API 实现了高性能。

借助Amazon Neptune我们可以把用户在区块链上的行为数据,构建出一个社交图谱。

具体步骤:

  1. aws控制台启动一个Neptune实例

  2. 将上一章构建的sparql拼接成Neptune插入语句:

update=PREFIX : <http://relationlabs.ai/entity/>
PREFIX p: <http://relationlabs.ai/property/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
INSERT DATA {GRAPH <http://relationlabs.ai/relationship> {
:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe a :Soul;
    p:name "Alice" .
:Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e a :Soul;
    p:name "Bob" .
:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe p:following :Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e .
}}
  1. 调用Neptune服务接口保存RDF数据

curl -X POST --data-binary 'update=PREFIX : <http://relationlabs.ai/entity/>
PREFIX p: <http://relationlabs.ai/property/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
INSERT DATA {GRAPH <http://relationlabs.ai/relationship> {
:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe a :Soul;
    p:name "Alice" .
:Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e a :Soul;
    p:name "Bob" .
:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe p:following :Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e .  }}' https://your-neptune-endpoint:port/sparql

至此,我们已经将Alice follow Bob的数据索引至图数据库了,通过调用Neptune服务接口查询数据:

curl -X POST --data-binary 'query=select * where {
?s a :Soul;
  p:name "Alice".
?s p:following ?f .} limit 10' https://your-neptune-endpoint:port/sparql

使用Jena

为了方便演示,我们使用docker来启动一个Jena服务:

docker run -p 3030:3030 -e ADMIN_PASSWORD=pw123 stain/jena-fuseki

启动成功后访问 http://localhost:3030/,账户:admin/pw123。

  1. 首先创建一个数据集

图 7-4 添加一个数据集
图 7-5 创建demo数据集
  1. 然后将上一步的数据导入图数据库

PREFIX : <http://relationlabs.ai/entity/>
PREFIX p: <http://relationlabs.ai/property/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>

:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe a :Soul;
    p:name "Alice" .

:Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e a :Soul;
    p:name "Bob" .

:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe p:following :Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e .
图 7-6 上传RDF数据
图 7-7 选择文件并上传
  1. 最后切换至Query标签页,查询一下Alice关注了哪些人:

PREFIX : <http://relationlabs.ai/entity/>
PREFIX p: <http://relationlabs.ai/property/>

SELECT * WHERE {
  ?me a :Soul;
	p:name "Alice";
    p:following ?following .
  ?following p:name ?name .
}
LIMIT 10
图 7-8 使用SPARQL进行查询
图 7-9 查询结果

即可查询到:Alice的地址0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe follow了Bob的地址0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e

使用Neo4j

为了方便演示,我们使用docker来启动一个Neo4j服务:

docker run \
    -p 7474:7474 -p 7687:7687 \
    --name neo4j-neosemantics \
    neo4j:5.5.0
  1. 安装插件以支持RDF

docker exec -it neo4j-neosemantics bash
cd plugins/
wget https://github.com/neo4j-labs/neosemantics/releases/download/5.5.0.0/neosemantics-5.5.0.0.jar
  1. 配置插件

编辑conf/neo4j.conf, 追加配置dbms.unmanaged_extension_classes=n10s.endpoint=/rdf

配置完成后重启Neo4j

docker restart neo4j-neosemantics

Open Neo4j Browser: http://localhost:7474/browser/ 初始账号:neo4j/neo4j

  1. 配置Graph

在Neo4j browser输入框分别执行以下命令:

CALL n10s.graphconfig.init();

CREATE CONSTRAINT n10s_unique_uri FOR (r:Resource) REQUIRE r.uri IS UNIQUE;

CALL n10s.graphconfig.init( {  handleMultival: "ARRAY" })

CALL n10s.nsprefixes.add("e", "http://relationlabs.ai/entity/");
CALL n10s.nsprefixes.add("p", "http://relationlabs.ai/property/");
  1. 导入数据

在Neo4j browser中执行以导入数据:

CALL n10s.rdf.import.inline("PREFIX : <http://relationlabs.ai/entity/>
PREFIX p: <http://relationlabs.ai/property/>
prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
prefix xsd: <http://www.w3.org/2001/XMLSchema#>
prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>

:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe a :Soul;
    p:name \"Alice\" .

:Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e a :Soul;
    p:name \"Bob\" .

:Soul_0x0109c8ee3151bde7b6b5d9f37e9d2c4bc16930fe p:following :Soul_0x6247123ec0fe0d25feb811e3c4d4a760c1f2e63e .","Turtle");
  1. 查询

在Neo4j browser中查询:

MATCH (ss:Resource {p__name: ["Alice"]})-[:p__following]->(oo) RETURN ss, oo
图 7-10 使用Neo4j

Last updated