Vergangene Events

Big Graph Processing

Dieses Meetup liegt in der Vergangenheit

10 Personen haben teilgenommen

Bild des Veranstaltungsortes

Details

Heute wollen Martin Junghanns von der Uni Leipzig und Sascha Peukert von der TU Dresden zum Thema Graph-Processing vortragen.

Gradoop: Scalable Graph Analytics with Apache Flink - Martin Junghanns

Many Big Data applications in business and science require the management and analysis of huge amounts of graph data. The flexibility of graph data models (e.g., the property graph model) and the variety of graph algorithms (e.g., Page Rank, Graph Pattern Matching, Frequent Subgraph Mining) make graph analytics attractive to different domains, e.g, social networks, business intelligence or in the life sciences. Graphs in these domains are often very large with millions of vertices and billions of edges making efficient data management and distributed execution of graph algorithms challenging. We therefore develop “Gradoop”, a new framework for end-to-end graph data management and analytics based on Apache HBase and Apache Flink.

Gradoop is designed around the so-called Extended Property Graph Model (EPGM) supporting semantically rich, schema-free graph data. In this model, a database consists of multiple property graphs which we call logical graphs. The EPGM provides operators for both single graphs as well as collections of graphs. Operators may also return single graphs or graph collections thus enabling the definition of analytical workflows.

In the talk, I will give an overview of Gradoop, the EPGM and its operators. Furthermore, I will sketch the usefulness of Gradoop by presenting an analytical use case from the business intelligence domain.

Implementierung von parallelen Graph-Algorithmen in Neo4j - Sascha Peukert

Die Analyse von Graphen ist ein Kernanwendungsfall von Graphdatenbanken. Neo4j bietet in der neusten Version Unterstützung für eine effiziente Analyse großer Graphen wie sie z.B. in sozialen Netzwerken auftreten. In meiner Belegarbeit sollen auf Basis der neuesten Neo4j Version 2.3 eine Reihe von gängigen Graphanalyse-Algorithmen wie z.B. Strongly Connected Components, Weakly Connected Components, Page-Rank, Betweenness Centrality, Community Detection oder Triangle Count implementiert werden. Dafür wird Neo4js neue Kernel-API genutzt und gegenüber der bisherigen API evaluiert. Besonderes Augenmerk liegt dabei auf der Parallelisierung der Algorithmen und dem Vergleich zu sequenziellen Implementierungen der Analyse-Algorithmen. Der Vortrag gibt einen Einblick in den aktuellen Stand des Projekts, die benutzten APIs, sowie in erste Ergebnisse der Performancemessungen.