图形计算简介培训
介绍
图数据库和库
理解图形数据
图形作为数据结构
使用顶点(点)和边(线)来模拟真实场景
使用图形数据库建模、持久化、处理图形数据
本地图形算法/遍历
neo4j、OrientDB、Titan
练习:使用neo4j建模图形数据
白板数据建模
基于图形数据库:图形计算
理解属性图
图形建模不同场景(软件图、讨论图、概念图)
用遍历解决实际问题
算法/定向遍历图形
确定循环的依赖性
案例研究:排名讨论贡献者
按贡献讨论的数量和深度排名
关于情绪和概念分析的说明
图形计算:本地内存图形工具包
图形分析和可视化
JUNG、NetworkX、iGraph
练习:使用NetworkX建模图形数据
使用NetworkX为一个复杂系统建模
图形计算:批处理图形框架
利用Hadoop进行存储(HDFS)和处理(MapReduce)
迭代算法概述
Hama、Giraph、GraphLab
图形计算:图形并行计算
在单个系统中统一ETL,进行探索性分析和迭代图形计算
GraphX
设置和安装
Hadoop和Spark
GraphX运算符
属性、结构、连接、邻域聚合、缓存和未缓存
使用Pregel API迭代
传递发送、接收、计算的参数
构建图形
在RDD或磁盘上使用顶点和边
设计可扩展算法
GraphX优化
访问其他算法
PageRank、连通组件、三角计数
练习:网页排名和热门用户
使用文本文件作为输入来构建和处理图形数据
部署到生产