TigerGraph 让人人都能图分析

2020-09-19 08:02
网络安全和信息化 2020年9期
关键词:运维数据库用户

印象中,大数据分析刚兴起没多久,“人人都是数据科学家”的呼声已经不绝于耳。大数据分析不应该成为极少数数据科学家的专利,而应该成为所有业务人员最有力的工具!

人们寄希望于图数据库,因为它可以完成许多关系型数据库几乎不可能完成的任务,让企业更轻松地执行更具丰富意涵的实时分析,以及从数据中发掘可以真正改变人们生活的洞察,并使所有人都可以使用可扩展的图分析,从关联数据中释放真正的价值。

图分析领域的佼佼者TigerGraph 已经成立8年,其主打产品也演进到3.0 版本,但是图分析总让人有种“叫好不叫座”的感觉。这是因为图分析的高门槛让企业用户望而却步吗?

TigerGraph 中国区总经理 乌明捷

图分析一定要“平民化”

其实,图分析本身并不想拒人于千里之外,它可以适用于各种规模的企业。从新兴的初创公司到全球财富1000 强企业,它们都在使用TigerGraph的高级图分析构建前瞻性应用程序就是最有力的证明。比如,全球前五大银行中有四家在使用TigerGraph 进行实时欺诈检测;同时,依托TigerGraph,全球超过3 亿消费者获得了实时个性化服务,5000 万医疗保健患者受益于量身定制的护理路径建议。那么,到底是什么压抑了图分析潜在的巨大能量的释放呢?

从图分析使用者的角度也许可以找到蛛丝马迹。图分析的使用人群大致可以分成三类:IT 运维人员、应用开发人员,以及非技术专业的企业业务人员。一些图分析厂商一开始就将IT 运维人员和应用开发人员作为主要的服务对象,图分析成了“阳春白雪”,动辄就要写脚本、写代码,需要数据科学家这样的高端专业人才才能完成部署和分析。而普通的业务人员对于图分析只能仰望,却不能亲自动手参与其中。

TigerGraph 中国区总经理乌明捷谈到了一种比较普遍的情况,在初步搭建图分析系统,进行简单尝试之后,甚至还没有看到图分析带来的改变,很多用户便放弃了。这说明,图分析确实存在入门的门槛,比如用户要对图数据库的相关概念有一定了解,而且要掌握基本的图分析方法和工具等。

TigerGraph 中国区总经理乌明捷表示,图分析一定要平民化,让图数据库物尽其用。图分析并不限于固定的行业或场景,而应该让所有人受益!

2 0 2 0年 3月,TigerGraph 正式发布了TigerGraph 3.0,其最有意义的一项演进是无需写代码,只通过拖拽的方式就能让用户完成基本的图分析工作。在笔者看来,这是一项虽平凡但又影响深远的改变。说它平凡,因为“No Code”这项工作本身的技术门槛并不高,图分析厂商如果想做都可以实现;说它影响深远,是因为大家都能做的工作,但是很多“技术范儿”的厂商并没有将它提到日程上来,仍然围绕专业人员作文章,只有TigerGraph在用户实实在在需求的推动下,第一个将它落地实现,或许这样一项小小的创举,就可能打开图分析普及化的闸门。

以TigerGraph 3.0 为新开端,它可以让企业用户在图分析方面快速入门,先有图才谈得上用好图。从低成本的试用开始,先做一些简单的探索,不用了解相关算法,只需通过鼠标拖拽,就能在短时间内看到最直接的结果,待有持续深入探索的需求后,企业再加大投入,采用更加专业的工具和方 法,在TigerGraph 平台之上完成专业的图分析。从少量场景的探索入手,循序渐进,逐步将图查询等迁移到更大规模的集群中,直至进入生产环境,这才是图分析贴近用户、深入行业的正确姿势。

“No code”是一个开关

按照Gartner的说法,图数据存储可以跨数据孤岛有效地建模、探索和查询具有复杂关联关系的数据,但是目前需要专门技能才能实现,实际上限制了其应用。这就可以理解为什么TigerGraph 将图可视化提升到如此重要的地位。这有点像把略显晦涩的文言文转成通俗易懂的白话文,不是技术上的问题,而是思路上的转变,最终目的是扩大对知识的探索,将图思维和工具普及化、平民化。

TigerGraph 究竟是如何实现图可视化的呢?以TigerGraph 3.0 为例,它增强了包括使用直观的拖放功能运行图查询的能力。

TigerGraph 3.0 在 提供核心平台功能的同时,提供易用的“No code”高级图分析:通过提供No code方式进行模式(Schema)转换,并把数据加载到图中,实现从关系型数据库No code 迁 移;使 用Visual Query Builder(可视化查询构建器)的No code 图分析,类似于可视化数据建模,非技术人员通过绘制所需的模式即可生成和运行图查询;在分布式环境中实现简单和快速的部署,更方便地在TigerGraph 平台中导入更庞大的数据集并进行分析;用户定义的索引允许用户提高特定查询的数据库性能,支持点和范围查询,以及高性能的时间序列和地理空间应用。

无论用户的专业技术能力如何,借助TigerGraph的No code 图分析功能,都可以通过图方便地实现高级分析应用。

众所周知,标准化是降低产品使用门槛,加速新技术普及的重要驱动力。专属图查询的国际标准化语言GQL 可能在2021年发布,乌明捷认为这将对图分析的应用起到重要促进作用。采用图分析,用户必须翻越的“成本关”有二:一是机器的成本;二是人力成本,其中就包括学习成本。乌明捷不止一次听到客户的担忧:“我选择一个分析平台,就像在做一道单选题,如果技术人员学习了一门开发语言,在投入大量学习成本后,将来又要转换到另一个产品或平台,必须重头再学一门新的语言,这让我们在选择平台时非常纠结。”

TigerGraph 以身作则,自主开发的GSQL 语言将完整支持GQL 图查询语言国际标准。乌明捷相信,此语言国际标准的诞生将大大降低客户学习和使用的成本,就像现在的关系型数据库一样,只要掌握了标准的SQL,再学其他语言时,只要学习额外新增的功能即可,而基本的语法不会有太大变化。无论是No code 还是GQL 国际标准,都可以进一步打消用户对使用图分析的顾虑,对整个图分析市场的发展十分有利。

“我们现在的一项重要工作就是与企业的科技创新部门、大数据分析部门一起,教育企业的业务部门,让他们能够真正了解图分析的价值所在。”乌明捷分析说,“让业务部门接纳一项新技术,除了必须考虑技术的成熟度和易用程度以外,最重要的其实并不是科技本身,而是如何利用科技为业务带来价值,这才是推动图分析走向深入的关键。”

特别值得一提的是,云的兴起对于图分析来说也是一个助力。越来越受到客户欢迎的TigerGraph Cloud 提供了20 多种模板,用户选择其中一个行业模板,在几分钟内便可搭建一个图环境并使用。据乌明捷透露,TigerGraph 已 经在和国内的云服务商洽谈合作的可能。

聚焦三大使用人群,面面俱到

“TigerGraph 平 台的演进聚焦使用简单、更好融合、最佳的容量和性能支持。”TigerGraph 解决方案工程师李憓松介绍说,TigerGraph 3.0 可以更好地与分析平台和数据进行融合,具备企业级用户所需的大容量和领先业内的高性能,可以进行真正的图分片、分布式存储和分布式运算。

针对开发者,TigerGraph 3.0 提供了属性索引、算法、从关系型数据库迁移到图等先进技术,旨在提高开发效率;提升GSQL 语言,比新增GSQL 联合模式匹配(Conjunctive Pattern Matching),新 推出的Per 子句主要是在联合模式匹配下,方便进行多步遍历,灵活高效进行聚合运算;提供更加灵活的查询模式等。针对IT 运维人员,TigerGraph 3.0 通过平台管理、汉化的用户界面、Studio 中的多图等,大幅提升运维效率。针对普通的业务人员,尤其是无基础的图分析新人,TigerGraph 3.0 提供了无代码分析工具,可以快速完成图探索和图查询,降低了应用的入门门槛。李憓松特别提到了新增的直译查询功能。以往,用户在对查询进行修改或调试后,还要再经过编译才能进行下一次查询,连贯性体验不佳,而直译查询则提升了查询效率。

“相对于以前的版本,TigerGraph 3.0 实现了全面的提升,包括系统的稳定性、运维的易用性,以及支持PB 级的数据量等,为管理员提供了一套完整的界面,包含数据备份、安全等都有了较大改进,提高了工作效率。另外,我们开源了GSQL 算法库,提供中文界面和更好的本地服务支持。”乌明捷表示,通过不断演进,TigerGraph 将变更加成熟、稳定,支持更大的数据量,帮助更多用户将图技术应用到日常工作中。

关键是建立“图思维”

谈到未来图分析领域的技术和应用发展趋势,李憓松总结了以下几点。

首先,企业用户越来越看重对于单个用户的行为分析,这就要求参数的灵活化,以及数据不同的遍历结构的灵活化,同时对于多并发情况下的性能要求非常高,通常是毫秒级的,而这些正好是图分析比较擅长的。其次,将图分析和传统BI 相结合,构建更灵活的即席探索平台,进行不止建模,预测,最优化的高级分析。再次,传统的机器学习是一个“黑盒”,而图分析可以进行更好地进行解释,有助于提升机器学习的准确性和可解释性。最后,批量的图分析也是一个需求方向。

再回到文章一开始提到的图分析“叫好不叫座”这个问题,归根结底,广大的企业用户还没有建立起一种新的“图思维”,仍然比较依赖传统关系型数据库,或者在关系型数据库遇到瓶颈时才想到图分析。其实,图分析的应用场景更丰富。TigerGraph 就归纳了图分析的七大场景,比如路径的发现、模式的匹配、子图的发现等。目前,我们看到图分析在金融、电信、医疗等领域比较火,而实际上,工业、能源、电商、制造业、物流等千行百业都是图分析的用武之地。在抗击疫情的过程中,也有TigerGraph的身影。

如果说利用传统关系型数据库进行的数据探索是平面的,那么图分析就是立体的,可以进行更深入、更多维、更准确的分析。如果用户从一开始就将自身的业务与图之间建立对应关系,也许可以更快地达到探索的彼岸。TigerGraph的价值在于,为客户提供一个快捷、简便的图分析工具,让用户可以在很短的时间内先建立图,初步尝试之后很快判定是否可行,然后再决定是否继续更深入的探索。

“让我们的客户真正从图和图分析工具中受益。这是TigerGraph 做所有事情的出发点。”乌明捷如是说。

猜你喜欢
运维数据库用户
高速公路智能运维平台
智能+时代的新运维
——2019(第十届)IT 运维大会特别报道
数据库
关注用户
配电线路的运维管理探讨
关注用户
关注用户
数据库
关注用户
数据库