首页  >  文章  >  科技周边  >  泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

王林
王林转载
2023-05-29 20:37:041313浏览

2022年8月6日-7日,​​AISummit 全球人工智能技术大会​​如期举办。在7日下午举办的《AI赋能产业实践》分论坛上,泰凡科技副总经理马国宁带来了《图绘万象,从柯尼斯堡到百业赋能》的主题分享,详细分享了知识图谱在千行百业中的赋能。

愚公如果是AI,能不能移山?

如果把愚公当成是AI,那他能不能移山?又是如何进行移山的?

马国宁表示,在人工智能行业,每一个垂直领域都是一座大山。例如在金融、工业、政务等行业中,利用算法去解决行业特定问题时,大家会发现它与最初的设计和落地总是不同的,主要原因是由于我们的算法逻辑不一定能够匹配行业的业务逻辑。最开始解决这个问题的方式是利用数据智能和计算智能,依靠堆数据量进行训练,但是这种方法在后期也会出现一些瓶颈。为此,我们又开始利用人脸识别、声音识别等感知智能的方式去解决一些场景中出现的问题。

 当感知智能也遇到瓶颈,最新的方式是利用认知智能的算法来解决。那么,认知智能是否能模拟人的思维认知过程,去解决庞杂的疑难问题呢?


泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

在认知智能领域,谷歌很早就利用知识图谱进行了尝试,把所有知识装到同一个图谱中,模拟人的思维以及推理演绎的过程。但是,自谷歌提出这个想法之后,至少到目前为止仍然没有办法去做到完全模拟人的思维过程。虽然图谱的构建过程并不复杂,但数据量足够大之后,就会遇到各种问题。例如,WolframAlpha超过10亿的实体,DBpedia超过30亿的三元组,谷歌目前实体已经超过5亿,关系连接超过百亿,微软Probase仅概念的总量就已经有千万级别。这种情况下,先不谈应用,仅仅做搜索和查询分析就已经很难了。

 很多学者认为一个单点或者一个集群解决不了,就用两个集群乃至十几个集群解决这个问题。实际上,在知识图谱里是很难进行堆集群量的,主要原因是在如此庞大的实体和节点相关联的情况下,很难让数据分离开。

 AI向产业赋能,谁向AI赋能?

本来想利用AI向产业赋能,但是从计算智能到感知智能、认知智能,现在AI也需要有人向它赋能。那该怎么办?

马国宁认为,方法就是站在巨人的肩膀上。

泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

上图中的柯尼斯堡是一个小城镇,但是它在数学界或者在图论界非常有名,主要是因为一个很伟大的数学家欧拉,在1736年解决了柯尼斯堡七桥问题,开创了一个新的数学分支图论。知识图谱应用于集群或者分布式环境,需要用数学理论的基础解决这些问题。

因此,计算机问题解决到一定程度时就会归结到数学问题上,在处理大规模知识图谱时需要对知识图谱进行划分,重新利用算力解决分布式问题。那么,在划分的过程中,如何让分区之后的知识图谱之间的关联性最小?为此,在这方面我们需要用到业内成型的或者前沿的算法,在满足数据规模跟分布式要求的同时满足图划分。

泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

但是,目前公开实现或记载的算法并不能完全解决所有的问题,一个是集群化问题,一个是分布式问题。因为在最小化切割边或者顶点数量情况下,很难同时满足各个机器之间的负载平衡和通信成本问题。

如何解决这些问题呢?我们的方式是对于没有权重的简单图,在指数内部把复杂度降到一个常数的程度。在有权图上,把其中的一个指数降到常数的复杂度,这都是比较前沿的研究成果。在超图领域,最终要把超图的切割问题作为次膜k-part的特例,在确定K值的情况下,进行求解是完全没有问题的。

泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

举例说明,对于一个简单图,有三条线的切割,在真正实践中可以简单的理解为把整个知识图谱切成三个集群的划分知识图谱。其中对于S2这个知识节点进行独立切割,另外一边S2是一个最小独立切割,这是我们作为一个简单的形象化描述,方便大家理解为什么把这个图分开。

从效果来讲,像METIS算法它在最小化跨越分区的顶点数上面,和后面的知识挖掘的时间上面比较均衡;像Hash算法,或者JA-BE-JA算法,在其中一方面可能表现不尽如人意,但是METIS算法表现是比较均衡的。

知识图谱与百业赋能

基于技术和行业的研究,泰凡科技构建了一套知识图谱平台,上层是应用服务体系,包括检索、知识的可视化查询、智能问答,底层把知识图谱的“五脏六腑”构建好。实际上,图谱最开始是一个语义问题,是基于语义网发展而来的。语义库的管理,包括知识如何更新、更新的颗粒度有多大、还有相关领域要覆盖多少实体、覆盖多少映射关系等,泰凡科技都会放在整体框架中。因此,这是一个非常通用的框架平台,适用于各行各业。

泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能

除此之外,整个框架中还集成了实际应用中的必备功能,比如要实现知识库全生命周期的管理,包括智能推荐、检索、扩展性,这些都是在产业落地实践中必须去考虑的问题。此外,很多关系探索挖掘,是可以依靠知识挖掘来解决。

在接下来的时间里,马国宁通过智慧园区、智慧楼宇、智慧交通、智慧航空、智慧科学数据分析等场景案例,详细介绍了知谱图谱在各行各业的实际应用。

“科技创新的星辰大海,未来的无限可能性,是更令人心潮澎湃的,这一点我深以为然。”马国宁表示,希望通过这次分享,能让更多的同行,或者其他有志于加入这个行业的从业者,能够更有信心的去应用人工智能技术,赋能千行百业。

​大会演讲回放及PPT已上线,进入官网查看精彩内容。​

以上是泰凡科技副总经理马国宁:图绘万象,从柯尼斯堡到百业赋能的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:51cto.com。如有侵权,请联系admin@php.cn删除