多模态知识图谱应用
相比于单模态知识图谱,多模态知识图谱能够综合多种类型的数据,从而可以让智能体更深入的感知和理解真实的数据场景,因而多模态知识图谱在各个领域都有广泛的应用。如图像检索、模型推理与生成、模型预训练等。以电子商务为例,通过多模态产品图谱,可以对产品进行更细致的表示,再通过预训练,可以增强大型模型对电子商务领域的多模态知识理解,从而推动电子商务平台的发展。
AliMe MKG是阿里提出的一种面向直播的知识图谱,与传统的知识图谱不同,它的目标是向顾客种草某一产品,而非解决顾客的问题。因此,它需要构建逻辑思维链,引导用户需求。例如,在该左图1的知识图谱示例中,“熬夜"导致"皮肤暗沉"问题,这就需要"皮肤白皙”,而含有"甘草酸二钾"成分的"面膜"产品适合相应的用户。
在电商直播领域,这种知识图谱有两种应用:智能辅播和虚拟主播。智能辅播是在真人直播间构造了一个智能助理机器人,来协助主播去做商品介绍。比如说用户问的是口红,直播间内有多个口红,智能辅播就会将相关的信息展示出来给用户进行浏览,当用户点击确认,选择一个感兴趣的口红之后,辅播就会从知识图谱中抽取相应信息,以商品卡片信息的方式让用户和图片进行交互。除此之外,智能辅播还可以回答用户丰富的产品相关问题。比如用户问尺码的时候,辅播可以去推出文本介绍和对应的尺码图,用文本及图片来回答用户的咨询。
虚拟主播则是一个智能的直播间虚拟人,通过自动生成图文剧本介绍商品,生成具有吸引力和认知的知识型短视频,从而可以影响客户的购买决策。因此,多模态的知识图谱可以促进电商的发展。
另一个是医疗诊断的案例,这是一个基于多模态知识图谱的医疗健康问答系统示例。它首先利用多种方法获取用户提交数据的关键信息,并确定用户查询的主题意图,建立用户的知识需求模型。在知识匹配阶段,我们计算用户需求与医疗健康知识的相关度,并消除可能的歧义,最终向用户提供匹配度高的医疗健康知识。
参考资料:
Chen Z, Zhang Y, Fang Y, et al. Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey[J]. arXiv preprint arXiv:2402.05391, 2024.
Xu G, Chen H, Li F L, et al. Alime mkg: A multi-modal knowledge graph for live-streaming e-commerce[C]//Proceedings of the 30th ACM International Conference on Information & Knowledge Management. 2021: 4808-4812.
https://mp.weixin.qq.com/s/rW9ezfkAgOHAsICYuiPq6A
https://mp.weixin.qq.com/s/bTqr5EEQD5_rModP8NR99g
韩普,叶东宇,陈文祺,等.面向多模态医疗健康数据的知识组织模式研究[J].现代情报,2023,43(10):27-34+151.