by Bob Yirka , Tech Xplore
来自巴比伦健康学院和大学学院的一个联合研究小组发明了一种算法,他们声称可以在重叠的医学数据集中找到信息之间的因果关系。他们写了一篇描述他们算法的论文,并将其上传到arXiv预打印服务器。他们还将在今年的人工智能发展协会会议上介绍他们的研究。
在人工智能研究中,寻找一种系统的方法来筛选数据,以找出单个病人出现特定情况的原因是一个重大挑战。如果一个病人最近打喷嚏的次数超过正常值,是不是因为过敏原被引入了他们的环境?或者他们感冒了?更糟糕的是,也许他们的鼻窦或大脑中有癌细胞。目前在这种情况下寻求正确答案的系统是基于人的。医生问问题,并搜索他们的记忆寻找答案。如果他们找不到,他们可以咨询其他医生或学习医学教科书或在线数据库。
这个系统有它的优点,当然,它是最好的。但它也有缺点,它受到人类记忆和足智多谋的限制。许多计算机专家认为有更好的方法让计算机来做这件事。目前这是不可能的,但科学家们正在研究。在这项新的工作中,研究人员引入了一个系统,该系统具有一种算法,可以分析来自不同、重叠数据集的数据,并找到因果关系。
该算法基于熵的概念,在熵中任何系统都会随着时间的推移变得更加无序。研究人员提出,熵与数据集中的信息一起存在,并且因果力比描述其结果的数据更有序。既然如此,就应该可以反向寻找原因,这正是他们的算法所做的。
该系统能够在比较已知因果关系的数据集时正确评估乳腺癌肿瘤的大小和结构,确定它们之间没有因果关系,但两者都是肿瘤是良性还是恶性的指标。
更多信息: Anish Dhir, Ciarán M. Lee. Integrating overlapping datasets using bivariate causal discovery. arXiv:1910.11356v2 [stat.ML]: arxiv.org/abs/1910.11356
原文链接:https://techxplore.com/news/2020-02-ai-relationships-overlapping-medical-datasets.html
声明:本文由 Newfellow 编译,中文内容仅供参考,一切内容以英文原版为准。