果蝇是一种明显不同于人类的昆虫,它们经常在变黄的香蕉或熟透的西葫芦上爬行。但在内部,它们实际上与人类共享75%的致病基因。几十年来,这些微小生物的基因组一直是科学家们探索某些特征如何代代相传的主要课题。然而,苍蝇可能很难追踪,因为它们很小,人类科学家很难区分它们。
这就是为什么杜兰大学的一组研究人员开发了一种名为“基于机器学习的苍蝇行为自动检测和注释”(MAFDA)的软件,该软件在6月底的一篇文章中进行了描述。他们专门设计的系统使用一个摄像头同时跟踪多只果蝇,并能识别出一只特定的果蝇什么时候饿了、累了,甚至是在向潜在的伴侣唱小夜曲。通过跟踪具有不同遗传背景的个体果蝇的特征,人工智能系统可以看到它们之间的异同。
“苍蝇是生物学中非常重要的模型。许多基本的发现都是从果蝇开始的——从染色体的遗传基础到辐射和突变再到先天免疫——这与人类健康有关,”杜兰大学生物化学和分子生物学教授邓武民(Wu-Min Deng)说。“我们希望利用这个系统能够真正识别和量化果蝇的行为。”
邓和他的研究团队不仅开发了一种机器学习系统,可以减少人为错误,提高研究效率,而且还能够识别出一种名为Fru的基因。
这种基因,已知控制信息素的产生,也被发现控制苍蝇如何闻到信息素和其他化学信号,这些信号是由周围的果蝇在交配时释放的。邓说,这种基因可以从身体完全不同的器官中控制相同的行为回路(当过度或不足表达时)。
定制设计的MAFDA系统使用摄像机同时跟踪多只果蝇,并可以识别特定果蝇何时饥饿,疲倦,甚至向潜在伴侣唱小夜曲。
“无果基因是苍蝇求偶神经行为的主要调节者,”邓说。
因为这个软件可以让研究人员将实验动物(包括老鼠和鱼)的行为可视化,跨越空间和时间,杜兰大学医学院的研究生、论文作者孙洁说,它使他们能够描述正常的行为,以及可能与疾病有关的行为。孙说:“MAFDA系统还允许我们仔细比较不同的苍蝇和它们的行为,并在其他动物身上看到这一点。”
冷泉港实验室(Cold Spring Harbor Laboratory)的计算机科学教授纳夫拉卡·萨克特(Navlakha Saket)没有参与这项研究,他说,科学家可以从计算机科学中获得灵感,并将其纳入生物学等其他领域。我们的大部分创造力来自于将不同的领域和技能交织在一起。
杜兰大学医学院的研究生刘文侃表示,通过监测果蝇的跳跃、行走或拍打翅膀,这一创新的人工智能系统可以让“我们对社会行为进行注释并将其数字化”。“例如,如果我们使用癌症苍蝇,我们可以尝试找出癌症苍蝇的社会事件,互动和社会行为与正常社会行为之间的区别。”
这种深度学习工具也是推动两个独立领域发展的一个例子:计算机科学和生物学。Saket说,当研究动物、人或环境时,我们获得了新的算法。“我们实际上是在从生物学中学习新的计算机科学。”
该系统还可以应用于药物筛选,并在未来用于研究进化或生物计算。
邓说:“这是我们研究的一个新领域。”“我们每天都在学习新东西。”