2020-11-30 884基因相关
机器学习清楚地解释了基因调控,在这个 "大数据 "时代,人工智能(AI)已经成为科学家的宝贵盟友。例如,机器学习算法正在帮助生物学家理解控制基因如何运作的令人眼花缭乱的分子信号。但随着新算法的开发,分析更多的数据,它们也变得更加复杂,更难解释。量化生物学家Justin B. Kinney和Ammar Tareen有一个策略,设计出更容易被生物学家理解的高级机器学习算法。
这些算法是一种人工神经网络(ANN)。受大脑中神经元连接和分支方式的启发,ANNs是高级机器学习的计算基础。而且尽管名字很好听,ANNs并不是专门用来研究大脑的。
像Tareen和Kinney这样的生物学家,使用ANNs来分析一种名为 "大规模并行记者分析"(MPRA)的实验方法的数据,这种方法研究DNA。利用这些数据,定量生物学家可以制作ANN,预测哪些分子在称为基因调控的过程中控制特定基因。
细胞并不是一直都需要所有的蛋白质。相反,它们依靠复杂的分子机制,根据需要开启或关闭产生蛋白质的基因。当这些调节失效时,失调和疾病通常会随之而来。
"这种机理知识--了解基因调控这种东西是如何工作的--往往是能够开发出针对疾病的分子疗法和不能开发的区别,"Kinney说。
不幸的是,从MPRA数据中塑造标准ANN的方式与科学家在生命科学中的提问方式有很大不同。这种错位意味着生物学家发现很难解释基因调控是如何发生的。
现在,Kinney和Tareen开发了一种新方法,弥补了计算工具和生物学家思考方式之间的差距。他们创建了定制的ANN,在数学上反映了生物学中关于基因和控制基因的分子的常见概念。通过这种方式,这对夫妇基本上迫使他们的机器学习算法以生物学家可以理解的方式处理数据。
机器学习清楚地解释了基因调控,Kinney解释说,这些努力凸显了如何优化现代工业人工智能技术在生命科学领域的应用。在验证了这种制造定制ANN的新策略后,Kinney的实验室正在将其应用于研究各种各样的生物系统,包括涉及人类疾病的关键基因回路。
Cold Spring Harbor Laboratory. "Finally, machine learning interprets gene regulation clearly." ScienceDaily. ScienceDaily, 26 December 2019. www.sciencedaily.com/releases/2019/12/191226134100.htm.