2020-06-05 1450基因相关
在这个“大数据”时代,人工智能(AI)已经成为科学家的宝贵盟友。例如,机器学习清楚地解释了基因调控,机器学习算法正在帮助生物学家理解控制基因功能的数量惊人的分子信号。但随着分析更多数据的新算法的发展,它们也变得更加复杂和难以解释。定量生物学家Justin B.Kinney和Ammar Tareen有一个策略来设计高级的机器学习算法,使生物学家更容易理解。
算法是一种人工神经网络(ANN)。神经网络受到神经元在大脑中连接和分支方式的启发,是高级机器学习的计算基础。尽管有自己的名字,人工神经网络并不是专门用来研究大脑的。
生物学家,如Tareen和Kinney,使用人工神经网络来分析一种叫做“大规模平行报告分析”(MPRA)的实验方法的数据,该方法研究DNA。利用这些数据,定量生物学家可以制作神经网络,预测哪些分子在一个称为基因调控的过程中控制特定的基因。
细胞并不总是需要所有的蛋白质。相反,它们依赖复杂的分子机制来根据需要打开或关闭产生蛋白质的基因。当这些规定失效时,通常会出现混乱和疾病。
“这种机械性的知识——理解基因调控是如何工作的——常常是能够开发针对疾病的分子疗法和不能开发的区别,”Kinney说。
不幸的是,标准人工神经网络从MPRA数据中形成的方式与科学家在生命科学中提问的方式大不相同。这种失调意味着生物学家很难解释基因调控是如何发生的。
现在,Kinney和Tareen开发了一种新的方法,可以弥合计算工具和生物学家思维方式之间的鸿沟。他们创造了自定义的ann,在数学上反映了生物学中关于基因和控制它们的分子的共同概念。通过这种方式,这对科学家实际上迫使他们的机器学习算法以生物学家能够理解的方式处理数据。
Kinney解释说,这些努力突出了现代工业人工智能技术在生命科学中的优化应用。Kinney的实验室已经验证了这一定制人工神经网络的新策略,并将其应用于研究多种生物系统,包括与人类疾病有关的关键基因电路。
Cold Spring Harbor Laboratory. "Finally, machine learning interprets gene regulation clearly." ScienceDaily. ScienceDaily, 26 December 2019. www.sciencedaily.com/releases/2019/12/191226134100.htm.