生物学研究:实验和数据的辩证法
康乐
郭小森
雷红星
■本报记者 韩天琪
作为生命科学领域最新的分支学科,基因测序等新的生物医学技术正在颠覆传统的生物学研究方法。海量的数据处理正在把生物学家们的工作从实验台上拉向脑旁。如今,全世界的生物学家不得不承认这样一种现实:要想成为一名生物学家,你还得是个统计学家,甚至是程序员。你得会写算法才行。
学科发展带来的新趋势对生物学家们来说意味着什么?而该领域的专家学者和学生要怎样应对这一变化?
从实验台到脑桌
说起作为实验科学最典型代表的生物学的研究场景,人们第一时间会想到一个穿着白大褂的科学家坐在实验台前使用移液管、培养皿和护目镜,在显微镜下观察凝胶。这被生物学家们称为“湿实验”。很长一段时间,“湿实验技术”决定了一个生物学家所能达到的高度。
不过,现在这种研究场景正在悄然发生变化。牛津大学大数据研究所统计遗传学教授吉尔·麦克维恩曾表示,如今,基因组研究的大部分工作都是在脑上完成的,很少会用到实验台。他说:“那些成立15年以上的研究所里,90% 都是湿实验室,但如果你进去看看,就会发现,几乎人人都坐在脑前。现在建立的生物医学研究中心里,仅有10% 的湿实验室,其他90% 都是脑计算实验室。”
“总的来说,生命科学的研究已经逐渐从传统的利用生物学的技术或方法进行研究的模式转变为需要综合多个学科、多种方法来做综合性研究以解决生物学问题。”华大基因人类基因组学项目总监郭小森在接受《中国科学报》记者采访时表示,其中最具代表性的就是基因组学的研究。
不同于传统生物学研究分支,基因组学的诞生先天带有数据处理的基因。
众所周知,基因组学是一个新兴学科,可以看作是传统生物学中遗传学的分支,以人类基因组的研究作为代表和标志。伴随着人类基因组计划的完成,基因组学的研究开始大规模兴起,同时也带动了生物信息学、计算生物学等新的研究领域的发展。郭小森认为,这些鲜明的特点揭示出生命科学或基因组学的研究方式确实在发生转变。
实验vs数据
研究方式的改变不仅仅意味着生物学家们工作场景及所需技能的改变,其背后还有研究逻辑的深刻变化。
麦克维恩认为:“科学界一个重大的变化,是人们渐渐抛弃之前那种专一、有针对性、假设引导的模式,即那种‘产生想法、设计实验、进行实验、验证结果’的模式。”
在传统实验科学中,假设是一切研究的起点,它的来源是人类的思考和智慧。idea(灵感)往往被科学家们视为整个研究中最珍贵的部分,体现了人类对自然的理解和驾驭。
但脑桌前的生物学研究颠覆了从产生想法到完成验证的模式。
“现在基因组研究产生实验数据的速度太快,根本分析不过来。”中国科学院北京基因组研究所研究员雷红星告诉《中国科学报》记者,研究的内容太复杂,往往无法在设计实验前想清楚假设,所以“我们先去测,测完再看是怎么回事”。
不过,在中国科学院院士、中国科学院动物研究所研究员康乐的研究领域中,研究方法还是以做实验为主。“我们主要通过数据找问题。”
“我们能够通过分析大数据来找到更多的新问题,或是过去没有发现的规律,但它不能代替实验。”康乐说。
适应综合性研究方法
面对这种研究方式的转变,很多受到传统生物学训练的生物学家们确实存在着适应新的研究方法的问题。
“我们在近几年的基因组学的研究中遇到过,即使从国内很好的大学毕业,以生物学技能为主要目标培养的学生在毕业后来做基因组学研究确实会碰到一些障碍。”在郭小森看来,这个障碍对自身来说首先要对这个学科、研究领域的发展有比较清晰的认识,尤其是对基因组学的研究而言,“已经是需要以大规模的基因组数据的分析作为主要内容来解决一定的科学问题”。其次,需要自身作一些改变来适应这种变化。“比如掌握一些必要的数据处理的方法,包括统计学、计算机编程等。”
雷红星和郭小森认为,对于一些从业已久的生物学家来说,需要整合多方面的资源。“最好组建人员、知识或技能互补模式的研究团队进行科学研究,这样的话会达到比较好的效果。毕竟,一个人很难作为全才,在生物学、计算机和数学领域都达到一个很高的程度。”郭小森建议。
为了适应这种变化,国内的生物学本科培养已经开始调整培养目标和授课计划。如据雷红星介绍,中国科学院大学已经在本科生中开设了生物医学大数据相关课程,授课内容是各种各样的基因组学、表观组学、蛋白组学和医学的大数据类型,“告诉学生有哪些方法、资源网站等”。
近些年国内其他高校也逐渐开始加入生物信息学、计算生物学等课程。“一个比较有意思的现象是,很多学校类似课程的开设是从计算机学院开始的,对于生物信息学或计算生物学领域来说,最容易入门的学科是从计算机入手。”郭小森说,研究领域的特点也带来了学生培养模式上的改变。
生物学研究的基础还是生物学问题
在研究方法剧烈改变的现状下,实验还是生物学的基础吗?
面对这样的问题,郭小森认为,生物学的研究最终还是要回归到生物学问题。
“无论是计算机,甚至数学方法等等,其实都是研究领域的学科发展导致的,尤其是密集型数据已经成为社会发展的趋势,不光是生命科学,物理、化学等实验学科也会涉及大数据。我们在当前这样一个形势下,如何利用好大数据辅助我们解释更多的生物学问题,是生物学领域的关键核心所在。”郭小森说,即使数据量再大,最后还是要回归到生物学问题,是为生物学问题的解决来服务的。
郭小森坚信,虽然我们趋向于综合性研究方法,趋向于使用数学的、统计学的方法,计算机算法来研究生物学问题,但最终这样的研究还是会回归到科学问题上,要通过实验的验证来确定和确认。
康乐断言,将来大数据的方法会在生物学的所有分支学科中使用越来越广泛。“这是一个大趋势。”
《中国科学报》 (2018-11-12 第7版 观点)