为什么每个研究者都应该学点数据可视化?

2020-06-28 2068文献解读

来源 Knowable Magazine
撰文 Betsy Mason
翻译 张元一
审校 戚译引

想象一本没有图片的科学教科书。没有图表、图形或是带有箭头和标签的插图或流程图,科学将变得更加难以理解。人类天生就是视觉动物,而科学的视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。

麻省理工学院(MIT)博德研究所(Broad Institute)的创意总监王邦(音,Bang Wong)指出,可视化可以揭示很难或无法以其他任何方式找到的模式、趋势和联系。他说:“通过绘制数据点,我们可以看到数据的基础结构,这在表格上是看不到的。”

但是,很少有科学家会像在生成数据或撰写报告时一样,对视觉效果给予同等的关注。结果就是科学中充斥着糟糕的数据可视化效果,使读者感到困惑,甚至可能误导画出它们的科学家。数据视觉效果不足会降低科研质量,并阻碍科研进展。随着越来越多的科学图像进入新闻和社交媒体,解释从气候变化到疾病爆发的种种现象,糟糕的视觉效果还有可能损害公众对科学的理解。

然而,科学家很少接受可视化培训。新南威尔士大学的数据可视化科学家西恩·奥多诺休(Seán O’Donoghue)曾作为主要作者,在《2018 生物医学数据科学年年度综述》(2018 Annual Review of Biomedical Data Science)上发表了一篇关于生物医学数据可视化的文章,他指出:“科研群体整体上还没意识到,这项工作很有必要。”

不过也出现了进步的迹象。在过去的十年中,学界至少召开了两次致力于科学数据可视化的年度会议。从 2010 年至 2016 年,《自然·方法》(Nature Methods)杂志定期刊登有关创建更好的图形和图表的专栏文章,然后将其改编为科学家向该杂志提交论文的指导。但是到目前为止,关注这个问题的科学家仍然很少。

改善科学可视化需要我们更好地了解人脑看世界的优点、缺点和偏见。 “关于什么有效而什么无效,我们已经积累了很多实用的知识,”犹他大学的计算机科学家米里亚·梅耶(Miriah Meyer)说,“有许多原则经过时间的考验,并一遍又一遍地被证明是有效的。”

图表的选择

人类视觉系统的演化是为了帮助我们在自然世界中繁衍生息,而不是阅读图表。在 20 世纪 80 年代初期,贝尔实验室的统计学家威廉·克利夫兰(William Cleveland)和罗伯特·麦吉尔(Robert McGill)开始研究人类感知的细节如何影响我们理解数据图形的能力,以了解哪种图表我们更容易理解,哪种图表看起来更吃力。在 1984 年发表于《美国统计协会杂志》( Journal of the American Statistical Association)上的开创性论文中,克利夫兰和麦吉尔根据人们阅读内容的便捷程度,对视觉元素进行了排名。

他们的实验表明,人们最擅长根据条形或线段的长度来阅读图表,例如标准条形图。当准确识别各项值之间的细微差别很重要时,这些可视化是最佳选择。

研究还发现,参与者们很难判断方向、角度和面积的差异。使用体积、曲率或阴影来表示数据的图形更加困难。而体现差异最差的办法是通过色彩饱和度。

1-1.png

在这个名单中一路往下,“受众察觉微小差异的能力将越来越差”,华盛顿大学的计算机科学家杰弗里·希尔(Jeffrey Heer)说。通常,最佳做法是使用列表中满足每种数据类型需求的、排名最为靠前的图形元素。

例如,如果数据展示的重点是表明一种特定疾病的致死性远大于其他疾病,那么使用圆圈大小代表死亡人数就可以了。但是,要强调致死性较低的不同疾病之间死亡人数的微小差异,条形图将更加有效。

2010 年,希尔使用亚马逊的 Mechanical Turk 众包服务检验克利夫兰和麦吉尔的排名,证明它在现代数字环境中仍然是正确的。从那以后,希尔、奥多诺休和其他人使用众包来测试可视化的许多其他方面,以找出最有效的方法。奥多诺休说:“它在整个领域都具有强大的力量,并确实奠定了坚实的工程基础。”

有害的饼图

克利夫兰和麦吉尔的图形排名突出显示了为什么某些受欢迎的数据图效果不太好。一个很好的例子就是受欢迎的饼图,爱德华·塔夫(Edward Tufte)这样的数据可视化专家早就对它不屑一顾。塔夫在 1983 年发表的颇具影响力的论文《定量信息的可视化显示》(The Visual Display of Quantitative Information)中写道:“比一个饼图更糟糕的图表,只能是多放几张饼图。”

饼图通常用于比较一个整体中的各个部分,这是一项挑战认知能力的视觉任务。读者需要判断每块饼图之间的面积差异,或中心的角度的差异:两种类型的差异辨别都比辨别条形图的柱子长度差异要困难得多。在很多情况下,条形图都是更好的选择。

饼图之所以诱人,是因为它们通常比条形图更具吸引力,易于填充颜色并且易于绘制。但是饼图很少是最佳选择,只有在有限的情况下才可以接受。如果目标是显示各部分的总和,或者将这些部分与该整体进行比较(而不是各部分之间互相比较),而精度并不重要的话,一张制作精良的饼图就是合适的。

例如,一张饼图可以很好地描述每个经济部门对温室气体排放的贡献,表明大约一半来自电力和热力生产以及农业、林业和其他土地利用。通常最受关注的交通运输占了很小的一部分。在这种情况下,将六个条形图并排放置并不能立即显示出这些部分的总和为 100%,或每个条形图所占整体的比例大小。

1-2.png

在某些科学学科中,饼图只是显示特定类型数据的标准做法,而且我们很难推翻这种传统。“在表观遗传学中的某些领域,我们必须展示饼图,”王邦说。他正与博德研究所的生物医学科学家合作,创建了更好的可视化效果,“我知道饼图的缺点,但是(这个领域)每一篇论文都用饼图展示,因此人们继续坚持用它”。

在其他情况下,饼图还需要人类大脑完成额外的信息处理工作,这让它们难以传递准确的信息或连贯的故事。

谨慎选择条形图

尽管条形图易于阅读和理解,但这并不意味着它们始终是最佳选择。在心理学、医学和生理学等一些领域,条形图通常会歪曲基础数据,掩盖重要的细节。

“条形图是在对计数或比例进行可视化时应该使用的图形,”美国明尼苏达州罗彻斯特市梅奥诊所的生理学家特蕾西·魏斯格伯(Tracey Weissgerber)说,“但是,对于连续数据的可视化,它们并不是一种非常有效的策略。”

魏斯格伯在2015年对顶级生理学期刊进行了一项调查,发现约有85%的论文至少包含一个条形图,代表血压或体温等连续数据,每个样本可以在相关范围内取到任何值。但是代表连续数据的条形图可能无法显示一些重要信息,例如每个条形图代表多少个样本,以及条形图内是否有亚组。

1-3.png

例如,魏斯格伯指出,妊娠并发症先兆子痫可能源于母亲、婴儿或胎盘的问题,但是在各个患者分组中又存在通过不同病理途径产生相同症状的亚组。“我们的工作重点目标是了解和识别患有先兆子痫的不同亚型的女性,”魏斯格伯说,“问题之一是,如果我们将所有数据都显示在条形图中,就无法展示不同亚组。”

条形图尤其不适用于基础生物医学中常见的小样本量研究。条形图无法显示样本数量有多小,而离群值会对条形图高度指示的平均值产生很大影响。

魏斯格伯说:“挑战之一是,在基础生物医学的许多领域中,条形图仅仅在展示连续数据的时候是可接受的。”

对于小型连续数据集,有几个很好的替代图。散点图、箱形图和直方图都可以揭示数据的分布,但是在魏斯格伯分析的论文中,它们很少被使用。为了帮助解决这个问题,她开发了工具来创建简单的散点图和各种其他的交互式图形。

毁灭性的彩虹图

要想突出显示数据的不同方面,并为科学图表增添生气,使用颜色是非常有效的,但这也是最容易出错的方法之一。人类对颜色的感知并不直接,大多数科学家在选择颜色代表其数据时并未考虑视觉系统的特殊性。

最常见的糟糕做法之一就是使用彩虹色标。从地质学到气候学再到分子生物学,研究人员倾向于使用彩虹色绘制数据图,但是彩虹调色板有几个严重的缺点,事实上很少有人推荐它。

1-4.png

王邦说,尽管彩虹图是从自然光谱得出的,它的颜色顺序也不是很直观。“你不得不想一想,蓝色比绿色大吗?黄色比红色大吗?”

更大的问题是人脑对彩虹图的感知并不是均一的。人们感知颜色的方式结合了色调(例如红色或蓝色)、饱和度(颜色的强度)和亮度(混合了多少白色或黑色)。人类的大脑最依赖亮度来解释形状和深度,因此倾向于将最亮的颜色表示为峰值,将较暗的颜色表示为山谷。但是彩虹图中最亮的颜色是黄色,通常会在刻度的中间某个地方发现,导致观众在错误的地方看到高点。

1-5.png

使问题更加复杂的是,颜色之间的过渡有时似乎是渐进的,而有时似乎更为突然。另一方面,基础数据通常具有一致的变化率,与彩虹图的不均匀性不匹配。英国雷丁大学的气候科学家埃德·霍金斯(Ed Hawkins)说:“你可能会在彩虹图上看到不存在的界限,或者忽略确实存在的界限。”甚至科学家在解释自己的数据时也可能陷入这种错觉。

为了避免彩虹图带来的问题,一些研究人员提出了基于数学的调色板,可以更好地将颜色的感知变化与相应数据的变化匹配。其中一些较新的色标特别适用于有红绿色色盲的人,据估计这种疾病会影响约 8% 的男性(但它仅影响一小部分的女性)。

1-6.png

尽管制图学家和霍金斯等一些科学家一直在反对彩虹图,但数十年来,它在科学文献中仍然普遍存在。自从彩色打印发明以来,某些科学领域可能就一直在使用它。而且,由于许多科学家并不了解彩虹图的问题所在,因此他们认为没有理由违背传统。霍金斯说:“人们习惯了使用它,所以他们喜欢它,并且没觉得它有什么问题。”

彩虹色标是科学家用来创建可视化效果的许多软件的默认色,这个事实也鼓励了这种倾向。霍金斯和其他人一直在推动软件开发者更改其默认设置,并取得了一些成功。

2014 年,MathWorks 将 MATLAB 软件程序的默认设置切换为一种改进的配色方案,称为 parula。2015 年,一位认知科学家和一位数据科学家开发了一种名为 viridis 的新默认配色方案,用于使用流行的 Python 编程语言进行绘图。一种新的数学派生配色方案 cividis 也被添加到十来个软件库里,尽管在所有软件库中都不是默认设置。

危险的热图

人类视觉系统最有趣的怪癖之一是,我们对颜色的感知可能会受到附近其他颜色的影响。这也是数据可视化中最棘手的问题之一,在某些情况下它的干扰非常显著,导致各种视错觉的产生。

只要可视化将彼此相邻的不同颜色,甚至是相同颜色的阴影放置在一起,它们就可以以意想不到的方式进行交互。完全相同的颜色在被较暗的阴影包围时,看起来与被较亮的阴影包围时完全不同,这种现象被称为同时对比(simultaneous contrast)。一个有名的案例就是棋盘格阴影错觉,当阴影跨过棋盘格图案的时候,大脑诠释颜色的能力就受到了干扰。

1-7.png

王邦说:“颜色相互作用的影响是一个严重的问题。”在生命科学中一个普遍的例子是热图,通常用于揭示两组数据之间的关系。“如果翻阅杂志,你会发现三分之一的图表都是热图。这是一种非常流行的数据可视化形式,实际上会让人们对科学数据的理解产生偏差,”他说。

热图是一个二维矩阵,通常是一张图表或网格,使用网格中每个正方形的颜色表示基础数据的值。一种或多种色调的较浅和较深的阴影表示较低或较高的值。热图在显示基因活性数据方面特别受欢迎,可帮助研究人员在不同情况下都能确定出产生高活性或者弱活性蛋白质(或其他分子)的基因模式。

1-8.png

热图非常适合将大量数据打包展示。但是,将各种颜色的阴影紧挨在一起同时也会触发对比度错觉。例如,当科学家比较网格中各个正方形的颜色的时候,他们很容易以为两个不同的橙色阴影是相同的,或者以为两个相同的阴影完全不同,这都取决于周围正方形的颜色。

“在热图中这是一个巨大的问题,你需要依靠一堆彼此相邻的彩色方块。” 王邦说,“这种无意识的偏见在每一张热图中都非常普遍。”

对于基因活性数据,绿色和红色通常用于显示各个基因的活跃程度。对于同一种绿色而言,它被较深的绿色、红色或黑色包围时,看起来和被较浅的绿色包围时非常不同。尽管同一个绿色阴影表示的值始终是相同的,但是读者可能会觉得它的值看起来更高或者更低,取决于其相邻的格子的颜色。

举例来说,网格中出现一团亮绿色的方块,可能意味着该基因在一组亲缘关系密切的亚种(例如细菌)中具有很强的活性(如下图)。同时在网格的另一部分,一个暗绿色的正方形由于被黑色正方形包围,看起来很亮,那么读者可能会认为该基因在另一种和它们没有亲缘关系的细菌中具有很高的活性,尽管它实际上活性很弱。

1-9.png

王邦说,缓解问题的一种方法是在网格的各个部分之间引入一些空白,来隔开不同分组的相关物种、样品或基因。分散开正方形将减少来自相邻颜色的干扰。另一种解决方案是使用完全不同的展示形式,例如使用线连接高活性基因的图形,或用一系列图形来代表基因活动随着时间或在两个实验状态之间的变化。

混乱的信息

确保可视化不会歪曲数据或误导读者,这对于共享科学成果至关重要。与此同时一张图表是否真正吸引了读者对最相关信息的关注,而不是分散读者的注意力,这也是同样重要的考虑因素。

例如,当绘制为线图或直方图时,许多数据集的分布将呈钟形,大部分数据位于中心附近。“但是我们经常关心尾巴上的东西,”王邦说。对于读者来说,“中间这一大坨常常让人感到不堪重负。”

解决方案可能是使用高度以外的其他方式,来表示数据的分布。一个选项是条形码图,该图将每个值显示为一条线。在这种图形上更容易看到低浓度区域的细节,这些细节往往在钟形曲线上几乎消失了。

1-10.png

深思熟虑地应用颜色还可以增强并且阐明图形的信息。例如,在使用不同颜色标识数据类别的散点图上,最重要的信息应该由最突出的颜色表示。制图程序可能会将红色随机分配给对照组,只因为它是数据的第一列,而对于研究结果至关重要的有趣的突变只能分配到灰色。

“纯色在自然界中并不常见,因此请节制地使用它们,只用来突显图形中的重要内容,”数据可视化记者阿尔伯托·卡洛(Alberto Cairo)在其 2013 年出版的的《功能艺术》(The Functional Art)中写道,“将柔和的色调用于其他情况,例如灰色、浅蓝色和绿色。”

除了彩虹图和同时对比之外,还有许多其他方法可能使颜色标注出现问题。使用过多的颜色会分散可视化效果的主要信息。彼此太相似或与背景色太相似的颜色可能难以辨认。

违反文化预期的颜色也会影响读者对图形的理解程度。例如,在显示地形的地图上,人们期望植被是绿色的,干旱地区是棕色的,海拔更高的是白色,城市是灰色的,水是蓝色的。如果地图不遵守这些公认的配色方案,阅读起来会更加困难。想象一下美国的选举地图把民主党区域显示为红色,共和党区域显示为蓝色,或者想象条形图以明亮、欢快的颜色显示不同的死亡原因,这些不和谐之处将使人们更难以吸收图中的信息。

1-11.png

如果颜色并非必需,有时最安全的做法就是坚持使用灰色阴影。正如塔夫在其 1990 年的《信息可视化》(Envisioning Information)一书中指出的那样:“将色彩带入信息领域的首要原则就是不要造成灾难:首先,不要伤害。”

可视化的未来

奥多诺休说,许多数据可视化问题仍然存在,是因为科学家根本不了解它们,或者不相信付出额外的努力绘制更好的图表是值得的。

为了改变这种状况,他一直致力于通过启动和主持年度 Vizbi 会议。该会议专注于可视化生物科学,为科学家举办可视化研讨会,并整理文献收集最佳做法和最差做法的证据,这些文献已汇总到他的 2018 年年度综述论文中。但是总的来说,他表示这些努力还没有获得很大的支持。“我认为我们还有很长的路要走。”

这个话题缺乏关注的原因之一是,大多数科学家没有接受任何有关数据可视化的培训。理科研究生很少需要这样做,而且大多数机构都不提供基于科学可视化设计的课程。奥多诺休说,对于许多学生而言,特别是生物医学科学领域的学生来说,他们唯一接触数据可视化的地方就是统计学课程,但这些课程并没有针对他们的需求而量身定制。

此外,在展示数据的方式上,科学家还倾向于遵循惯例,使得坏习惯长期存在。

对抗习惯的一种方法是,将更好的设计原则纳入科学家用来绘制数据的工具中,例如一些软件工具已经从“彩虹”默认设置切换到更符合视觉规律的调色板。奥多诺休说,大多数科学家都不会学习更好的可视化实践,“但是他们将使用工具。如果这些工具备用具有更好的设计原则,那么他们就能跟着默认设置做到这点。”

他说科学出版商也可以提供帮助。“我认为期刊可以通过设定标准来发挥作用。”早期职业科学家从经验丰富的同事和已发表的论文中汲取线索。一些期刊,包括 PLoS Biology、eLife 和《自然·生物医学工程》(Nature Biomedical Engineering)已经对魏斯格伯在 2015 年的条形图研究做出了回应。她说:“自论文发表以来,许多期刊已经修改了政策,禁止或不鼓励将条形图用于连续数据,特别是对于小型数据集。”

随着科学数据变得越来越复杂,科学家将需要继续开发新型的可视化工具来处理这种复杂性。为了使这些可视化效果对科学家和公众都有效,数据可视化设计人员将必须对人类的视觉处理进行深刻的研究,以便与大脑合作,而不是与之对抗。

原文链接:https://www.knowablemagazine.org/article/mind/2019/science-data-visualization 

本文版权(包括图片及文字)属于“科研圈”(微信公众号:keyanquan),禁止二次转载,如需转载请联系keyanquan@huanqiukexue.com

上一篇下一篇