实验心理学家赤瑞特拉(Treicher)作过两个著名的心理实验,一个是关于人类获取信息的来源,就是人类获取信息到底主要通过哪些途径。他通过大量的实验证实:人类获取的信息83%来自视觉,11%来自听觉,这两个加起来就有94%。还有3.5%来自嗅觉,1.5%来自触觉,1%来自味觉。人类通过视觉感知外界物体的大小、明暗、颜色、动静等对人类机体生存具有重要意义的各种信息。
视觉图像可以帮助我们解读数据,做出判断,帮助我们了解数据中体现出来的倾向、模式、趋势、关系。可视化是我们洞察数据的最为有效的手段,而图表就是最常用的数据呈现形式,但即便图表中已经包含了全部的数据事实,但通过图表控制信息显示的方式,仍然可以扭曲人们对数据的理解,从而达到别有用心的一些目的。图表中的每个元素都影响着最后的视觉呈现,所以我们需要了解到图表制作中所包含的关键要素。
图表呈现其实表达的还是信息和逻辑,人们看到图表后,人脑会创造自己的一套逻辑,将非现实的信息予以合理化。我们的习惯会使得我们忽略事物的真实面貌。亲眼看见的才信,对看不见,不能理解的一概不信,这是一般人判断真伪的方法。传统想法加上历害关系,使人们只看到他们想要看的。为了将图表陷阱说的更清楚,文中的图例更多参考或引用了网络中的案例,文末可能未罗列完整,如有遗漏,还请见谅。
1、图表误区
图表构造中的每个细节点,都可以被用来误导呈现。通常情况下坐标轴的变幻是常见的陷阱。X和Y轴的起始数值和刻度比例的变化,都会影响到图表的最终呈现形式,或夸大效果、或掩藏损失。
(1)传达错误信息—放大部分数据,忽略信息的本质
2008年美国总统大选,奥巴马(民主党)VS.麦凯恩(共和党),其中蓝色代表民主党,红色代表共和党.
2008年美国总统大选中,奥巴马所在的民主党获胜。但是为什么这个图表反映了与事实相反的情况?原因在于,地图上色块大小由地理面积决定,不能反映真实权重(选票)。类似地,跨国公司可能会利用这种手段夸大自己在国外的经营情况。一家只在某国几个城市有业务的公司,可能会在报告财务指标时将整个国家涂上颜色。
从图例上来看,红色占据地图的大部分面积,它必定意味着红色所代表的共和党必定拥有多数选票。事实上,008年美国总统大选中,奥巴马所在的民主党获胜。但是为什么这个图表反映了与事实相反的情况?原因在于,地图上色块大小由地理面积决定,不能反映真实权重(选票)。类似地,跨国公司可能会利用这种手段夸大自己在国外的经营情况。一家只在某国几个城市有业务的公司,可能会在报告财务指标时将整个国家涂上颜色。
(2)错误构造图例—缺失的 Y 轴
人们习惯于观察图表的大小和形状,但是会忽略上面的具体数字。最简单的方式就是不在y轴上做标注。如果你的x轴上有5个柱,但是没有数字标注出它们的相对高度,那人们就难以判断它们之间是否有显著的差异。
他解释道:“粉色轴线告诉我们该组织所做的乳房检查次数在不断减少,红色轴线则显示堕胎手术实施次数逐渐上升。这反映了该组织的现状。”乍一看,这张图的确显示Planned Parenthood实施的堕胎手术数量猛增,同时癌症检查的次数却急剧下降。读者还可能被误导,认为从2010年起该组织实施的堕胎次数远远多于预防检查次数。但这并非实情。这张图最大的错误在于没有明显的y轴,因而两条数据线随意交叉,让人误以为327000比935573还要大呢。
美国事实核查型新闻网站Politifact "数据分析师"核对了以上数据,从Planned Parenthood年度报告中选取了堕胎手术和预防性措施的数据。数据范围调整合理后,信息展现如下:
如图所示,癌症检查和预防服务的数量的确呈下降趋势,这和原图表相一致。但这些检查的次数仍远远大于堕胎手术次数。下图采用了另一种展现方式,用的是这两项服务逐年的百分比变化:
(3)错误构造图例—错误的比较
以美国白宫错误计算高中毕业率为例,在12月中旬,美国白宫的官方账号发了一条推特:“好消息:美国高中毕业率已升至历史最高水平。”推特配图如下:
此图有好几个问题值得商榷。首先,"数据分析师"在数据图里用图形元素作单位从来都不是个好主意。用五本书代表75%、或者用16本书代表82%是几个意思?这到底是个柱状图,y轴就应该以零作为起始值。同样的数据,采用合适的比例后呈现如下:
(4)错误构造图例—更改起点
如下的图例,起点为0,缩小差距。
当有人"数据分析师"说所有折线图的y轴都应该以0为起始点时,我们都应该想想这张图。全球平均气温即使仅仅变化了1度,也会影响巨大,但这张图从零开始计数,气温的变化就显得微乎其微了。针对需要细微化呈现内容时,就一定需要细节粒度的支持了,起始坐标轴不一定需要从0开始。
如下的图例起点非0,放大差距。
(5)错误构造图例—更改间距
在y轴上使用很大或很小的数值。数据在1-50之间,把y轴的高度增加到100来隐藏数值之间的差异;如果你要凸显差异,就把y轴上的单位扩大10倍。如果是用十分位来测量,那么3和10之间的差异就很明显(相差70个单位),但是如果你的第一个单位就是100,那么3和10之间的差异几乎看不出来(比一个单位小太多了)。
从总范围的中间部分开始标注y轴。如果你的数据在11-51之间,你可以从10开始标注y轴,让最小的数值看起来更小,让最大的数值看起来更大。这样代表11的竖条就只是刚刚高过x轴一点点,看起来非常不显眼,除非是特别仔细的人才能看出你的y轴是从10而不是0开始的。这样一来,代表51的竖条比代表11的竖条高了50倍,因为最矮的竖条只有1个单位那么高。如果图表是从0开始标注的,那么代表51的竖条比代表11的只高了不到5倍。
使用不合适的缩放比例。每次你看到那一行“不成比例”的小字时,就是这种情况了。这并不总是故意的,有时候数据之间差异太大,无法在同一页图表里表示出来。但是,你可以利用它来达到你的目的。举个例子,人们视觉上对大小的判断会被高度所吸引,但是会忽略竖条的宽度,如果某个东西很高(例如建筑物),就会显得比实际更窄或更宽。
如果没有特殊用途,通常图表的长(横轴)与高(纵轴)的比例为1:1到1:2之间,如果在这个范围之外,数据现实的结果会过于异常。比如:
(6)混淆视觉配色
英国《卫报》的《全球死刑地图》以世界地图为视觉背景,在各个国家所处的版图位置上用圆圈大小显示其死刑数量。中国被涂上了极具隐喻意味的红色,而且以压倒性优势成为全球死刑数量最多的国家,最终在视觉上呈现出扩张性与攻击性趋势。
“彩虹地图”是基于光谱中的色彩制作的地图,《美国水资源协会杂志》(Journal of the American Water Resources Association)就利用了彩虹地图,展示了美国各州水资源蒸散总量的情况。
这幅彩虹地图运用了很多颜色,视觉上也挺美观的。但是有一个比较严重的问题是,地图中将美国从中划分了两个部分,右边都是深绿色和蓝色,而左边是浅绿色、黄色和橙色。因为左边和右边的颜色色相相差较大,读者很容易就会认为美国东西部水资源蒸散情况相差很大。
实际上,我们仔细看看图例就会发现,色相变动非常大的部分,对应的数值变动非常小。这就很容易误导读者,他们会首先根据色相的大差异判断东西部的水资源情况差异大,然而事实并非如此。
一句话总结图表误区:你看到的信息,可能已经失真、被混淆、不是最重要的部分
2、视觉误差
视觉误差,即错觉,是指人们对外界事物的不正确的感觉或知觉。最常见的是视觉方面的错觉。产生错觉的原因,除来自客观刺激本身特点的影响外,还有观察者生理上和心理上的原因。其机制现在尚未完全弄清,来自生理方面的原因是与我们感觉器官的机构和特性有关,来自心理方面的原因是和我们生存的条件以及生活的经验有关。
(1)左右脑
大脑的左右脑分工是不同的,你的左脑读出单词,你的右脑看到的更多的是颜色
(2)不可能图形
局部线索在认知上都是合理的,但整体来看,却是一幅不可能的图画,正复合格式塔心理学的概念,整体不等于部分之和。
(3)两歧图形
每个人心中都有一个世界,你看到的和我看到的是一样的么?两歧是指对这些图形有两种或两种以上的解释。在看成一种图形时就不会看成另外一种图形,它和知觉的稳定性有关。
(4)颜色知觉
当人眼一看见某色立即产生的感觉称为色彩知觉。这种反应是下意识的,带有普遍性,在实际生活中,色彩的生理现象与心理现象往往是分不开的。人眼对某些色彩刺激后产生生理上的疲劳会引起心理上的厌倦,使人产生联想。你看到的可能是骗人的,色彩只是一种主观的知觉么?
如下面的图,你心中的春天是什么颜色呢?
如果仅仅放置了一张图片,告诉你find your spring,寻找你的春天,这是一个品牌的广告,从品牌内容上并没有呈现任何有关春天的故事,而仅仅传达了一个温暖放松的氛围,从图片上可以随意联想,用户可能会有很多个触点被引导到这个广告上面。
(5)大小长度错觉
大小错觉是指 大小一样的物体,在一些比它大的物体中看上去显得小,而在另外一些比它小的物体中则显得大的视觉现象。这种错觉是因物体与其所处参照系或与其他物体的关系不同而形成的。其种类包括艾宾浩斯错觉、德勃夫错觉、贾斯特罗错觉和月亮错觉等。其中艾宾浩斯错觉最为典型。
(6)错视图形
错视,又称视错觉,意为视觉上的错觉。属于生理上的错觉、特别是关于几何学的错视以种类多而为人所知。就是当人观察物体时,基于经验主义或不当的参照形成的错误的判断和感知。视错是指观察者在客观因素干扰下或者自身的心理因素支配下,对图形产生的与客观事实不相符的错误的感觉。我们日常生活中,所遇到的视错觉的例子有很多,圆的不圆,方的不方,是世界的扭曲,还是我们心理的扭曲?下面的图是鸭子?还是兔子?
(7)视觉后像
盯着灯泡看三十秒钟以上,尽力不要移动目光。然后把目光移到任何白色的区域。看到灯泡发光了吗?这就是经典的“视觉后像”。
一句话总结视觉误差:眼见未必为实。
一、背景 ROMA承接很多复杂图表的渲染需求,在京东金融APP内,特别是首页首屏的图表,对图表渲染的及时性要求很高。近期业务反馈频繁重启时,首页的黄金走势图偶现渲染不出的问题,通过梳理图表的渲染流程,对缓存策略、视图加载和渲染过程进行了重构,确保渲染成功率,提升了渲染速度以及补充了异常重试的功能。二、使用场景分析 京东金融App内有很多使用复杂图表的业务场景,以下截取部分场
Kubernetes 是最流行的容器编排和部署平台。它的强大功能特性,可以保障在生产中可靠地运行容器化应用程序。然而,有灵活性的同时也带来了复杂性,在本文中,我们将探讨许多团队遇到的 10个常见 Kubernetes 陷阱。能够识别并避免这些挑战将提高应用程序的可扩展性、可靠性和安全性,同时让你更好地控制集群及其部署。
1、数据营销陷阱(1)数据营销陷阱——营造数据环境市长政绩工程某市市长上任三年,该市中小学数学考试成绩稳步上升,市长以此为据,宣传自己的教育改革颇有成效。实际情况是,市长上任后,指示教育厅要逐年降低数学考试试卷难度,卷子容易,分数自然就高。至于孩子们有没有学得更好,无从得知。如果不排名的话,自信心应该还是有提升的吧煽动民族情绪在安倍参拜靖国神社后,有74.6%受访者倾向对日本强硬反制(环球舆情调
你不相信数据,引导你相信数据,你相信数据,引导你不要相信数据,其实讲的都是逻辑。从数据到信息的过程我们总结为如下三个关键逻辑步骤,没有对步骤再做过于细节的拆解。1、数据处...
每天早上9:00到公司,迟到要罚款;中午12:00去吃饭,慢了好吃的就没有了;晚上18:00要回家,晚了老婆不开心。我们熟练的使用着时间,毕竟小学二年级课本上就开始讲时间了。可时间究竟是什么?哲学家认为过去、现在、未来等时间概念只不过是人的幻觉。牛顿说:绝对钟的读数就是时间。爱因斯坦说,时间和空间一起,构成了被称为时空的实体。看看大神的答案,本来可以理解的时间,一下子就糊涂了。人类文明探索了几千年
创新管理 -【集团管控】众人看待协同办公,颇有些雾里看花:究竟什么是协同办公,集团企业和单一企业的协同办公又有哪些差别……拨开协同办公的迷雾协同办公这个名词对大部分人来说并不新鲜,因为协同办公的很多内容和工具,比如工作流、文档管理等,都是OA(办公自动化)等概念中早已有之的。但说起协同办公到底是什么,很多人又是一头雾水,模棱两可,分不清“协同办公”和“协同办公软件”的差别。那么,协同办公就是协
文|智能相对论作者|佘凯文任何一个行业都有周期性,就好像我们在做股票投资的时候,提到最多的就是周期规律,因为只有掌握规律才可以让我们赚到钱。所以不论是哪家公司都逃脱不了行业周期的宿命。行业寒冬方显强者本色就拿手机行业来说吧,手机演变史可以分为功能机、半智能机和智能机。但是不论处在哪个阶段,都有企业顺势而为,也有企业业绩一落千丈。还记得曾经如日中天的诺基亚手机,让它成为多少人美好的回忆。然而即使在飞
究竟是个人计算机(PC)还是电视(TV)会统治数字家庭?这项争论曾经喧嚣一时。现如今,情况已经比较明了,就是两者都能够担此重任,只是都会结合一大堆其它功能而已。“数字家庭宴会”已变得如此拥挤不堪,以至有时各种标准欠缺互操作性,无法协同工作。 在向数字媒体风风火火地变迁过程中,各行其是成为了主调。联网标准各行一套。安全标准也纷繁芜杂。Linux的变种数不胜数,在诸如远程访问和服务质量等领域的问题也比
高性能计算(High Performance Computing)技术自从诞生以来,就一直被视为是IT技术的高端领域,拥有一套完备的高性能计算环境往往是一些国家级科研机构的特权。时至今日,我们却可以欣喜的发现,在尤其注重实效的工业企业领域中,越来越多的企业正在引入服务器集群设备,逐步构建自己的HPC计算系统。由此可大胆断言:HPC技术已然成熟,HPC市场蓄势待发。其实长久以来,企业用户与高性能
编者按:天底下没有免费的晚餐,互联网也不例外,越来越多的免费域名
安全随云而动的变革也为国产软件提供了新的机会,来展现自己的肌肉。衷心希望国产软件能够腾云驾雾自由飞翔,抛开传统的羁绊,踏上新的征程。与此同时,也祝愿中国用户放下各种安全猜疑,扎实布局,跟随各路安全豪杰,健步走向云端,享受云端便捷、环保、智能、可靠的各种云服务。
“我以为自己捡到大便宜,没想到全是‘托儿’好评。”最近,北京市民刘女士在某电商平台下单一款“正品特价”运动鞋,结果收到货后才发现质量一般。翻看评价,满眼皆是“超赞”“物美价廉”等模板化好评,让消费者如同步入精心设计的数字陷阱,也折射出电商平台、社交媒体评价体系中“刷单炒信”乱象屡禁不止。 识别难:“刷单炒信”阵地向暗处转移 在流量经济的背景下,“刷单炒信”呈现更加多样化
试读第4章。由于本章篇幅较长,这里只摘录部分供您试读。让您感受本书的组织结构和思路,判断其实用性。
在云计算领域,一般我们会根据不同的应用场景将云计算划分为:私有云、公有云、混合云这三种类型。不管是公有云还是私有云,都有一个非常鲜明的特点,就是可以按需使用、按量计费。私有云一般是由企业自行建立的,运维成本较高,基础架构投入也比较大,一般较大规则的组织会考虑建立自己的私有云平台。而公有云则提供了更大的灵活性,也就是说公有云是由公有云的服务提供商来建设的,企业只需要根据使用的资源大小来按需获取,按量计费,企业可以将精力专注于业务本身,而不是实施和维护IT架构和系统上。
新增试读ACL
在现代软件开发中,“数字迷宫Java”问题涉及在一个复杂的数字网格中进行路径寻找与优化。这项技术挑战不仅仅是简单的迷宫寻路,而是需要实现高效的数据处理和动态路径规划。在这篇博文中,我们将探讨这个问题的解决方案,通过不同的结构来详细介绍版本对比、迁移指南、兼容性处理、实战案例、性能优化和生态扩展等内容。### 版本对比在处理“数字迷宫Java”问题时,处理方式和使用的库版本带来了显著的特性差
你是否在升级GitBucket时遇到过数据库迁移失败、功能不兼容等问题?本文将提供从4.22版本到4.44版本的完整升级指南,帮助你避开90%的常见陷阱,实现无缝过渡。读完本文后,你将掌握:版本差异分析、数据库迁移步骤、Java环境配置、关键功能迁移方法以及回滚预案。## 版本差异概览GitBucket从4.22到4.44版本经历了22次迭代,累计超过50项重要更新。其中**H2数据库升级...
中间件,我给它的定义就是为了实现某系业务功能依赖的软件,包括如下部分:Web服务器代理服务器ZooKeeperKafkaRabbitMQHadoop HDFSElasticsearch ES (本章节)其实在我们前面的章节里面已经涉及到这个映射(Mapping)概念,今天我们来详细介绍下他。想象一下关系型数据库(如 MySQL,虽然我还未讲解他,下个章节就会涉及到数据库)。在创建表之前,你需要定义
在 Spring Boot 中使用 JUnit 进行单元测试非常简单,官方已帮你集成好 JUnit5(Spring Boot 2.x 默认),只需 3 步即可跑起来。下面给出一份「最小可运行」示例,并补充常见场景(Mock、Web、事务)的写法,复制即可用。照着以上模板,10 分钟即可把 Spring Boot 项目的单元测试跑起来;运行:IDEA 在方法左侧点击 ▶ 即可,首次会自动编译并启动容器,完成后看到绿色条即通过。1.引入依赖(已自带,确认即可)对应包下生成模板,再补。即可看到行/分支覆盖率。
你是否还在为Shell脚本中的同步任务阻塞主流程而烦恼?是否需要一套轻量级方案实现任务的异步化与解耦?本文将基于Bunster的异步命令特性,构建一个类消息队列的任务处理架构,让你的Shell脚本具备企业级异步处理能力。读完本文你将掌握:异步命令基础用法、任务队列设计模式、错误处理机制及生产环境部署方案。## 异步命令核心能力Bunster通过`&`符号实现命令的后台执行,这是构建异步架构...
在开发网页的过程中,Kendo UI Splitter 和 Kendo UI TreeView 小部件提供了许多功能。Splitter 小部件是一个组织可折叠、可展开和可调整大小的内容部分的出色工具。这种类型的功能通常并不那么容易实现。TreeView 小部件提供了一个功能丰富的分层无序列表版本,具有一些非常实用的图形功能、可折叠的树部分以及大量方法和事件。这两个小部件都应该为您的网站增添很多价值。