導讀:數據可視化將原始數據的含義綜合為連貫的內容。當設計師將引人注目的圖像優先於準確性時,可視化效果就會矇蔽掉數據分析結果。為了以完整性傳達數據,數據可視化分析人員必須避免常見的數據可視化錯誤。本文作者對此進行了梳理盤點,與大家分享。
使用數據可視化來進行數據分析的過程是“獲取無聊的平面數據,並通過可視化將其變為現實。” 但是,在數據分析的過程中很多人開始敏銳地意識到可視化有可能會變成讓數據以錯誤的方式呈現,甚至有的人開始提出:“可視化經常被用來擾亂數據分析過程。”
在我們互聯網信息快速發展下,數據比以往任何時候都更加豐富和可通過互聯網隨時訪問,但是當組織發佈有誤導性的數據可視化(有意或無意)分析時,人們對數據分析結果的信任感就會大打折扣。
所以在使用數據可視化分析的過程中,我們需要注意到哪寫設計因素會讓可視化產生誤解,或者是什麼樣的方式才能清晰的把數據分析結果通過可視化形式展現出來。
一、數據可視化中的盲點
圖形上的卓越之處在於,它可以在最短的時間內為觀眾提供最多的創意。
從生理學上看,人類的視覺和認知是自然界最不可思議的現象之一:
光進入眼睛。
鏡片將信息從光線發送到視網膜。
視網膜翻譯信息並向視神經發射信號。
視神經每秒向大腦傳輸20兆比特。
從看到到思考的飛躍是瞬時的,在如此迅速的觀察和理解時刻,數據可視化證明瞭自己的價值。在這裡,許多可視化內容告訴查看者他們在數據中“應該”看到的內容,而過度勞累的大腦沒法進行細緻的思考而會下意識的產生贊同。
公平地說,誤導性的可視化並不總是刻意去產生的,可能是一些細節沒有被注意到,而導致的誤差出現。但即使是無意識的錯誤也會誤導觀眾。眼睛令人印象深刻,人類總是會傾向於減少自行思考以尋求快速的信息獲取。所以視覺和認知必須是所有數據可視化設計中的關鍵考慮因素。
二、要避免的10個數據可視化錯誤
1. 誤導的色彩對比
顏色是最具說服力的設計元素之一。甚至細微的陰影變化也會引起強烈的情感反應。在數據可視化中,高度的色彩對比可能使觀看者認為價值差異大於實際差異。
此熱圖的高對比度配色方案使紅色區域看起來似乎比黑暗區域代表的值幅度要大得多,可視化的熱力圖用顏色描繪值的大小。較高的值顯示為橙色和紅色,而較低的值顯示為藍色和綠色。值之間的差異可能很小,但是顏色對比度會產生熱感和增強的活動感。
小結:
顏色不僅僅是區分數據系列的一種方式。
高對比度的顏色配對使觀看者感受到更大程度的數據差異。
2. 3D圖形使用不當
3D圖形在數據可視化方面帶來了兩個嚴重的問題。
當一個3D圖形部分阻擋了另一個圖形時,就會發生遮擋。這是在自然世界中模擬空間的結果,在自然世界中,對象的X,Y和Z座標不同。在數據可視化中,遮擋會遮蓋重要數據並創建錯誤的層次結構,其中無遮擋的圖形顯得尤為重要。
遮擋和變形都使準確比較數據變得困難
當3D圖形通過縮短縮入圖片平面或從圖片平面伸出時,就會發生失真。在繪圖中,節距使對象看起來好像它們佔據了三維空間,但是在數據可視化中,它創建了更多錯誤的層次結構。前景圖形看起來較大,背景圖形較小,並且數據序列之間的關係被不必要地扭曲了。
小結:
3D圖形它們有可能阻礙重要信息並混淆數據系列之間的比例關係。
除非絕對需要3D圖形,否則以2D形式顯示數據。
3. 數據太多
這是一個永恆的設計問題-在尋求清晰溝通的過程中要包含哪些內容和減少哪些內容。數據可視化也不例外,尤其是在數據既豐富又發人深省的情況下。
吸引眼球?藉助單個可視化文件即可得出深刻的結論。
解決問題?人類沒有足夠的能力來計算以視覺形式抽象的多個值的含義。
單個可視化文件中的過多數據會立即使觀看者不知所措
當可視化包含太多數據時,信息就會淹沒,並且數據會融化成大多數觀眾無法忍受的圖形
小結:
當信息過載適用於數據可視化。如果一次顯示太多,則數據區域需要劃分。
與多個可視化對象進行數據分析會更有效。
4. 省略基線和截斷量表
數據變化有時很大,例如根據地理區域衡量收入水平或投票習慣時。為了使可視化效果更加生動或美觀,設計人員可以選擇操縱圖形上的比例值。
一個常見的示例是省略基線或在零以上的某個地方開始Y軸,以使數據差異更加明顯。
另一個示例是截斷數據系列的X值,使其看起來與較低值系列相當。
小結:
審美吸引力要服從準確的數據表示。
忽略基線和截斷刻度以故意誇大或最小化數據差異是不道德的。
5. 偏向文字說明
建議的行為是說服的藝術。告訴某人他們應該在圖像中看到什麼,他們可能會看到。可視化附帶的文本(支持副本,標題,標籤,標題)旨在為觀看者提供客觀的背景信息,而不是操縱他們對數據的感知。
小結:
當在數據集之間繪製關聯時(通常暗示因果關係),通常會出現有偏文本。
通常,有偏見的文本來自客戶,並且由設計師來標記問題。
6. 選擇錯誤的可視化方法
每種數據可視化方法都有其自己的用例。例如,餅圖用於比較整體的不同部分。它們適用於預算明細和調查結果(同一個餅圖),但並不是要在不同的數據集(不同的餅圖)之間進行比較。
餅形圖可用於可視化三個競爭企業的收益,但條形圖可使兩個企業之間的差異(或相似性)更加明顯。如果可視化旨在顯示一段時間內的收入,則折線圖將比條形圖更好。
餅圖用於比較整體的各個部分。使用它們比較不同的數據集(例如不同公司的收入),不會給觀看者帶來什麼洞察力
小結:
數據可視化方法並非一刀切。
瞭解可視化必須傳達的變量。
7. 令人困惑的相關性
可視化數據集之間的相關性是一種有益的方式,可以使觀看者對主題有更廣泛的瞭解。顯示相關性的一種方法是將數據集覆蓋在同一張圖上。當仔細考慮相關性時,重疊會導致aha時刻。當疊加層數量過多時,觀眾很難繪製連接。
也可能以錯誤地暗示因果關係的方式可視化相關性。一個著名的例子是,由於天氣溫暖,冰淇淋銷售量的增加與暴力犯罪的激增有關.
數據可能顯示出相關性,但並不等於因果關係
小結:
突出顯示與非常接近的多個可視化的相關性可能會有所幫助。這使觀看者可以評估數據並仍然建立連接。
值得重申。相關不等於因果關係。
8. 放大有利數據
數據和時間是密不可分的。可以放大時間範圍,並顯示有利於更廣泛的敘述的數據。可視化財務績效是常見的罪魁禍首。考慮一個圖表,該圖表在短時期內顯示出強勁的數字,使企業似乎在蓬勃發展。不幸的是,縮小顯示該公司僅經歷了小幅上升,並出現了急劇且持續的下跌。
短時間放大的可視化效果可能會使觀看者誤入歧途
如果放大的可視化效果與數據的整體含義不一致,請告知觀眾。
9. 避免常見的視覺關聯
視覺設計元素會影響人類的心理。圖標,配色方案和字體均帶有影響觀看者感知的內涵。當設計師忽略這些關聯或避開它們而轉而使用創意表達時,這種情況很少會發生。
分析數據可視化在精神上是費力的。在認知的關鍵時刻,大腦可能不需要花時間來解讀熟悉的設計元素的重新構想。
該可視化圖按區域描繪了活動,但其顏色與地理地圖(藍色水,綠色和棕色土地)中使用的方案太相似
小結:
有無數種方法可以將創造性實驗引入數據可視化。不要通過強迫觀眾重新解釋常見的視覺關聯來分散觀眾的注意力。
10. 首先使用數據可視化
數據可視化使難以互聯化的數字成形。當數據很複雜並且有多個變量在起作用時,它們會揭開含義。但是可視化並不總是必需的。
有時候,簡單的統計數據和豐富的色彩足以說明問題
如果可以使用統計數據清晰,簡潔地傳達數據,則應該如此。如果文本描述證明具有洞察力,並且顯示數據形狀幾乎沒有影響,則不需要可視化。
小結:
數據可視化是一種交流工具。像所有工具一樣,有時它是合適的,而另一種工具是更合適的。
本文由 @數據可視化那些事 原創發佈於人人都是產品經理,未經許可,禁止轉載
題圖來自 unsplash,基於 CC0 協議
轉載請超鏈接註明:頭條資訊 » 在數據可視化中,最容易犯的十大錯誤
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。