- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-05-08來源:反差帥瀏覽數:204次
數據質量的高低其實是一種感知,很大程度上不在于數據提供方、數據治理方,而是在于數據消費方,只有數據消費方能準確定義數據需求的滿足度

今天早上剛起來,我發現朋友圈和多個專業聊天群里被一條博文刷屏了:

該博文宣稱3月全國個人所得稅同比下降51.3%,和2020年3月、2021年3月比,顯著暴跌,然后開始感嘆經濟凋敝、民不聊生,得到了我朋友圈里的財經界、科技界人士的共情,并迅速成為十萬加熱文。我在一個朋友的朋友圈里提醒他,這條信息可能不太準確,還被反唇相譏了。

作為咨詢顧問,我自然對財經數據很敏感,個稅的確是和經濟緊密相關的,直觀地想,就算是經濟再不景氣,同比暴跌51.3%肯定是不可能的,另一方面,我朋友圈里情緒比較大主要是因為對上海疫情處置,但是這也是3月份底以后的事情啊。所以,我判斷今年3月份的個稅同比變化,肯定是一個異常數據。
我思考的問題很容易就找到了答案——如果當我們把數據分析窗口拉大,不是“同月”對比,而是用“YTD(year to date)”數據來比的話,?我們會發現數據變動并沒有那么大——我找到了一個數據(下圖),今年1-2月份,個稅同比大增了46.8%。

所以大家來做個算術吧,今年一季度中國的個稅收入和去年同比變化是多少?
這個例子帶給我們在數據治理和數據分析的啟示是:
一、數據質量的高低其實是一種感知,很大程度上不在于數據提供方、數據治理方,而是在于數據消費方,只有數據消費方能準確定義數據需求的滿足度
二、數據會騙人,尤其是數據使用者預設了心理假設,他總能通過數據分析來證明他想象中的真相;數據使用者要具備利用數據進行事實探測的能力,而不是被“投喂信息”(數據->信息->知識的過程優化)
三、數據分析不適合使用固定指標和固定格式,要充分利用數據源和數據倉庫,根據數據分析的業務思考,靈活調整分析維度(例如本例的時間維度)
四、數據分析的水平,跟用啥工具沒太大關系,跟用數據的人的水平有關系。
最后,這個給我們帶來的啟發是:上網需智商,噴人要謹慎。