日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

如何識別商業數據報告中的假數據

時間:2022-03-16來源:世界你獨自悲傷瀏覽數:734

對于大部分職場人士來說,當你們拿到一份日報周報或者月報時候,第一反應是去看整個報告中的結論,其實這是大錯而錯!你們是否遇到過當自己花了很多時間在解讀一份數據分析報告的時候,突然間突然發現原來數據報告中的某些數據是錯的,這個時候你們有什么感受?是不是想把這個報告的作者罵一頓?我之前在參加很多企業的工作例會的時候,這種場景反復的出現,主要原因就是,大家根本沒有意識到在解讀數據報告的第一步,其實是應該是去檢查,發現數據報告中是否有錯誤或者不客觀的數據。

商業報告解讀和數據分析動作的第一步永遠是數據的清洗和整理。昨天在群里面和大家聊這個問題的時候,有些人說我的數據是從公司系統導出來的,沒有問題,肯定是真的;或者說我的數據是某個權威機構發布的,也不會有問題的。說這種話的人一般太年輕了,這是一個人艱必拆的過程,這是一個多么痛的領悟的過程,我曾經在數據分析師的圈子里面做過一個調查數據分析師的十大傷心事件,這一條排在第一,話不多說上圖。

問題來了:你中槍幾條?

所以建議大家今天看完這篇文章之后,把你的公司的一些日報周報月報,等數據拿出來,再看看,看看是否也有一些不正確或者是客觀的數據,做一個深度練習題。

需要我們判斷是否正確的數據和信息包括:

1,你公司內部的各種商業報告,日報周報月報,營運報告,銷售報告,商品報告,生產報告都通通歸到這個范疇。

2,來源于外部渠道的行業相關報告,統計數據,平臺數據等。比如你的客戶提供給你的競爭對手數據。

3,互聯網上的一些數據和信息。相信大家有共識,互聯網上一些假的數據,假的信息非常之茂盛。其實很容易理解,很多互聯網的數據都是基于PR為目的來發布的,不是為了給你看真實的數據,而是為了打廣告,從而獲得關注、傳播和流量。例如每年的雙11,各大公司紛紛公布自己的實時銷售數據,其實這些數據背后都是經過各種處理、加權、篩選后才給大家看的。

4,信息也需要甄別真假。我們重視數據,但往往忽略了對信息的判斷。在互聯網時代數據是一種信息,信息背后也是數據,他們是互相交融的,同樣在互聯網上也充斥著這種虛假的信息。例如微博、朋友圈經常見有人發丟失的小孩,丟失的準考證,傳言誰又收購了誰,誰又即將破產等等,其實這里面很多信息都是虛假的信息。

虛假的數據還會來源你日常的工作和生活中,和客戶的談判,和領導的交流,我閨蜜的竊竊私語......這里面有大量的信息也需要我們去進行有效的判別。例如你的男朋友徹夜未歸,你當然需要去判斷他的解釋是否是真實,這也是屬于這個范疇。所以我們可以從日常生活中的方方面面去鍛煉自己識別假數據和信息,不客觀數據和信息的能力。一個人能力的高低,其實從某個方面來說是取決于他對數據和信息處理能力的高低。

所以解讀數據報告的第一步其實是判斷報告中數據的真假,一般來說數據報告的真假識別有兩種方法邏輯法和數字規則法,今天講邏輯法。

邏輯法包括看數據報告中的極值、平均值、中位數、眾位數、空值、重復值、異常值等方法。

01 極值法

極值法有包括極大值和極小值,有時候助理給你的報告多輸入了一位數字或者點錯了小數點都很容易看出來的,在常態報告中這樣的數據會顯得特別突兀,比較容易看出來。極值法主要是針對報告中容易出現的低級錯誤的一種判斷方法,大家常加練習把它變成一種看報告的習慣。

02 平均值法

這是一種比較大眾化的方法,平均值在我們的工作中無處不在,也可以說無孔不入。平均值判斷數據真假的方法是兩個層面,第一,總體的平均值大于個體的平均值。第二,平均值有誤導,報告中不適合用平均值的方法。

大家看這張圖,你能在30秒內找到問題錯誤的數據嗎?為了迷惑大家,數據比較多,其實平時你們看的數據報告也差不多這樣的數據量吧?

你花了幾秒找到錯誤的數據?

相信眼尖的小伙伴一樣就能看出其中的問題呢,全國的銷售同比增長和全國的退貨率這兩個數據是錯誤的,所有區域的這兩個數據都小于全國平均數據,這怎么可能呢?這就是總體平均值大于個體平均值的情況,偶爾在一些奇葩報告或助理手抖的時候也會出現。如果你曾經遇到過,那就恭喜你中獎了。

第二平均值有誤導的顯現這是普遍出現的問題,不是所有數據都適合用平均值這個指標的,例如全國平均工資這個數據,每年的春夏之交的時候,有關部門都樂此不疲的公布這個數據,然后全國人民都吐槽說自己的工資被增長了。是的,平均值有自己的適用范圍,當個體數據呈現正態分布(知識點,大家可以自行展開學習)的時候才有效,然后我們國家的工資收入兩級分化實在太嚴重,平均值有誤導有被富豪們拉高的趨勢。

再舉一個極端的平均值的例子,假定某個公司有兩個員工,月工資8000元和6000元,當然平均工資就是7000羅。有一天老板激勵這兩個員工說:“下月開始我們公司要提高平均工資水平,平均工資必須達到1.5萬元”。這兩個下屬高興死了,坐等漲工資。然而過了一個月老板請來了一個CEO,月工資3.1萬元,三個人的平均工資正好1.5萬。

再說一個可能是真實的案例,數年前,當房價如火箭般躥升時,某位官員卻說要在一年內將**城市的房價降下來,一年后當地的房價真的“如愿以償”的被降下來了,背后的秘密就是平均數,只不過之前的數據只是城區的平均房價,一年后把郊區的房子加入數據池,這樣的平均房價不降都難。

其實這些把戲都是數據的處理伎倆,在解讀數據報告的時候我們不能簡單的只看平均值,有的時候還必須要看中位數和眾位數。如果對方只是給到你平均值也一定要問一下這個平均數包括哪些對象(人貨場邏輯),企業平均工資是否包含CEO?企業平均同比增長是否剔除一些異常值。

03 中位數

指一組數據最中間的數字,例如7,10,100(奇數個數時),中位數為10。如果是7,10,20,100(偶數個數時),中位數15(中間兩個數字的平均值)。當數據兩級分化嚴重的時候,中位數比較能反應數據真實的一面,靠譜一些。在每年我的一個數據產品《年度目標制定模板》中,我們采用了上市公司財報數據作為參考,其中同比增長用平均值就有問題,有些公司由于發生了重組等狀況,同比增長數據大的可怕(有基數太小的原因),所以我一律采用中位數作為參考值。

例如17年第一季度所有上市公司的平均同比增長是167.3%,然而中位數只有17.4%的同比增長,顯然后者更有意義。

04 眾位數

指一組數據中出現次數最多的數字,它比較反應大多數人的狀況,所以叫眾位數。善于數據忽悠的HR會在招聘的時候用平均工資,在給老板匯報工作的時候用中位數或眾位數工資,已期達到不同的目的。

再把平均值、中位數、眾位數再做一個梳理,在平均工資這個指標上,這三個指標大概呈現如下圖的排列(圖片來自于網絡)。如果你想報喜不報憂,你會選擇匯報哪個數據?

當然統計局只公布平均工資其實還有一個技術問題,計算平均工資只需要企業提供工資總數和員工人數即可,但是要統計中位數、眾位數則需要企業提供完整的職員收入明細,這其實是有難度的,沒有想象中那么簡單。

對于以上四個方法,如果只是一份數據報告還比較簡單,通過肉眼或者簡單的計算就可以得出這四個數據。當數據量比較大的時候(如基礎數據上萬行)肉眼就不管用,此時可以使用excel自帶的函數處理:最大值:max(),最小值:min();第n大值:large(),第n小值:small()。如某個區域最2大值,第5小值這兩個函數就可以派上用場了;平均值:average(),中位數:median(),眾位數:mode()。

05 異常值

對業務豐富的人來說,看數據報告的時候是有第六感覺,有些數據從邏輯上不能馬上判斷是否正確,但是冥冥之中就是覺得這個數據有問題。例如下圖是某公司上個月各分公司HR提報的離職率數據,表面上看這些數據沒有問題。但是對于老江湖的你可能一眼就能看到那兩個扎眼的7.9%和一個7.8%,因為在你的企業有個規定分公司月離職率大于或等于8%要扣分公司HR經理的績效獎。所以,懂了吧?

當然這只是懷疑,疑似有問題,不代表真正有問題。但是關鍵數據這道門檻確實是很多數據要做手腳繞開的動力。例如企業規定,零售賣場月目標完成90-99%營業員按2%提成,100-110%按4%提成,100%就是一個關鍵點位,如果你本月拼死拼活只能完成98%,你會怎么做?(大家可以討論一下你們知道的那些招兒)所以當某個店鋪最終完成100%或101%的時候,你就可以有理由懷疑一下了。

06 重復值

一個數據報告中出現多次重復的數據,可能是碰巧,也可能是做表的時候忘了刪除,還可能是有鬼。例如下面這經典的一個神樣的數據:我國城鎮登記失業率,它竟然12個季度沒有任何變化,都是神奇的4.1%。數據來自于統計局公告。

重復數據如果出現在同一個表或圖中比較容易識別,另外兩種情況重復就需要考驗讀圖者的記憶力或知識儲備了。

A、和以往的報告重復。作為銷售主管上個月你匯報給經理的客戶拜訪率是45%,本月的月工作總結仍然是45%,這就值得懷疑你根本沒有去改PPT數字的動作,都在敷衍。

B、和其他人的報告重復。作為銷售人員,有些報告互相借鑒是常事,但是你可以借鑒報告的形式,但是千萬別借鑒報告中的數據啊,這很容易被你們的老大看穿的。一個真事兒,當年我在做快消管一個城市的時候(long long ago,九幾年的事情),一個同事就借鑒了我的一份銷售月報,當然他把其中的一些數據也借鑒過去了。后果是他被警告,我被批評,我多冤啊?!

所以數據報告解讀關鍵第一步一定是識別報告中數據的真假,千萬別忘了。閱讀完本文后你們可以在互聯網搜索(百度文庫有各種數據報告)對應報告來練習這一部分內容,當然基本層面還是日常看報告的時候就養成這個數據鑒別的習慣。


(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢