做重要決策時,算法絕對比人靠譜得多
人類并非可靠的決策者;他們的判斷受到不相關(guān)因素嚴重影響,比如當時的情緒。我們將這種隨機變量稱為“判斷噪聲”。對很多公司的利潤而言,噪聲都是一筆隱形成本。
人們早已知道,簡單統(tǒng)計學(xué)算法做出的預(yù)測和決策往往比專家更準確,哪怕專家能獲得比算法更多的信息。但鮮有人知的是,算法的關(guān)鍵優(yōu)勢在于沒有噪聲:與人類不同,輸入相同信息,公式得出的結(jié)果也相同。因為穩(wěn)定十足,哪怕是簡單甚至有瑕疵的算法,也比人類專家的準確性高。
噪聲VS.偏見
當人們考慮判斷和決策中的差錯時,想到的總是社會性偏見,比如對少數(shù)族裔的成見、自負等認知偏差以及盲目樂觀。而被我們稱作“噪聲”的無用變量屬于一種不同的差錯。
為了理解兩者區(qū)別,你可以想想浴室的體重秤。如果讀數(shù)太高或太低,我們可以說,體重秤出現(xiàn)了偏差。如果你的體重取決于腳的位置,那么可以說體重秤有噪聲。
顯然,弄清員工決策時的偏差和噪聲情況,對組織幫助很大,但很難直接收集相關(guān)信息。在評估這些差錯時會出現(xiàn)不同問題。其中一大問題是,決策帶來的結(jié)果只有在未來才能看到(如果產(chǎn)生了結(jié)果的話)。比如信貸員往往要在數(shù)年后才能發(fā)現(xiàn)他們批準的貸款結(jié)果如何。他們幾乎從不知道自己拒絕申請者的后續(xù)情況。
噪聲”審查
噪聲審查的意義不在于出報告,最終目的是提高決策質(zhì)量。只有部門領(lǐng)導(dǎo)者能夠接受不理想的結(jié)果,并有所行動時,審查才能成功。如果高管能將這種調(diào)查看作自己的分內(nèi)事,目標更易達成。
首先,我們讓相關(guān)專業(yè)團隊的負責(zé)人整理出若干個現(xiàn)實項目的文件以供評估。為防止實驗信息外泄,整個過程在同一天完成。員工被要求用半天時間分析2到4個項目。他們將按常規(guī)估算出每個項目的錢數(shù)。為防止串通,參與者不知道本調(diào)查與可靠性有關(guān)。
我們?yōu)槊總€項目設(shè)計了噪聲指數(shù),對下面這個問題做出了解答:“兩個隨機選擇的員工做出的判斷相差多大?”我們將該差異量化為他們平均值的百分比。
比如兩個員工對同一項目的估值為600美元和1000美元,他們估算的平均值就是800美元,他們估值的差距是400美元,所以兩人的噪聲指數(shù)就是50%。我們用同樣方法計算了所有員工配對的估值,然后計算出了每個項目的平均噪聲指數(shù)。
審查前的訪問中,兩家機構(gòu)的高管表示他們預(yù)計專業(yè)員工決策的差異在5%到10%左右——關(guān)乎判斷力,他們認為這個范圍可以接受。但結(jié)果令人震驚。A機構(gòu)6個項目的噪聲指數(shù)從34%到62%不等,平均為48%。機構(gòu)B的4個項目噪聲指數(shù)為46%到70%,平均為60%。可能最令人失望的是,工作經(jīng)驗并沒有降噪的作用。
沒有人想到結(jié)果如此。但因為他們對該審查負責(zé),兩個機構(gòu)的高管都接受了結(jié)論:專業(yè)員工的判斷不可靠,且無法容忍其嚴重程度。所有高管很快同意,必須采取措施控制局面。因為審查結(jié)果與之前對專業(yè)判斷不可靠的研究結(jié)果一致,我們并未感到驚訝。
如今,公眾對“偏差”這個術(shù)語的了解程度,還停留在認為它和“差錯”能夠互換。而“噪聲”比偏差還要難理解得多,但并不鮮見,企業(yè)為之付出的代價也不會更少。
免責(zé)聲明:稿件文字來源于木業(yè)網(wǎng)新聞部原創(chuàng),圖片由相關(guān)企業(yè)提供,如涉及版權(quán)問題,由該企業(yè)負責(zé),并請版權(quán)方聯(lián)系本網(wǎng),本網(wǎng)將及時予以處理。
