2019年5月14日,北京大學(xué)張航課題組與李健課題組合作的研究工作“Human representation of multimodal distributions as clusters of samples”在《PLOS Computational Biology》期刊發(fā)表。該研究發(fā)現(xiàn)人們對(duì)于在視覺空間呈現(xiàn)的概率分布會(huì)采用樣本聚類的方式來(lái)進(jìn)行表征。
在生活中,我們每時(shí)每刻都需要處理、加工來(lái)自自身和外部環(huán)境的不確定性。要加工生活中的不確定性并作出相應(yīng)的反應(yīng),我們需要對(duì)概率分布進(jìn)行表征并進(jìn)行相關(guān)計(jì)算。來(lái)自前人的行為和神經(jīng)成像證據(jù)均表明,人們的決策行為對(duì)分布的特征(如均值、方差、偏度等)是敏感的。但是我們并不清楚,人們具體是如何對(duì)分布進(jìn)行表征的。概率分布中可能發(fā)生的事件數(shù)量經(jīng)常是巨大的,且隨著分布維度的增加呈指數(shù)性增長(zhǎng)。因此,人們不可能對(duì)于分布中每一個(gè)可能發(fā)生的事件及其可能性都進(jìn)行表征,更可能采取了某種近似的策略。
該研究提出,人們可能是采用樣本聚類的策略來(lái)表征概率分布的。樣本聚類的方式具體如下圖所示。當(dāng)人們面對(duì)大量來(lái)自一個(gè)分布的樣本時(shí)(Samples),會(huì)對(duì)這些樣本進(jìn)行聚類(Clustering),并只記住聚類后每個(gè)類別的中心和相對(duì)權(quán)重(Representation),以完成對(duì)分布信息的簡(jiǎn)化表征。當(dāng)需要對(duì)分布的特征作出估計(jì)時(shí),人們會(huì)根據(jù)每個(gè)類別的中心和相對(duì)權(quán)重信息來(lái)作出相應(yīng)估計(jì)(Estimation)。比如,人們會(huì)報(bào)告權(quán)重最大的類別其中心所在的位置作為對(duì)該分布眾數(shù)的估計(jì),對(duì)各類別的中心進(jìn)行加權(quán)平均作為對(duì)該分布均值的估計(jì)。
在實(shí)驗(yàn)中,研究者在屏幕上一根白色橫軸上給被試快速、序列地呈現(xiàn)70根紅色的豎線,被試的任務(wù)為,在所有豎線呈現(xiàn)完畢后,指出剛才呈現(xiàn)的70根豎線出現(xiàn)最密集的位置(眾數(shù))和平均位置(均值)所在。結(jié)果發(fā)現(xiàn),被試對(duì)于眾數(shù)和均值的報(bào)告均存在系統(tǒng)性偏差(下圖左上、左下),表明被試確實(shí)可能采取了某種近似策略來(lái)表征概率分布。進(jìn)一步地,作者提出的樣本聚類模型(CoS)可以很好地預(yù)測(cè)出被試估計(jì)值的偏差模式(下圖右上、右下)。同時(shí),作者總結(jié)了前人關(guān)于概率分布的多種表征模型,并將這些模型對(duì)數(shù)據(jù)的擬合與該研究中提出的樣本聚類模型進(jìn)行比較,發(fā)現(xiàn)樣本聚類模型可以比其它模型更好地?cái)M合數(shù)據(jù)。該研究為樣本聚類模型提供強(qiáng)有力的證據(jù)支持,對(duì)于我們理解人們是如何加工生活中復(fù)雜的信息并作出響應(yīng)有著重要的意義。
北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院博士研究生孫經(jīng)緯為該文的第一作者,北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院、麥戈文腦科學(xué)研究所、北大-清華生命科學(xué)聯(lián)合中心張航研究員和北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院李健研究員為該文的共同通訊作者。該工作由國(guó)家自然科學(xué)基金、北大-清華生命科學(xué)聯(lián)合中心、中華人民共和國(guó)科學(xué)技術(shù)部資助完成。
2019-05-21