我校黃建偉教授團(tuán)隊(duì)在A(yíng)CM經(jīng)濟(jì)學(xué)與計(jì)算會(huì)議上發(fā)表文章
近日,理工學(xué)院副院長(zhǎng)、校長(zhǎng)講座教授黃建偉教授團(tuán)隊(duì)在A(yíng)CM經(jīng)濟(jì)學(xué)與計(jì)算會(huì)議上(ACM Conference on Economics and Computation 2021)發(fā)表了一篇題為“The Privacy Paradox and Optimal Bias-Variance Trade-offs in Data Acquisition”的論文。該論文主要探究了在數(shù)據(jù)關(guān)聯(lián)性下的數(shù)據(jù)采集機(jī)制設(shè)計(jì)問(wèn)題,探究信息泄露會(huì)給數(shù)據(jù)交易帶來(lái)什么影響。
ACM經(jīng)濟(jì)學(xué)與計(jì)算會(huì)議上(ACM Conference on Economics and Computation)是計(jì)算經(jīng)濟(jì)學(xué)領(lǐng)域最權(quán)威的學(xué)術(shù)會(huì)議,由 ACM 特殊興趣學(xué)組 SIGecon 于 1999 年主辦,至今已經(jīng)舉辦了 18 年。
點(diǎn)擊圖片,閱讀全文
研究背景
隱私保護(hù)是目前大數(shù)據(jù)時(shí)代每個(gè)個(gè)體的重要需求。然而,在現(xiàn)實(shí)生活中,“隱私悖論”的現(xiàn)象卻時(shí)有發(fā)生:一方面,大多數(shù)都希望自己的隱私得到有效的保護(hù);而另一方面,人們又為了獲取便利而愿意貢獻(xiàn)自己的隱私數(shù)據(jù)。比如說(shuō),許多人為了使用一些app,允許該app采集自己的數(shù)據(jù),這與他們保護(hù)隱私的需求相矛盾。那么問(wèn)題來(lái)了:“隱私悖論”現(xiàn)象背后的原因是什么呢?
許多經(jīng)濟(jì)學(xué)者和計(jì)算機(jī)學(xué)者對(duì)這個(gè)問(wèn)題很有興趣,并給出了許多解釋。其中一個(gè)著名的解釋是數(shù)據(jù)關(guān)聯(lián)性帶來(lái)的信息泄露的存在。具體來(lái)說(shuō),由于數(shù)據(jù)關(guān)聯(lián)性的廣泛存在,人們即使不主動(dòng)分享自己的數(shù)據(jù),第三方能依據(jù)數(shù)據(jù)關(guān)聯(lián)性,從已有的數(shù)據(jù)或多或少推斷該個(gè)體數(shù)據(jù)。以收入數(shù)據(jù)為例,同家公司同級(jí)別的員工往往收入類(lèi)似。就算你從未主動(dòng)透露過(guò)自己的收入,第三方依舊可以依據(jù)已有的你同事的收入推測(cè)你的收入。這樣一來(lái),意識(shí)到自己的信息或許已被泄露,人們便傾向于用數(shù)據(jù)換便利和效率。更一步來(lái)說(shuō),“隱私悖論”現(xiàn)象的存在及其潛在的信息泄露,給人們的隱私保護(hù)和第三方平臺(tái)的數(shù)據(jù)采集和交易帶來(lái)一定的影響。受到現(xiàn)實(shí)中“隱私悖論”現(xiàn)象的啟發(fā),我們希望進(jìn)一步探究在數(shù)據(jù)關(guān)聯(lián)性下的數(shù)據(jù)采集機(jī)制設(shè)計(jì)問(wèn)題,探究信息泄露會(huì)給數(shù)據(jù)交易帶來(lái)什么影響。
?
研究方法
我們考慮一個(gè)數(shù)據(jù)采集者(平臺(tái))和許多個(gè)體。數(shù)據(jù)采集者希望購(gòu)買(mǎi)個(gè)體的數(shù)據(jù),來(lái)進(jìn)行均值估計(jì)。當(dāng)個(gè)體參與數(shù)據(jù)采集并貢獻(xiàn)數(shù)據(jù)時(shí),該個(gè)體會(huì)產(chǎn)生一定的成本。為了有效激勵(lì)個(gè)體參與數(shù)據(jù)采集并高效補(bǔ)償個(gè)體,數(shù)據(jù)采集者設(shè)計(jì)了一個(gè)調(diào)查機(jī)制。該調(diào)查機(jī)制能夠(1)激勵(lì)個(gè)體真實(shí)匯報(bào)成本(激勵(lì)相容性),(2)購(gòu)買(mǎi)數(shù)據(jù)支出不超過(guò)既定的預(yù)算,(3)最優(yōu)化估計(jì)的偏差-方差的權(quán)衡。
在該機(jī)制下,個(gè)體決定是否參與數(shù)據(jù)采集。正如前文所說(shuō),即使不參與數(shù)據(jù)采集,該個(gè)體依舊承受數(shù)據(jù)關(guān)聯(lián)性帶來(lái)的信息泄露。為了刻畫(huà)數(shù)據(jù)關(guān)聯(lián)的異構(gòu)性,我們考慮各個(gè)的群組,即不同群組的個(gè)體的數(shù)據(jù)關(guān)聯(lián)性不同。因此,數(shù)據(jù)采集者會(huì)針對(duì)數(shù)據(jù)關(guān)聯(lián)性(群組)設(shè)計(jì)相應(yīng)的機(jī)制。此外,考慮到并非所有個(gè)體都會(huì)參與數(shù)據(jù)采集,我們引入?yún)⑴c率(即參與個(gè)體數(shù)量除以總個(gè)體數(shù)量),且參與率進(jìn)一步影響估計(jì)的偏差。數(shù)據(jù)采集者通過(guò)機(jī)制設(shè)計(jì)控制總體的參與率,進(jìn)而調(diào)整估計(jì)的偏差水平以最優(yōu)化目標(biāo)函數(shù)。
研究結(jié)論
我們通過(guò)求解優(yōu)化問(wèn)題,得到了該調(diào)查機(jī)制的解析解,并獲得了一些有趣的結(jié)論:受到數(shù)據(jù)關(guān)聯(lián)性帶來(lái)的信息泄露的影響,數(shù)據(jù)采集者可以憑借較低的價(jià)格獲取數(shù)據(jù),數(shù)據(jù)關(guān)聯(lián)性越強(qiáng),價(jià)格越低。數(shù)據(jù)采集者的總購(gòu)買(mǎi)支出并不一定隨著總體參與率的升高而升高。我們的工作進(jìn)一步引出一個(gè)重要的研究:如何設(shè)計(jì)高效的經(jīng)濟(jì)學(xué)機(jī)制來(lái)減少“隱私悖論”的現(xiàn)象和數(shù)據(jù)關(guān)聯(lián)性帶來(lái)的負(fù)面影響。
?
作者簡(jiǎn)介
本文通訊作者為香港中文大學(xué)(深圳)校長(zhǎng)講座教授、理工學(xué)院副院長(zhǎng)黃建偉教授,他同時(shí)也是深圳市人工智能與機(jī)器人研究院(AIRS)的副院長(zhǎng),群體智能研究中心主任。黃教授是深圳市鵬城特聘教授、IEEE Fellow、IEEE通信學(xué)會(huì)杰出講者、湯森路透計(jì)算機(jī)科學(xué)領(lǐng)域全球高被引科學(xué)家。他長(zhǎng)期專(zhuān)注于網(wǎng)絡(luò)通信、網(wǎng)絡(luò)經(jīng)濟(jì)學(xué)和群體智能交叉領(lǐng)域的開(kāi)創(chuàng)性研究。他已發(fā)表 7部學(xué)術(shù)專(zhuān)著、 125 篇 JCR一區(qū)論文和 170 余篇國(guó)際會(huì)議論文,被谷歌學(xué)術(shù)引用超過(guò) 13900 次, H-index為 59(位列全球計(jì)算機(jī)領(lǐng)域?qū)W者中前0.05%)。
黃建偉教授
本文第一作者為廖國(guó)成博士?,F(xiàn)為中山大學(xué)軟件工程學(xué)院助理教授,2021年于香港中文大學(xué)獲得博士學(xué)位。研究方向?yàn)殡[私保護(hù)和博弈論。
廖國(guó)成博士
其他幾位作者分別是:
蘇宇,2021年于加州理工學(xué)院獲得博士學(xué)位,現(xiàn)供職于麥肯錫。研究方向?yàn)樵朴?jì)算,網(wǎng)絡(luò)經(jīng)濟(jì)學(xué)和機(jī)器學(xué)習(xí)。
Juba Ziani, 2019年于加州理工學(xué)院獲得博士學(xué)位,現(xiàn)為賓夕法尼亞大學(xué)博士后。研究方向?yàn)樗惴ú┺恼摵蜋C(jī)制設(shè)計(jì)。
Adam Wierman,2007年于卡耐基梅隆大學(xué)獲得博士學(xué)位,現(xiàn)為加州理工學(xué)院Department of Computing and Mathematical Sciences教授。研究方向?yàn)樵诰€(xiàn)學(xué)習(xí)、在線(xiàn)優(yōu)化和網(wǎng)絡(luò)經(jīng)濟(jì)學(xué)。
?
文章轉(zhuǎn)自香港中文大學(xué)(深圳)理工學(xué)院微信公眾號(hào),鏈接為https://mp.weixin.qq.com/s/iz3Zwjo7SQ3TYCIUTGWiTA
