? ? ? ?近日,香港中文大學(xué)(深圳)理工學(xué)院2018級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)博士生馬暢翼為第一作者的論文被2020 ACM SIGIR信息檢索頂級(jí)國(guó)際會(huì)議收錄。論文由顧崇林博后、李文燁教授、崔曙光教授等老師指導(dǎo)完成。

?

會(huì)議簡(jiǎn)介

? ? ? ?SIGIR (ACM International Conference on Research and Development in Information Retrieval)國(guó)際計(jì)算機(jī)協(xié)會(huì)信息檢索大會(huì)是一個(gè)展示信息檢索領(lǐng)域中各種新技術(shù)和新成果的重要國(guó)際論壇,專(zhuān)注于信息存儲(chǔ)、檢索和傳播的各個(gè)方面,同時(shí)也是中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的A類(lèi)學(xué)術(shù)會(huì)議,享有很高的國(guó)際學(xué)術(shù)聲譽(yù)。

?

論文介紹

? ? ? ?論文題目:Large-scale Image Retrieval with Sparse Binary Projections

? ? ? ?論文摘要:受神經(jīng)科學(xué)前沿技術(shù)啟發(fā),李文燁博士及其團(tuán)隊(duì)于2018年和2019年分別發(fā)表NeurIPS文章和技術(shù)報(bào)告,揭示了稀疏二值投影和競(jìng)爭(zhēng)模型的諸多優(yōu)良特性,為信息檢索等經(jīng)典問(wèn)題提供了新的研究思路。不同于傳統(tǒng)方法通過(guò)減少數(shù)據(jù)維度加快檢索速度,我們的模型首先將樣本投影到高維空間,然后利用WTA競(jìng)爭(zhēng)對(duì)數(shù)據(jù)向量進(jìn)行稀疏化和二值化重新表達(dá)。沿著該思路,本文借助一種新的算法,通過(guò)無(wú)監(jiān)督訓(xùn)練來(lái)獲得高質(zhì)量的稀疏二值投影矩陣,并成功地應(yīng)用于圖像檢索領(lǐng)域。實(shí)驗(yàn)結(jié)果表明,該方法針對(duì)大規(guī)模圖像檢索任務(wù)除了具有良好的穩(wěn)定性之外,更能夠有效提高檢索精度和速度,并有效降低數(shù)據(jù)的存儲(chǔ)需求,適合實(shí)際工業(yè)應(yīng)用。

?

學(xué)生簡(jiǎn)介

馬暢翼

理工學(xué)院,思廷書(shū)院

計(jì)算機(jī)與信息工程專(zhuān)業(yè)博士二年級(jí)

她的研究興趣主要在于機(jī)器學(xué)習(xí)基礎(chǔ)理論,包括圖像檢索等。

學(xué)生感言:該工作對(duì)我自己來(lái)說(shuō)是一個(gè)很好的鍛煉,讓我對(duì)機(jī)器學(xué)習(xí)和圖像檢索有了更加深刻的了解。同時(shí),很感謝各位老師的支持,他們的指導(dǎo)對(duì)該工作起到了很重要的作用。

?

指導(dǎo)老師簡(jiǎn)介

顧崇林博士

理工學(xué)院博士后研究員

? ? ? ?他在2018年獲得哈爾濱工業(yè)大學(xué)(深圳)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)博士學(xué)位。在此之前,他于2008年獲得哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)士學(xué)位,于2011年獲得哈爾濱工業(yè)大學(xué)(深圳)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)碩士學(xué)位。2018年5月到2018年8月,他在深圳市大數(shù)據(jù)研究院做訪(fǎng)問(wèn)學(xué)生,并于9月加入香港中文大學(xué)(深圳)崔曙光教授團(tuán)隊(duì)開(kāi)始博士后研究工作,研究方向?yàn)樵朴?jì)算、綠色數(shù)據(jù)中心調(diào)度。他將于2020年8月博士后出站,作為助理教授加盟哈爾濱工業(yè)大學(xué)(深圳)。

?

李文燁博士

理工學(xué)院研究助理教授

? ? ? ?李文燁博士于2016年8月加入香港中文大學(xué)(深圳)和深圳市大數(shù)據(jù)研究院,從事計(jì)算機(jī)和信息科學(xué)領(lǐng)域的教學(xué)科研工作。他的主要研究方向?yàn)闄C(jī)器學(xué)習(xí)和人工智能。李博士在NIPS/ICML等主要學(xué)術(shù)會(huì)議發(fā)表第一作者論文多篇,常年來(lái)?yè)?dān)任多個(gè)A類(lèi)學(xué)術(shù)會(huì)議的程序委員會(huì)委員和高級(jí)委員。除理論研究外,李博士也是計(jì)算機(jī)系統(tǒng)和Java/數(shù)據(jù)庫(kù)技術(shù)專(zhuān)家,擔(dān)任國(guó)家E級(jí)超級(jí)計(jì)算機(jī)項(xiàng)目需求委員會(huì)評(píng)審委員。李博士早年負(fù)責(zé)設(shè)計(jì)開(kāi)發(fā)的國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享系統(tǒng),入選首批國(guó)家科技基礎(chǔ)條件平臺(tái)。

?

崔曙光教授

理工學(xué)院代理院長(zhǎng)

? ? ? ?崔曙光教授現(xiàn)任理工學(xué)院代理院長(zhǎng)。他于2005年在美國(guó)斯坦福大學(xué)獲得博士學(xué)位,先后在美國(guó)德州農(nóng)機(jī)大學(xué)和加州大學(xué)戴維斯分校任助理、副、正、和Child Family講席教授 ?,F(xiàn)任深圳市大數(shù)據(jù)研究院副院長(zhǎng)和香港中文大學(xué)(深圳)校長(zhǎng)講座教授。崔教授的當(dāng)前科研方向主要集中在數(shù)據(jù)驅(qū)動(dòng)的大規(guī)模系統(tǒng)控制和資源管理。已在國(guó)際一流期刊和會(huì)議上發(fā)表了兩百五十余篇論文。崔教授是IEEE信號(hào)處理協(xié)會(huì)2012年最佳論文獎(jiǎng)獲得者, 并曾擔(dān)任多個(gè)IEEE國(guó)際會(huì)議的主席和程序委員會(huì)主席,多個(gè)國(guó)際期刊的編委(IEEE TBD, TSP, TWC, TVT, CL)和IEEE SPM的領(lǐng)域主編,是IEEE通信協(xié)會(huì)無(wú)線(xiàn)技術(shù)委員會(huì)(WTC)的主席 。崔教授在2013年當(dāng)選IEEE Fellow(博士畢業(yè)后8年內(nèi)當(dāng)選,為IEEE歷史上最快之一),并在2014年和2016年被分別任命為IEEE Transactions on Big Data和IEEE Transactions on Cognitive Communications and Networking 的Steering Committee委員。崔教授在2014年入選IEEE ComSoc Distinguished Lecturer, Thomson Reuters全球高被引科學(xué)家名單, 和ScienceWatch的全球最具影響力科學(xué)家名單。在2017年10月,基于其在物聯(lián)網(wǎng)和數(shù)據(jù)分析領(lǐng)域的學(xué)術(shù)聲譽(yù),崔教授應(yīng)阿里巴巴集團(tuán)的邀請(qǐng)到杭州,作為13名科學(xué)家之一為阿里巴巴達(dá)摩院的成立提供了戰(zhàn)略性意見(jiàn)。

?

導(dǎo)師點(diǎn)評(píng)

? ? ? ?利用稀疏二值矩陣來(lái)加速圖像檢索速度和精度具有新穎性和突破性。該方法的難點(diǎn)是如何設(shè)計(jì)這樣一個(gè)投影矩陣,在重新表達(dá)的同時(shí)保證檢索精度和速度。我們提出了一種利用WTA自身特點(diǎn)的迭代優(yōu)化方法,并在A(yíng)NN和IR的準(zhǔn)確度上超過(guò)了現(xiàn)有的經(jīng)典方法。該方法也獲得了評(píng)審者的一致好評(píng),他們認(rèn)為我們的SBP方法在檢索速度、準(zhǔn)確度及通用性上具有一定的優(yōu)越性。

? ? ? ?馬暢翼同學(xué)具有很好的編程能力,并且對(duì)機(jī)器學(xué)習(xí)有著不錯(cuò)的理解。她在接近三個(gè)月的時(shí)間里嘗試了各種想法并最終形成了有效的方法,獲得了令人滿(mǎn)意的結(jié)果。希望她在未來(lái)的科研生涯中再接再厲,做出更好的工作!也歡迎對(duì)人工智能基礎(chǔ)理論感興趣的同學(xué)加入我們的團(tuán)隊(duì),共同探索人工智能時(shí)代下的前沿思想方法和應(yīng)用。