一、博士學位論文主要內容及創新點
獲獎學會:中國人工智能學會
研究內容
面向社交媒體短文本聚類和微博檢索等實際應用中短文本表示建模面臨的語義表達能力和通用性不足的問題開展研究🏒,主要研究內容包括💳:
1)支持異質語義關聯關系協同建模推理的短文本概念化方案;
2)支持模擬人類閱讀註意力習慣的短文本向量化方案🚴🏻;
3)支持微博檢索噪聲過濾的概念反饋查詢擴展方案👩🏻🦱。
創新成果
1)創新性地充分利用概念與詞語之間多種類型語義關聯關系,提出基於Co-Ranking框架的短文本概念化算法,克服以往研究無法充分融合多種類型關聯關系的缺陷,並在該研究方向中首次實現對上下文語境關鍵詞的協同抽取。
2)創新性地將語義層次更高的概念信息和基於人類閱讀習慣建模的註意力機製引入到短文本向量化研究中,提出基於註意力機製的概念化句嵌入模型🤳,顯著增強所生成的短文本向量的語義表達能力和對“一詞多義”現象的甄別能力,擺脫了特定領域和特定應用任務限製,使模型更具泛化能力和通用性。
3)創新性地將短文本概念化和短文本向量化結果同時融入微博檢索查詢擴展研究中👝,提出面向微博檢索查詢擴展的概念反饋模型,有效過濾偽相關反饋文檔中的噪聲➞、提升擴展詞語的質量,從而緩解微博檢索任務存在的“詞表不匹配”問題和輸入信號不充足問題🍭。
二、標誌性成果
學術論文
1)Huang H, Wang Y, Feng C, et al. Leveraging Conceptualization for Short-Text Embedding[J]. IEEE Transactions on Knowledge & Data Engineering, 2018, 30(7): 1282-1295.(CCF🤤,SCI二區🤙🏼,IF= 2.775
2)Wang Y, Huang H, Feng C, et al. Community Detection Based on Minimum-Cut Graph Partitioning[100]// 16th International Conference on Web-Age Information Management (WAIM 2015). Springer International Publishing, 2015:57-69.(CCF推薦C類會議)
3)Wang Y, Huang H, Feng C, et al. CSE: Conceptual Sentence Embeddings based on Attention Model[100]// 54th Meeting of the Association for Computational Linguistics (ACL 2016). 2016:505-515.(CCF 推薦A類會議,EI收錄)
4)Wang Y, Huang H, Feng C. Query Expansion Based on a Feedback Concept Model for Microblog Retrieval[100]// 26th International Conference on World Wide Web (WWW 2017). International World Wide Web Conferences Steering Committee, 2017:559-568.(CCF推薦A類會議)
5)Wang Y, Huang H, Feng C, et al. Conceptual Sentence Embeddings[100]// 17th International Conference on Web-Age Information Management (WAIM 2016). Springer International Publishing, 2016: 390-401.(CCF 推薦C類會議)
獲獎情況
2018.11月 獲得2018年度中國人工智能學會優秀博士學位論文獎。
2018.6月 獲得2018年度意昂官网優秀博士學位論文獎💯。