团队力量

副高(副教授等)

当前位置: 首页 -> 团队力量 -> 全体教工 -> 正文

李浩然

发布日期:2026-03-30


 

李浩然 Haoran Li

   

副教授

   

博士研究生

   

15617069632

  

508

   

来利国际旗舰厅

   

 

电子信箱

11889@buaa.edu.cn

   

 

个人主页

 

学习经历

2020年09月 - 2025年01月,香港科技大学,计算机科学及工程学系,博士

2016年09月 - 2020年07月,香港科技大学,计算机科学及工程学系,学士 

工作经历

2026年01月  至今,来利国际旗舰厅, 来利国际旗舰厅, 副教授

2025年10月 - 2026年01月,康奈尔大学,信息科学系,访问学者

2025年01月 - 2025年09月,香港科技大学,计算机科学及工程学系,博士后

研究领域

大模型安全与隐私;大模型安全对齐;智能体安全;智慧司法

荣誉及奖励

国家级青年人才

EMNLP 2024杰出论文奖

2021 - 2024年香港科技大学红鸟博士研究生学术卓越奖(HKUST Redbird Scholarship)

科研成果

李浩然博士的研究方向聚焦于大模型的隐私与安全,紧密结合实际问题与前沿挑战,主要涵盖大模型越狱、提示注入、信息泄露以及后门攻击与防御等领域。他致力于开发基于语境的安全与隐私解决方案,以保障基座大模型及智能体应用的安全可信,同时确保其满足法律法规、平台政策、社会规范和个人偏好的要求,这些研究为提升大模型的安全性和可信性提供了理论基础与技术支持。

 

代表性论文:

[1] Wei Fan, Haoran Li*, Zheye Deng, Weiqi Wang, Yangqiu Song. GoldCoin: Grounding Large Language Models in Privacy Laws via Contextual Integrity Theory. Proceedings of EMNLP 2024.  (Outstanding Paper Award)

[2] Haoran Li, Dadi Guo, Wei Fan, Mingshi Xu, Jie Huang, Fanpu Meng, Yangqiu Song. Multi-step Jailbreaking Privacy Attacks on ChatGPT. Findings of EMNLP 2023.

[3] Haoran Li, Dadi Guo, Donghao Li, Wei Fan, Qi Hu, Xin Liu, Chunkit Chan, Duanyi Yao, Yuan Yao, Yangqiu Song. PrivLM-Bench: A Multi-level Privacy Evaluation Benchmark for Language Models. Proceedings of ACL 2024. (Oral)

[4] Haoran Li, Yulin Chen, Zihao Zheng, Qi Hu, Chunkit Chan, Heshan Liu, Yangqiu Song. Simulate and Eliminate: Revoke Backdoors for Generative Large Language Models. Proceedings of AAAI 2025. (Oral)

[5] Haoran Li, Wenbin Hu, Huihao Jing, Yulin Chen, Qi Hu, Sirui Han, Tianshu Chu, Peizhao Hu, Yangqiu Song. PrivaCI-Bench: Evaluating Privacy with Contextual Integrity and Legal Compliance. Proceedings of ACL 2025.

[6] Haoran Li, Mingshi Xu, Yangqiu Song. Sentence Embedding Leaks More Information than You Expect: Generative Embedding Inversion Attack to Recover the Whole Sentence. Findings of ACL 2023.

[7] Haoran Li, Yangqiu Song, Lixin Fan. You Don't Know My Favorite Color: Preventing Dialogue Representations from Revealing Speakers' Private Personas. Proceedings of NAACL 2022. (Oral Presentation)

[8] Haoran Li, Wei Fan Yulin Chen, Jiayang Cheng, Tianshu Chu, Xuebing Zhou, Peizhao Hu, Yangqiu Song. Privacy Checklist: Privacy Violation Detection Grounding on Contextual Integrity Theory. Proceedings of NAACL 2025. (Oral Presentation)

学术与社会服务

ACL ARRKDDAAAI、ICLR等期刊会议担任审稿人。

科研项目

 

 

下一条:殷荣