题 目:模拟学习方法论:理论,算法和应用
主讲人:束 俊
单 位:西安交通大学
时 间:2024年8月19日 9:00
腾讯ID:598 617 222
摘 要:近几年,人工智能研究的突破之一是以ChatGPT为代表的大模型的显著发展。相比于以解决特定任务为特征的传统深度学习模型,大模型在解决跨任务泛化等复杂任务中展示出惊人的能力(称为涌现能力)。但大模型 “大力出奇迹”的实现模式与“资源稀疏型”的学术研究模式存在鸿沟。 本报告将从大模型的约化这一问题展开讨论,介绍基于“模型学习方法论”(SLeM)的元学习框架,阐述背后关于任务迁移泛化的统计学习理论,并以机器学习自动化作为典型应用场景展示,研发了系列机器学习自动化基础算法簇,揭示SLeM学习框架对现实场景中的潜在适用性。
简 介:束俊,西安交通大学副教授,博导,主要从事机器学习的基础理论与算法研究。已在IEEE TPAMI、JMLR、NeurIPS等国际顶级期刊和会议发表学术论文20余篇,谷歌学术引用1300余次。目前担任IEEE TPAMI等多个国际和国内顶级期刊审稿人,并受邀担任二十余次CCF A类会议的程序委员会委员。曾获 “NeurIPS2022杰出审稿人奖”,首届粤港澳大湾区(黄埔) 国际算法算例大赛“数据选择与标记校正算法设计”擂台赛冠军(队长),第三届基础学科拔尖学生培养计划2.0“提问与猜想”活动特等奖(优秀指导教师)等奖项。