2023大模型前沿技术讲习班·第一期
Hide
大模型正在引发人工智能研究与应用范式产生重大变革,越来越多的顶级团队和杰出人才纷纷加入这一技术浪潮。作为AI大模型科研先锋,智源研究院聚集了来自高校院所和创新企业的一大批大模型领域卓越学者与工程师,共同致力于推动我国大模型的创新发展。
为加速我国大模型领域的人才培养,让更多人能够迅速融入到这一重要的技术变革浪潮,智源研究院联合我国大模型领域的顶尖学者与工程师,为大模型研究与应用开发人员提供系统化的培训课程。
2022年12月,智源研究院面向大模型应用开发人员首次推出“大模型训练营”线上课程。经过两天的培训,600名尚未接受过AI知识系统学习的技术人员成功独立开发出一系列文本和图像生成以及对话机器人应用,超过97%的学员对课程给予了“非常满意”的评价。
在“大模型训练营”结束后,有更多技术人员表达了希望深入了解大模型前沿研究和技术进展的需求。2023年,我们将前期课程进行优化升级,与国内外大模型领域优势机构联手,推出首个系统化、体系化的大模型培训课程——“大模型前沿讲习班”。讲习班主要面向从事大模型科研与应用的学者、工程师,以及相关专业的学生,课程内容涵盖了语言、视觉、多模态等基础模型前沿研究进展,模型训练、优化和应用部署的关键技术,以及大模型应用开发实践等,系统地介绍大模型前沿技术与应用的各个方面。
“
首期讲习班焦点亮相
讲习班第一季第一期(S01E01)将在2023年4月1日至2日线下召开,我们邀请了具有深厚学术背景和丰富实践经验的权威专家联合授课。旷视科技主任研究员张祥雨,微软亚洲研究院高级研究员吴晨飞,南京航空航天大学教授李丕绩,以及哈尔滨工业大学教授张伟男将分别讲授《迈向“大”和“统一”的视觉神经网络架构设计新思路》、《多模态理解、生成和对话》、《大模型技术之朝花夕拾》、《人机对话关键技术研究》四堂前沿课程。授课专家将从多领域交叉视角诠释当前大模型关键技术与前沿进展,旨在帮助学员们开阔科研视野,掌握前沿动向并提高实践能力。
时间 | 课程 大纲 | 授课 专家 |
4月1日 上午 | 1. 视觉模型:迈向“大”和“统一”; 2. ViT是视觉大模型架构的终极方案吗? 3. 如何理解掩码图像建模(Masked Image Modeling)? 4. RevCol:一种新的模型规模化(scaling up)方法; 5. 近期团队其他代表性工作。 | 张祥雨 |
4月1日 下午 | 1. 多模态生成模型NUWA(女娲)系列(NUWA, NUWA-LIP, NUWA-Infinity, NUWA-3D, NUWA-XL)的研究; 2. 多模态理解模型Bridge Tower(桥塔)系列(Bridge-Tower, Manger-Tower)的研究; 3. 多模态对话系统Visual ChatGPT。 | 吴晨飞 |
4月2日 上午 | 1. 基础模型技术脉络; 2. 预训练技术脉络; 3. ChatGPT/GPT4技术猜析; 4. 未来展望。 | 李丕绩 |
4月2日 下午 | 1. 开放域人机对话:角色化对话、多模态对话、对话系统评价; 2. 特定域人机对话:对话式辩论、对话式推荐。 | 张伟男 |
“
授课专家
张祥雨,旷视研究院主任研究员,Foundation Model组负责人,西安交通大学人工智能学院兼职教授。2017年博士毕业于西安交通大学,期间参加微软亚洲研究院联合培养博士生项目,师从孙剑博士和何恺明博士。研究方向包括深度卷积网络设计,深度模型的裁剪与加速等。曾在CVPR/ ICCV/ ECCV/ TPAMI等顶级会议期刊上发表论文60余篇,获CVPR 2016最佳论文奖,并多次获得顶级视觉竞赛如ImageNet/ COCO 冠军。代表作包括业界广泛使用的神经网络架构ResNets/ ShuffleNets/ RepVGG系列,神经网络架构搜索算法SPOS,模型压缩裁剪算法CP/ MetaPruning等。Google Scholar引用数200,000+。入选福布斯中国U30和AI 2000计算机视觉全球最具影响力学者榜单、ELSEVIER中国高被引学者、智源青年科学家。
吴晨飞,微软亚洲研究院高级研究员。于2020年在北京邮电大学取得博士学位。研究方向为大模型预训练、多模态理解和生成。主要研究工作包括多模态生成模型NUWA(女娲)系列(NUWA, NUWA-LIP, NUWA-Infinity, NUWA-3D, NUWA-XL)、多模态理解模型Bridge Tower(桥塔)系列(Bridge-Tower, Manger-Tower)以及多模态对话系统Visual ChatGPT。在CVPR, NeurIPS, ACL, ECCV, AAAI, MM等会发表多篇论文,开源项目GitHub点赞两万余次。
李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师,人工智能与交叉应用系副主任,2021年度南京航空航天大学"长空学者"获得者。香港中文大学博士,曾任腾讯AI Lab自然语言处理中心高级研究员。研究方向主要为自然语言处理,包括预训练模型、文本摘要、文本生成和对话系统。曾经在相关领域顶级会议如ACL、EMNLP、SIGIR等发表学术论文60余篇。多次受邀担任ACL、EMNLP、IJCAI等会议的领域主席。在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布,有丰富的科研落地实践经验。主持或参与多项国家自然科学基金、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金等项目。青源会会员。
张伟男,教授/博士生导师,哈尔滨工业大学计算机学院院长助理,黑龙江省中文信息处理重点实验室副主任,国家重点研发计划项目负责人。研究兴趣包括自然语言处理及人机对话。在ACL、AAAI、WWW、IJCAI、IEEE TKDE、ACM TOIS等CCF A类国际会议及国际顶级期刊发表论文多篇,多次担任ACL、EMNLP领域主席。目前为中国中文信息学会青年工作委员会副主任,中国计算机学会(CCF)术语审定工作委员会执委、CCF哈尔滨分部秘书长,中国人工智能学会教育工作委员会副秘书长,北京智源青源会会员。曾获黑龙江省科技进步一等奖、吴文俊人工智能科技进步二等奖及黑龙江省青年科技奖等。
“
第一季其他精彩课程速览
4月至5月期间,我们还将陆续推出第一季其他三期讲习班,课程内容涵盖语言、视觉、多模态模型,以及模型训练、优化和应用的关键技术与前沿动态,这些课程将由哈尔滨工业大学的车万翔、上海交通大学的陈露、阿里巴巴达摩院的李雅亮、腾讯AI Lab的涂兆鹏、新加坡国立大学的尤洋、Stability AI的郑屹州,以及HuggingFace团队的多位技术专家精心打造。他们将为学员们提供精彩的授课和实践指导,助力学员们在大模型领域成长和发展。敬请关注智源社区公众号,获取详细课程安排及最新资讯。
“
讲习班注册
唯一报名通道
课程形式:所有专家均在现场授课。建议学员亲临现场参与,如外地学员有困难,可申请线上听课。按照报名及付费顺序,优先录取线下学员。名额满额后,仅提供线上通道。
教学地点:北京市海淀区成府路150号智源大厦一层报告厅
授课时间:每日上午09:00-12:00,下午14:00-17:00
系列安排:第一期为4月1-2日,每双周举办一次(如遇节假日,则根据实际情况调整)
课后录播:课程结束后,所有学员将在一定期限内获得在线回放视频
注册费:第一期(S01E01)每人1999元,学生优惠999元;购买第一季(S01E01-04,共四期)套票每人4999元,学生2999元
所有线下学员将获赠一本《自然语言处理 基于预训练模型的方法》图书
成为学员,可获得AI职位服务推荐机会,请在报名时选择
“
申请全额奖学金
如满足以下任一条件,可申请全额奖学金:
开源项目作者:GitHub开源AI项目(50 Star以上)主要贡献者
基于FlagOpen发表论文或创建开源项目(5 Star以上)
成为OpenLabel数据标注共享平台优秀贡献者
加入BAAI实习计划,或成为优秀学员
“
注意事项
报名费用将用于会议费、报名费、学习费、资料费、茶歇费、书籍费、结业证书费等
食宿及交通需自理
报名后,工作人员将邀请加入微信群
讲习班支持开具发票,类型包括:会议费、注册费、会议注册费、培训费等
讲习班提供邀请函,入群后领取
如需开发票,请在报名并加入微信群后填写对应表单
讲习班由“活动行”收取相关费用,由智源研究院开具相关发票
如对课程有任何问题,请联系editor@baai.ac.cn
(1年前)
(1年前)
(1年前)
(1年前)
(1年前)
(1年前)
北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立,依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研究机构。