收起
AI 的话题伴随着今年夏季的高温持续升温,机器学习是AI的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要通过不同的模型来优化的。
8月30日,本期 Meetup Online 我们有幸邀请到了张校捷、石元坤,分别就“深入了解 GPT-3 模型”和“贝叶斯自动调优”来分享他们自己的经验和看法。
嘉宾介绍
张校捷
Senior Deep Learning Architect @ NVIDIA
演讲主题:深入了解 GPT-3 模型
内容简介:为了无限地提高模型的准确率,OpenAI 开发了一系列的 GPT 模型来进行实验。从最初的 GPT 模型出发,OpenAI 将模型的参数数目由117M(GPT),调到1.5B(GPT-2),最终调到了175B(GPT-3),将语言模型的规模大小设定到当前计算能力所允许的最大范围,同时所消耗的计算机资源也是空前的:28.5万个 CPU 核、1万个 V100 GPU 和 400Gbps 的网络带宽。作为通用的语言模型,GPT-3 模型在文本改错、翻译和阅读理解方面取得了不俗的表现,同时能够通过少量数据的微调来获取用户想要的功能。
石元坤
英特尔 - 软件工程师
演讲主题:贝叶斯自动调优
内容简介:随着机器学习和深度学习模型越来越多,各种可调节的超参数也越来越丰富。对于不同的数据集,有些超参数对性能和精度影响非常大。如何在选择机器学习或深度学习模型后确定这些超参数的具体值成为了一个比较热门的话题。
早期,一般性由精通模型及其背后数理逻辑的经验丰富的工程师通过手工调节来选择一些合适的参数。现在,有了很多基于机器学习的超参数模型调优工具。本期着重介绍基于贝叶斯的优化。
活动日程
活动时间
2020年8月30日 14:00 - 16:30
14:00 - 14:45 | 深入了解 GPT-3 模型 - 张校捷 NVIDIA高级深度学习架构师
14:45 - 15:30 | 贝叶斯自动调优 - 石元坤 英特尔 - 软件工程师
15:30 - 16:15 | 神秘嘉宾
16:15 - 16:30 | 问答 & 抽奖
主办方
「PyChina」是 Python 中国用户组社区,致力于 Python 语言在中国的推广,以及基于 Python 语言的开源项目,技术向世界的展示。
定期主办 PyCon China,PyLadies China, Python Meetup(每月一次)等 Python 相关行业交流活动。
公众微信号:PyChina
合作请联系:Cynthia 185 1609 4658