RTC Dev Meetup丨语音处理在实时互动领域的技术实践和应用（第一场）预约报名-RTE 开发者社区活动-活动行

活动内容收起 展开

实时互动作为下一代技术基础能力，正在渗透各行各业。尤其是受疫情的影响，人们越来越习惯在线、远程的工作、学习甚至生活。同时社交直播、游戏电竞、金融、保险、医疗等场景也被搬到了线上，实时互动正在支撑着这些人、物及空间之间创新的沟通和交互方式。

在实时互动场景中，语音处理是非常重要的一个部分，比如实时语音识别和实时语音翻译，可以将连续的音频流实时转换成文本，并进行实时翻译，应用在直播实时字幕、会议实时记录等场景，可以大大提高用户体验和沟通效率。

本次，我们邀请了语音处理方面的技术专家，为大家分享语音处理在实时互动领域的最佳技术实践和业务应用。本次，我们邀请了来自百度、讯飞、依图、微软、声网、数美等企业的语音处理方面的技术专家，分别在4月28日、5月14日为大家分享语音处理在实时互动领域的最佳技术实践和业务应用，欢迎大家报名参与～～

时间地点

活动时间：4 月 28 日（星期四） 14:00——16:30

活动地点：线上直播

活动流程

14:00-14:10 开场

14:10-14:50 《百度文心大模型在语音文本审核中的应用》黄硕，百度自然语言处理部主任研发架构师

14:50-15:30 《语音识别技术研究进展和应用落地分享》马志强，寰语科技语音识别研究主管

15:30-16:10 《实时音视频中语音处理的挑战》周元剑，依图AI SaaS技术负责人

16:10-16:30 抽奖

嘉宾一

黄硕百度自然语言处理部主任研发架构师

分享主题

百度文心大模型在语音文本审核中的应用

个人简介：

百度自然语言处理部主任架构师。十余年搜索、推荐和人工智能技术研发经验，先后在百度、腾讯、Facebook等多家公司从事搜索、个性化推荐、自然语言处理技术研发工作，在人工智能技术应用方面有丰富的实战经验；曾主导百度搜索个性化技术研发并在十多个产品线应用投产，并深度参与百度深度学习框架在企业中的推广应用。目前在百度自然语言处理部负责NLP基础技术研发、AI技术产业化应用等方向。

内容简介：

深度学习预训练大模型最近几年发展迅速，颠覆了很多以往使用传统机器学习技术解决的领域。得益于大模型技术在百度的发展，语音文本审核这项互联网传统业务在技术上也有了较大的发展。本次分享将在大模型相对传统模型的整体效果、通用性、个性化需求适配以及服务性能上进行介绍和展开，希望让听众了解大模型的优势，以及审核技术最新的一些发展趋势和业务应用效果。

嘉宾二

马志强，寰语科技语音识别研究主管

分享主题

语音识别技术研究进展和应用落地分享

个人简介：

马志强，寰语科技语音识别研究主管，主要负责语音识别核心技术研究和相关产品落地工作，具备语音识别、语音转写及语音翻译技术研发经验，熟练掌握ASR技术、NMT技术、深度学习技术等，在多语种、低资源、端到端语音识别方向有着丰富的实践经验，对AI语音识别技术的产业应用有着深入的理解，负责并推动了ASR技术在语音助手、语音交互、AI字幕等场景上线应用。

内容简介：

语音识别技术研究进展和应用落地分享，第一部分简要介绍AI语音识别技术的发展态势和技术研究现状以及面临的挑战问题；第二部分重点介绍语音识别技术的发展历程及其技术原理，重点讲解ASR技术的最新研究进展和技术突破，特别是在语音助手、AI字幕场景的系统性创新工作；第三部分主要介绍ASR技术的应用落地情况，以及AI语音在各个领域场景所取得的应用成果。