收起
实时互动作为下一代技术基础能力,正在渗透各行各业。尤其是受疫情的影响,人们越来越习惯在线、远程的工作、学习甚至生活。同时社交直播、游戏电竞、金融、保险、医疗等场景也被搬到了线上,实时互动正在支撑着这些人、物及空间之间创新的沟通和交互方式。
在实时互动场景中,语音处理是非常重要的一个部分,比如实时语音识别和实时语音翻译,可以将连续的音频流实时转换成文本,并进行实时翻译,应用在直播实时字幕、会议实时记录等场景,可以大大提高用户体验和沟通效率。
本次,我们邀请了语音处理方面的技术专家,为大家分享语音处理在实时互动领域的最佳技术实践和业务应用。本次,我们邀请了来自百度、讯飞、依图、微 软、声网、数美等企业的语音处理方面的技术专家,分别在4月28日、5月14日为大家分享语音处理在实时互动领域的最佳技术实践和业务应用,欢迎大家报名参与~~
活动时间:4 月 28 日(星期四) 14:00——16:30
活动地点:线上直播
14:00-14:10 开场
14:10-14:50 《百度文心大模型在语音文本审核中的应用》黄硕,百度自然语言处理部主任研发架构师
14:50-15:30 《语音识别技术研究进展和应用落地分享》马志强,寰语科技语音识别研究主管
15:30-16:10 《实时音视频中语音处理的挑战》周元剑,依图AI SaaS技术负责人
16:10-16:30 抽奖
黄硕 百度自然语言处理部 主任研发架构师
分享主题
百度文心大模型在语音文本审核中的应用
个人简介:
百度自然语言处理部主任架构师。十余年搜索、推荐和人工智能技术研发经验,先后在百度、腾讯、Facebook等多家公司从事搜索、个性化推荐、自然语言处理技术研发工作,在人工智能技术应用方面有丰富的实战经验;曾主导百度搜索个性化技术研发并在十多个产品线应用投产,并深度参与百度深度学习框架在企业中的推广应用。目前在百度自然语言处理部负责NLP基础技术研发、AI技术产业化应用等方向。
内容简介:
深度学习预训练大模型最近几年发展迅速,颠覆了很多以往使用传统机器学习技术解决的领域。得益于大模型技术在百度的发展,语音文本审核这项互联网传统业务在技术上也有了较大的发展。本次分享将在大模型相对传统模型的整体效果、通用性、个性化需求适配以及服务性能上进行介绍和展开,希望让听众了解大模型的优势,以及审核技术最新的一些发展趋势和业务应用效果。
马志强,寰语科技语音识别研究主管
分享主题
语音识别技术研究进展和应用落地分享
个人简介:
马志强,寰语科技语音识别研究主管,主要负责语音识别核心技术研究和相关产品落地工作,具备语音识别、语音转写及语音翻译技术研发经验,熟练掌握ASR技术、NMT技术、深度学习技术等,在多语种、低资源、端到端语音识别方向有着丰富的实践经验,对AI语音识别技术的产业应用有着深入的理解,负责并推动了ASR技术在语音助手、语音交互、AI字幕等场景上线应用。
内容简介:
语音识别技术研究进展和应用落地分享,第一部分简要介绍AI语音识别技术的发展态势和技术研究现状以及面临的挑战问题;第二部分重点介绍语音识别技术的发展历程及其技术原理,重点讲解ASR技术的最新研究进展和技术突破,特别是在语音助手、AI字幕场景的系统性创新工作;第三部分主要介绍ASR技术的应用落地情况,以及AI语音在各个领域场景所取得的应用成果。
周元剑,依图AI SaaS技术负责人
分享主题
实时音视频中语音处理的挑战
个人简介:
从依图公司成立至今,一直在其任职,参与过多款AI产品研发和多个大型智能化项目建设落地。现担任依图AI SaaS技术负责人,目前主要聚焦在语音识别、内容审核方向。
内容简介:
依图ASR和NLP的能力表现;ASR场景有挑战的地方;依图在通用场景如何解决的这些问题;实时音视频领域遇到的典型问题;多语言模型的面临的挑战等。
报名直播参与活动,即有机会领取本次精美声网周边,心动不如行动,扫码报名本次活动吧!
扫码进入👆开发者交流群,会后可以获取PPT等会议资料
提示:直播需要报名后才可以观看
活动主办
1、本活动具体服务及内容由主办方【RTE 开发者社区】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。
2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。