回到顶部

LiveVideoStack Meet深圳:元宇宙与音视频

2022年4月23日 14:00 ~ 2022年4月23日 17:00

收起

活动票种
    付费活动,请选择票种
    展开活动详情

    活动内容收起

    去年底,元宇宙一词入选了《柯林斯词典》2021年度热词,虽然外界对于元宇宙概念和属性的看法仍在变化,但对其未来的良好前景已基本达成共识。元宇宙又会给音视频互动带来哪些新玩法与新场景?4月23日LiveVideoStack Meet将在深圳与大家见面,共聊元宇宙与音视频发展!

    *防疫要求:参会入园需持24小时内核酸证明及健康码&行程码绿码


    活动时间

    ​2022年4月23日  14:00-17:00


    活动地址

    深圳市南山区卓越前海壹号T3写字楼38层培训室



    讲师与议题


    591648806580_.pic_hd.jpg

    Yango,ZEGO 即构科技AI图像视频处理专家。主要负责泛娱乐场景下的互动智能AI算法开发落地。在包括人脸和手势检测、Avatar面部表情随动、语音驱动Avatar等项目中担任算法架构设计和主要算法研发。从0-1完成ZegoAvatar面部表情随动模型的落地以及ZegoAvatar语音驱动表情的算法开发,在泛娱乐互动智能场景的AI算法研发和落地方面积累了丰富的经验。


    Topic 1:ZegoAvatar移动端⾯部表情随动方案技术解析

    AI视觉中心基于互动智能的业务逻辑,提出并落地了 ZegoAvatar 解决方案。我们将 AI 音视频技术与元宇宙虚拟形象相结合,通过极低延迟的移动端推理速度,精确而又自然的表情驱动效果,能够随时随地让用户感受沉浸式的虚实交互。本演讲重点针对 ZegoAvatar中移动端面部表情随动这一技术点进行剖析。




    沈俊聪.jpg

    沈俊聪,荔枝音频技术负责人。2010年7月到2013年3月,在华为担任音频算法工程师,负责华为手机的语音增强等模块。2013年4月到现在,在荔枝担任音频技术负责人,先后带领团队完成了几个重要项目:手机端音频节目录制工具,让用户低门槛录制高音质音频节目;高音质音频直播引擎,让用户很容易就能在手机上进行高清语音直播;AI声音理解后台,能对不同声音事件进行快速分类


    Topic 2:元宇宙中的音频技术探讨

    敬请期待!



    王文强.jpg

    王文强,阿里云资深技术专家,2008年毕业于中科院研究生院,从事多年图像处理的FPGA硬件方案设计。先后参与了QQ相册、微信朋友圈、淘宝、支付宝等知名产品的图像处理后台硬件加速方案设计。


    Topic 3:大规模高性能图像处理架构演进及软硬件一体化的性能优化实践

    本主题主要围绕作者多年来的实际工作经验,介绍如何让超大规模的异构图像处理解决方案更“低碳”。内容涵盖以下几个方面:图像处理系统架构设计、图像处理吞吐优化、图像压缩率优化、图像处理硬件低延时设计、阿里巴巴图像质量评价方案设计。




    曹木勇.jpg

    曹木勇,GVoice(腾讯游戏语音)负责人。2011年加盟腾讯,一直从事游戏音视频相关工作。目前在腾讯负责GVoice(腾讯游戏语音)相关工作,我们支持了王者荣耀,和平精英,英雄联盟,腾讯视频,QQ等产品。2020年主导推进CCSA游戏语音模式标准的立项与审议,2021年,推动IEEE P2861.4游戏语音工作组的成立,并协调行业生态建设相关标准。


    ​Topic 4:语音标准建设的那些事

    在游戏场景中,语音的环境更为复杂,需要同时兼顾语音通话质量和媒体播放音质,而现有智能终端仅提供了适用于通话场景的语音通话模式和适用于音乐播放场景的媒体模式,未考虑两者融合兼顾的场景,行业内需要统一的、标准化的解决方案,来提升游戏场景下的语音应用音质与性能。IEEE P2861.4为游戏语音技术的发展起到关键的引领和推动作用,统一的标准加速高品质游戏语音技术的普及,为优化游戏场景下语音服务,打造极致的游戏体验提供坚实基础。




    WechatIMG183.png

    陈相屹,思谋科技数智创新业务高级总监。10年以上计算机视觉与图形软件产品研发经验,涉及空间信息、三维重建、数字孪生等方向。2020年加入思谋,先后负责了多个数智创新产品的规划和研发工作,目前主要聚焦于数字孪生在工业场景下应用的探索与落地。


    ​Topic 5:工业场景下数字孪生应用的探索与实践

    元宇宙逐步被市场关注,作为元宇宙技术基础之一的数字孪生在社交系统、生产系统和经济系统中的应用也在加速。在互联网和消费者市场领域外,企业用户也积极探索并加大投入,寻找企业增长的新动能。

    本次分享主要为大家介绍三部分的内容,第一,工业场景下数字孪生应用的自身特点和常见需求;第二,围绕工业数字孪生应用,思谋对定制化项目交付与产品设计的思考探索;最后,为大家分享思谋结合数字孪生技术,在工业场景下多个细分行业中的应用案例。



    圆桌:多媒体与元宇宙


    WechatIMG906.jpeg

    段争志, shopee codec专家工程师。2014年毕业于华南理工大学多媒体与声学专业,深耕视频编解码行近10年,曾参与国家安防监控视频编码标准(SVAC2.0)建设,主持H.264硬件编码器IP架构/算法设计、后服务于腾讯视频云团队,负责视频质量优化,作为V265 PMC成员深度参与了O264/V265等软编码器内核算法开发与优化,发表多项编解码提案&多项专利。目前服务于shopee多媒体团队,主导视频质量&&编解码内核开发与优化。



    WechatIMG183.png

    陈相屹,思谋科技数智创新业务高级总监。10年以上计算机视觉与图形软件产品研发经验,涉及空间信息、三维重建、数字孪生等方向。2020年加入思谋,先后负责了多个数智创新产品的规划和研发工作,目前主要聚焦于数字孪生在工业场景下应用的探索与落地。




    WechatIMG218.jpeg

    武磊,网心科技研发副总裁,2015年加入网心科技,负责PaaS产品线;曾任职腾讯,作为创始团队参与腾讯云创建和运营;毕业于华中科技大学计算机学院并获得硕士学位,研究对等计算方向,在边缘计算和分布式领域有丰富经验。



    微信图片_20220413085638.jpg

    唐芳鑫,万兴科技集团股份有限公司战略发展部副总经理,负责战投部。主导投了北京美摄、上海阅流等视频相关的企业,目前也在关注元宇宙领域工具软件的投资机会。



    WechatIMG212.png

    谢昕虬,即构科技AI视频处理技术负责人,负责移动端虚拟人渲染AI技术。过往成功负责创新产品研发、手q群、日迹、兴趣部落、QQHummer项目界面引擎等。


















    关于我们


    LiveVideoStack是专注在音视频领域的技术社区,聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、旅游、电商、社交、智能设备等行业领域,旨在推动相关开源项目与最佳实践普及和传播,让技术改变我们的交流、学习、娱乐和工作。


    关于LiveVideoStack Meet你可以查看此文档(https://shimo.im/docs/gVygrWtq9K9CPg9P),我们会在此更新各个城市的活动信息、报名入口以及城市特使名单等。

    如果你想在LiveVideoStack Meet上输出talk、参与讨论,请联系 editors@livevideostack.com 。

    咨询电话(同微信):13691133797

    市场合作:media@livevideostack.com


    112c78d381c6a20b1e109860695f866.png





    举报活动

    活动标签

    最近参与

    • 海上的云
      收藏

      (2年前)

    • A小波
      报名

      (2年前)

    • Yan
      报名

      (2年前)

    • tony
      报名

      (2年前)

    • whale
      报名

      (2年前)

    • 吴成凯
      报名

      (2年前)

    您还可能感兴趣

    您有任何问题,在这里提问!

    为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

    全部讨论

    还木有人评论,赶快抢个沙发!

    活动主办方更多

    LiveVideoStack直播技术社区

    LiveVideoStack直播技术社区

    LiveVideoStask是专注在音视频领域的技术社区,旨在推动相关开源项目与最佳实践普及和传播,相信技术能让交流、学习和工作更简单。

    微信扫一扫

    分享此活动到朋友圈

    免费发布