Apache Doris 与 Apache Pulsar 联合 Meetup 北京站来啦!本次 Meetup 由 StreamNative 联合百度 Doris 团队组织发起,并邀请网易有道等合作伙伴共同为大家呈现,Apache Doris PPMC 成员、Apache Pulsar PMC 成员、贡献者、社区技术专家汇聚一堂,共同探讨 Apache Doris 与 Apache Pulsar 社区发展、行业实践等话题。
备注:疫情防控不放松,仍会控制现场活动规模,名额有限,报名从速
Apache Doris是一款基于MPP技术的分析型数据库系统。Doris 凭借其极简运维和优异的查询性能,已经在众多行业和公司落地,帮助业务快速搭建一套分布式的OLAP系统并展开数据洞察。
分析型数据库作为一个公司重要的数据指标产出来源,不仅要求数据产出的速度、同时也对数据的时效性、系统的成本都有着非常高的要求。
本环节,将从 Doris 的设计理念出发,逐一展现 Doris 的特色功能,并帮助听众理解这些功能背后能够解决的实际问题。同时会介绍 Doris 社区目前最新的开发进展,以及面向云原生时代的一些思考和展望。
当新生事物出现时,总有两种角度去观察它,要么把它看小,要么把它放大。对于 Apache Pulsar,把它看小的角度通常是“Apache Pulsar 只是一个新的消息队列而已“,或者“Apache Pulsar 只是一个新的数据管道而已”,“队列系统早就有了,只是 Apache Pulsar 更具扩展性也能解决某些场景问题而已,基本没啥本质区别”。很明显,上述种种认识都不对。
Apache Pulsar 作为 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体,采用计算与存储分离架构设计,目前项目和社区正在快速发展,已被国内外众多知名互联网企业和行业公司采用。在本环节,翟佳将分享 Apache Pulsar 社区目前应用及最新进展,并探讨云原生时代在消息、流、数据管理和技术基础设施层面的技术演进。
百度企业运营数据仓库是由百度企业智能平台部提供的面向集团财务、预算,战略,人力、以及部分事业部运营分析的内部大数据分析仓库,通过提供数据建模、报表、可视化看板等能力,满足如公司的整体财务分析、集团人力分析和部分事业部的运营数据分析需求,历史上数据存储与分析工作我们是基于商业化的一体机的架构。
在数据规模越来越大,分析场景的日趋复杂的背景下,我们的分析逐渐受困于扩展效率低下、查询不稳定、优化困难等问题,2020 年底我们逐步将一些Olap场景切换到Apache Doris,查询稳定性和性能都获得很大的提升,同时我们也探索出了一条基于Apache Doris替换商业化一体机的Olap应用改造之路。本次将分享企业数仓迁移到 Doris过程中的一些实施路径和思考。
1、本活动具体服务及内容由主办方【StreamNative】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。
2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。
StreamNative 是一家开源基础软件公司,由 Apache 软件基金会顶级项目 Apache Pulsar 创始团队组建而成,围绕 Pulsar 打造下一代云原生批流融合数据平台。StreamNative 作为 Apache Pulsar 商业化公司,专注于开源生态和社区构建,致力于前沿技术领域的创新,创始团队成员曾就职于 Yahoo、Twitter、EMC 等知名大公司。 Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户、持久化存储、多机房跨区域数据复制,具有强一致性、高吞吐、低延时及高可扩展性等流数据存储特性。 GitHub 地址:http://github.com/apache/pulsar/