议题要点及收获:
分享B站大数据离线平台的演进路径、平台建设经验和落地效果;分析并解决离线平台高速增长过程中的痛难点;思考并规划B站未来的大数据发展方向。
嘉宾介绍:B站大数据架构团队负责人,负责计算平台、OLAP平台、存储系统、资源调度、平台工程等系统的建设工作。10年以上大数据架构和平台产品经验,曾在大众点评、阿里云、携程等多家公司负责大数据平台和架构组件的研发工作,对分布式计算、存储、OLAP引擎、大数据平台产品和系统架构等方面有丰富的研发和落地实践经验。
议题要点及收获:
万亿数据量场景下,B站如何基于Flink的流式集成架构解决高实时性、高稳定性的需求挑战?总结B站数据集成架构的演进历程及生产实践中的稳定性建设经验;分享B站流式数据集成服务的建设方式及痛难点解决方案。
嘉宾介绍:大数据集成&存储负责人,支撑公司多部门的数据集成业务及大数据离线存储服务。
议题要点及收获:
分享B站基于Apache Iceberg支持OLAP分析场景的落地实践,并分析基于Iceberg支撑OLAP业务的可行性;如何通过Iceberg索引、预计算等功能进行查询加速?如何对Iceberg表进行自动化调优?如何针对日志场景进行优化?
嘉宾介绍:曾就职于Intel、eBay、阿里巴巴等公司,主要从事大数据领域的工作,是Apache Flink Committer以及Apache Hive PMC成员。目前就职于B站基础架构部大数据架构-OLAP平台,负责湖仓一体方向的研发工作。
议题要点及收获:
介绍并理解DAMA-数据治理运营框架的理论概念;从组件建设、降本治理规划两方面,分享B站基于数据治理运营框架的落地实践;总结数据治理建设的时间契机、思路及路径;阐述元数据的定义及其收集、管理、使用方法。
嘉宾介绍:从事数据一线工作多年,先后在eBay、携程从事数仓、数据分析、数据产品工作,目前在B站实践DAMA数据治理,负责过数据质量、数据成本两大主题 ,参与了B站的数委会、数据治理平台、元数据数仓建设、数据资产归属等一系列数据管理能力提升的项目活动。
报名方式
添加助手dbayuqimg获取PPT、加入直播交流群