外流行的前沿开源技术领域过去的发展和未来的趋势进行了深入的洞察,覆盖开源云原生、开源 AI、开源大前端、开源
2023-02-21 15:19
大数据技术领域正被越来越多的公司关注,而开源一直是大数据技术的灵魂。随着一些细分领域对大数据工具提出更高的期望和要求,一批更高效更有针对性的
2018-01-29 08:46
11月5日,在云栖大会一体化大数据智能峰会上,由 开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品的《2022开源
2022-11-06 22:15
景,并提供更好的易用性。本次演讲将介绍 Flink-Hive 集成的设计架构、项目进展以及后续版本中的新功能。最后,我们还将演示如何使用 Flink 与 Hive 进行交互。开源大数据生态专场完整议程除上述
2019-11-23 00:03
首先是对 SQL 的支持,比如是否支持 IC SQL,还是会违背 IC SQL 的语法,有很多自己的 SQL 语法。引申就是有没有一些 MySQL 协议或者是 PG 协议,直接可以去对接更好的 BI 工具,能够较少地去改动。
2023-08-02 11:38
11月5日,在2022云栖大会一体化大数据智能峰会上,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品的《2022年开源
2022-11-09 15:07
存储引擎的选型要考虑一些关键因子,比如数据源类型(结构化/非结构化)、数据规模(GB/TB/PB)、数据增长系数、数据加工分析的方式,这些因子必将决定存储引擎的选型方法
2019-08-02 11:01
本文对当前最前沿的开源大数据基准测试集进行全面总结,阐述其历史、现状并展望下一步研究方向。
2018-12-21 15:57
近日,在由上海市经济和信息化委员会、上海市科学技术委员会指导,上海德衡数据科技有限公司、上海开源大数据研究院、上海大数据联盟和上海超算中心联合主办的"魔方
2019-01-22 09:42
首先,用户(通常是数据科学家)需要整理和准备数据集,这个阶段称为提取/转换/加载(ETL)。这项工作现在可以通过 Apache Spark 3.0 在 NVIDIA GPU 上加速进行。Apache Spark 是目前最流行的
2023-04-12 09:46