java 学习kafka教程(二) Kafka Streams编写关键任务实时应用程序和微服务的最简单方法,是一个用于构建应用程序和微服务的客户端库,其中输入和输出数据存储在Kafka集群中。它结合了在客户端编写和部署标准Java和Scala应用程序的简单性和…
无分类 简单认识KMV Sketch估算算法 KMV Sketch是Theta Sketch算法的一种,简单来说,KMV Sketch是用来估算大数据中不重复元素的个数,例如某个网站的唯一身份访客数。本文简单翻译自datasketches的文档,用以说明该算法是如何进行估算的。
无分类 欧派家居牵手用友云平台 打造标准化数据资产管理平台 前言:大数据是创新驱动发展的重要引擎,无论是对于经济增长还是对于企业发展都具有重要创新引领作用。运用大数据技术能够揭示企业各模块之间的关联性、逻辑性和复杂性,合理的进行数据治理,能够不断推动企业运…
无分类 Spark in action on Kubernetes – Playground搭建与架构浅析 Spark是非常流行的大数据处理引擎,数据科学家们使用Spark以及相关生态的大数据套件完成了大量又丰富场景的数据分析与挖掘。Spark目前已经逐渐成为了业界在数据处理领域的行业标准。但是Spark本身的设计更偏向使…
无分类 批量随机键值查询测试 【摘要】当数据量巨大时,使用大批量随机键值集获取对应记录集合,不仅仅考验数据库软件本身,更在于程序员对数据的理解!如何在硬件资源有限的情况下将性能发挥到极致?点击:批量随机键值查询测试,来乾学院一…
无分类 互联网下半场的角逐,玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场(北京站)干货集锦 2019年1月18日下午,一个晴冷的冬日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的“阿里云栖开发者沙龙大数据技术专场”走近北京联合大学。当日,近200名大数据开发者和爱好者现场参与了本次活动,同…
无分类 【最全资料汇总】如何12个月内成为数据科学家? RoyalMail数据科学家Freddie Odukomaiya曾经用12个月的时间让自己成功的成为数据科学家,以下是他的经验分享和他所使用的学习资源。
无分类 数据科学真的是一份有前途的工作吗? 本篇文章翻译整理自Sethuraman Janardhanan博士的演讲。 Sethuraman Janardhanan博士,Happiest Minds Technologies的大数据分析实践主管和客户负责人,负责管理北美大数据分析领域的战略客户。由于无处不在的计…
无分类 新的一年,来看看大数据与AI的未来展望 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展。本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析当下热门的开源产品和技术,来梳…