java java转大数据的学习路线 大数据本质也是数据,但是又有了新的特征,包括数据来源广、数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等。在这里还…
java 浅谈-Spark-的多语言支持 作者:郑锴,花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC,Apache Kerby 创立者。深耕分布式系统开发和开源大数据多年,先后专注在安全,存储和计算领域。之前在 Intel,目前转战阿里云上,致力于提供更…
无分类 数据挖掘复习笔记01概述 为什么需要 Data Mining信息技术的发展,计算机—存储和处理信息,网络—传播信息,物联网—收集信息,移动互联网—更加便捷地收集和传播信息 问题:数据总量爆炸式增加,如何从中提取真正有价值的信息 产生…
无分类 宜信开源Moonboxv03beta重大发布-Grid全新重构更快更解耦 导读:数据虚拟化思想一直以来都是敏捷大数据团队十分关注的一个点,Moonbox则以此为基础而设计,致力于提供批量计算服务解决方案。今天,Moonbox惊喜发布0.3beta版(回顾v0.2请戳这里:#Moonbox# 计算服务平台简…
无分类 使用DataWorks来调度AnalyticDB任务 DataWorks作为阿里云上广受欢迎的大数据开发调度服务,最近加入了对于AnalyticDB的支持,意味着所有的AnalyticDB客户可以获得任务开发、任务依赖关系管理、任务调度、任务运维等等全方位强大的能力,现在就给大家…
无分类 邀您参加 | BigData & Alluxio 交流会-成都站 本期技术沙龙将会聚焦在大数据、存储、数据库以及Alluxio应用实践等领域,邀请腾讯技术专家和业界技术专家现场分享关于Alluxio系统的基本原理、大数据系统架构、数据库应用运维、AI计算机视觉技术及落地实践等主…
无分类 为什么说流处理即未来? 作者|Stephan Ewen整理|秦江杰本文整理自 Flink 创始公司 Ververica 联合创始人兼 CTO – Stephan Ewen 在 Flink Forward China 2018 上的演讲《Stream Processing takes on Everything》。这个演讲主题看似比…