无分类 知识图谱在大数据中的应用 随着移动互联网的发展,万物互联成为了可能,这种互联所产生的数据也在爆发式地增长,而这些数据恰好可以作为分析关系的有效原料。如果说以往的智能分析专注在每一个个体上,在移动互联网时代则除了个体,这种个体之间的关系也必然成为我们需要深入分析的很重要一部分。在一项任务中,只要有关系分析的需求,知识图谱就“…
无分类 时序数据流经过Kafka队列时可能产生的乱序原因和解决方法 Kafka 作为一个流行的消息队列,以分布式高性能,高可靠性等特点已经在多种场景下广泛使用。在工业互联网、物联网时序数据存储的解决方案中也有大量用到。
无分类 微信国庆数据3480-万人国庆假期行不足百步 假期过得太快就像龙卷风。风停了,国庆微信数据报告上线了。国庆长假,3480 万人微信运动步数不足百步,浙江省成为新一届“慵懒”省份,“国庆读国史”成为阅读新潮流,小游戏也有了“南北之争”,广西青秀山成黑马跻身热门景区前五,佛山市出境游人数仅次北上广深,最远的朋友圈签到在智利小镇伦卡,中国的智慧生活与科技力量…
无分类 个推CTO谈数据智能之本质及技术体系要求 安森,个推CTO毕业于浙江大学,现全面负责个推技术选型、研发创新、运维管理等工作,已带领团队开发出针对移动互联网、金融风控等行业的多项前沿数据智能解决方案。
无分类 结构化大数据分析平台设计 任何线上系统都离不开数据,有些数据是业务系统自身需要的,例如系统的账号,密码,页面展示的内容等。有些数据是业务系统或者用户实时产生的,例如业务系统的日志,用户浏览访问的记录,系统的购买订单,支付信…
无分类 linux-磁盘挂载 1、磁盘的格式化 1.1、查看当前文件目录 使用 df -h 命令来查看当前已经挂载的磁盘以及磁盘的信息: {代码…} 1.2、磁盘分区 查找已经安装并且未格式化的磁盘 使用命令 fdisk -l 列出所有的磁盘,使用命令的例子…
无分类 流式计算的三种框架StormSpark和Flink 我们知道,大数据的计算模式主要分为批量计算(batch computing)、流式计算(stream computing)、交互计算(interactive computing)、图计算(graph computing)等。其中,流式计算和批量计算是两种主要的大数据计算模…
无分类 干货分享-大数据处理的五大关键技术及其应用 数据处理是对纷繁复杂的海量数据价值的提炼,而其中最有价值的地方在于预测性分析,即可以通过数据可视化、统计模式识别、数据描述等数据挖掘形式帮助数据科学家更好的理解数据,根据数据挖掘的结果得出预测性决…