无分类 蔡徐坤千万级顶流的背后到底有多少真实成绩 8月2日,蔡徐坤迎来了他的21岁生日。这个二十出头的年轻人,被称作是中国的“超级流量明星”,也经受过千万舆论的质疑和洗礼,如今一年过去,他依然是众人眼中的话题焦点。7月26日,蔡徐坤的新歌《YOUNG》发售,用…
hadoop Giraph源码分析六Edge-分析 1.在Vertex类中,顶点的存储方式采用邻接表形式。每个顶点有 VertexId、VertexValue、OutgoingEdges和Halt,boolean型的halt变量用于记录顶点的状态,false时表示active,true表示inactive状态。 片段代码如下。
无分类 数据治理那点事系列之三不忘初心方得始终数据质量管理要稳住 我将从数据质量管理的目标,质量问题产生的根源,讲到如何评估数据质量,如何贯彻数据质量管理流程,最后从取与舍两个角度谈谈我对质量问题的一些个人观点。
storm 58-集团大规模-Storm-任务平滑迁移至-Flink-的秘密 Flink-Storm 是 Flink 官方提供的用于 Flink 兼容 Storm 程序 beta 工具,并且在 Release 1.8 之后去掉相关代码。本文主要讲述 58 实时计算平台如何优化 Flink-Storm 以及基于 Flink-Storm 实现真实场景下大规模 …
无分类 FM算法介绍 FM (Factorization Machine) 算法可进行回归和二分类预测,它的特点是考虑了特征之间的相互作用,是一种非线性模型,目前FM算法是推荐领域被验证的效果较好的推荐方案之一,在诸多电商、广告、直播厂商的推荐领域…
无分类 地产业-X-数据中台 从 IT 时代到 DT 时代,每个企业无一不被「大数据」、「数字化转型」这样陌生又熟悉的词汇环绕着。似乎一夜之间,这条通往未来的数据之路旁早已挤满了拿着车票却不知该如何上车的企业主们,特别是一些传统行业的…
无分类 即将发版Apache-Flink-19-版本有哪些新特性 2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货,共同探讨前沿科技趋势。本文整理自开源大数据专场中…
java 在MaxCompute中利用bitmap进行数据处理 很多数据开发者使用bitmap技术对用户数据进行编码和压缩,然后利用bitmap的与/或/非的极速处理速度,实现类似用户画像标签的人群筛选、运营分析的7日活跃等分析。本文给出了一个使用MaxCompute MapReduce开发一个…