无分类 火眼金睛算法,教你海量短文本场景下去重 在大多数情况下,大量的重复文本一般不会是什么好事情,比如互相抄袭的新闻,群发的垃圾短信,铺天盖地的广告文案等,这些都会造成网络内容的同质化并加重数据库的存储负担,更糟糕的是降低了文本内容的质量。因…
无分类 客户故事:4家银行如何打造新一代移动金融中心 我国”十三五”信息化规划明确提出,全球信息化将进入全面渗透、跨界融合、加速创新、引领发展的新阶段。未来,以云计算、大数据、区块链、人工智能为代表的新兴技术将改变金融行业的形态、支撑设施和运行机制。越…
无分类 比MySQL快6倍 深度解析国内首个云原生数据库POLARDB的“王者荣耀” 随着移动互联网、电子商务的高速发展,被使用最多的企业级开源数据系统MySQL面临着巨大挑战——为迎接“双11″的高并发要提前做好分库分表;用户不断激增要将读写分离才能应对每天上亿次的访问,但读写分离后会导致数…
无分类 毫秒级从百亿大表任意维度筛选数据,是怎么做到的… 随着闲鱼业务的发展,用户规模达到数亿级,用户维度的数据指标,达到上百个之多。如何从亿级别的数据中,快速筛选出符合期望的用户人群,进行精细化人群运营,是技术需要解决的问题。业界的很多方案常常需要分钟…
hadoop Data Lake Analytics + OSS数据文件格式处理大全 Data Lake Analytics是Serverless化的云上交互式查询分析服务。用户可以使用标准的SQL语句,对存储在OSS、TableStore上的数据无需移动,直接进行查询分析。
无分类 这一年多来,阿里Blink测试体系如何从0走向成熟? Apache Flink是面向数据流处理和批处理的分布式开源计算框架,2016年阿里巴巴引入Flink框架,改造为Blink。2017年,阿里整合了所有流计算产品,决定以Blink引擎为基础,打造一款全球领先的实时计算引擎。当年双11…
无分类 重磅邀请函来了!首届“腾讯云+社区开发者大会”免费报名! 2018年12月15日,首届“腾讯云+社区开发者大会”即将在北京隆重举行,腾讯云邀请广大开发者共同探讨云端新技术、新能力。届时,腾讯云将邀请超过40位行业内的技术专家,超过1000名开发者参与本次盛会,分享行业经验…