乐趣区

在现代商业中利用BI和大数据(ODPi白皮书pdf)

作者:Swapnil Bhartiya

今天的公司正在以前所未有的速度收集数据,但收集的数据中有多少实际上对他们的业务产生了影响?据 ODPi 称,到 2020 年,大数据的累积量将从 4.4 zettabytes 增加到大约 44 zettabytes 或 44 万亿 GB。
对于公司来说,将这些数据转化为投资回报率是一项艰巨的任务,许多企业仍然不知道如何将商业智能(BI)与大数据相结合,以获得富有洞察力的商业价值。
Index Analytics 的首席技术官和 ODPi 的 BI 和 AI 特别兴趣小组(SIG)负责人 Cupid Chan 告诉他的客户,“你有多少数据并不重要;除非你能从中获得洞察力,否则它只占位存储的位和字节。“
为了帮助这些企业深入了解大数据如何通过多结构化数据和高级数据分析解决 BI,ODPi 发布了一份名为“BI”g Data – 商业智能和大数据如何协同工作的白皮书。
这份最新的白皮书分享了 BI 和大数据相结合的最佳实践。它还分享了真实的最终用户对企业如何使用大数据工具的看法,他们面临的挑战以及他们希望如何增强投资。
“BI”g Data 亮点

用于 BI 工具连接到 Hadoop 的首选 BI/SQL 连接器(Hive,Presto,Impala 等)
连接到 Hadoop 和 RDBMS 的最佳实践
推荐的 BI 架构,用于在 Hadoop 中查询数据
BI 如何运行高级分析,包括 Hadoop 上的机器学习算法

Cupid 表示尽管供应商在处理大数据问题方面存在差异,但仍存在一些共同的主题:

在 RDBMS 中存储数据的传统方式正在消退,人们正在利用越来越多的大数据平台。因此,BI 必须适应以满足客户的期望。
用户现在想要结果,而不是在执行查询后几个小时的批处理。因此,BI 供应商需要创造性地做出响应,包括专有连接器、内存和混合方法以满足此要求。
供应商不是创建一个全新的标准,而是整合现有的行业标准,例如 R 和 Python,用于高级分析,以允许用户利用更广泛的社区支持。

这些数据中有多少有价值?
我们注意到的一个趋势是,公司正在收集大量数据,而实际上并不知道该数据的价值以及如何处理这些数据。Cupid 同意这是正确的,特别是那些有预算可以摄取尽可能多的数据的公司。
“尽管这可能不是进行分析的最佳方式,但也没有错。事实上,这种做法的另一个论点是,除非你有这样的数据可供进一步分析,否则没有办法证明这些数据毫无价值。”Cupid 说。
Cupid 提出了“AI + BI = CI”概念,他首先在马里兰大学举办的健康 IT 与分析会议(CHITA)上发表。他认为我们应该追求的真正智慧是认知智能(Cognitive Intelligence,CI)。这可以通过将机器学习速度(由 AI 提供)与人类洞察力所引导的方向(由 BI 提供)相结合来实现。“如果公司可以更多地关注将正确的主题专家纳入需要检查的领域,那么我们可以更有效地为分析提取正确的数据。”他解释说。
当被问及这些公司应该利用哪些大数据 /ML 平台和框架时,Cupid 说,对于数据,最突出的工具是 Apache Hadoop(Cloudera/Hortonworks)、AWS(S3、EBS 等)、Azure 存储(Block Blobs、Azure Data Lake Storage 等)和 Google Cloud(BigTable、云端存储等)。对于 ML,TensorFlow、Keras、Pytorch 和 Apache MXNet 都很受欢迎。
Cupid 表示,刚刚开始这项工作的公司可以选择任何这些框架来开始他们的旅程。他指出,已经启动的公司应首先在内部利用现有资源,然后才决定彻底改革现有资源。
数据是新的土壤
如果想要取得成功,现代公司必须将大数据 /ML 作为其数字化转型战略的一部分。“公司应该像 25 年前建立网站一样关注大数据 /ML。建立一个网站是昂贵的,因为它是“尖端”技术。您是否可以推迟在“数字化转型战略”中建立网站?是的,但结果是你将失去对竞争对手的领先优势。由于技术的快速和激烈特性,在您的数字化转型战略中没有大数据 /ML 将更具影响力。所以最好现在就制定计划,并以敏捷的方式逐步改进。”他说。
您可能听说过“数据是新的石油。”然而,Cupid 更倾向于认为数据是新的土壤。“如果你正确地种植你的商业模式,你可以取得非常丰硕的成果,但不要指望水果会在一夜之间到来。并且,它需要的不仅仅是土壤,而是为了您的企业。您还需要 DevSecOps 阳光来提供光合作用,作为肥料的财政支持,适当的行业趋势温度,以及对水的管理致力,即使结果不能立即看到。所有这些都需要共同努力才能获得新商业模式的成果。”他说。
ODPi 由 Linux 基金会托管,旨在成为简化、共享和开发开放大数据生态系统的标准。通过供应商中立的,全行业的数据治理和数据科学方法,ODPi 成员为开放的生态系统带来了成熟、选择和协作。
点击下载 ODPi 白皮书 pdf。

KubeCon + CloudNativeCon + Open Source Summit 大会日期:

会议日程通告日期:2019 年 4 月 10 日
会议活动举办日期:2019 年 6 月 24 至 26 日

KubeCon + CloudNativeCon + Open Source Summit 赞助方案 KubeCon + CloudNativeCon + Open Source Summit 多元化奖学金现正接受申请 KubeCon + CloudNativeCon 和 Open Source Summit 即将首次合体落地中国 KubeCon + CloudNativeCon + Open Source Summit 购票窗口,立即购票!CNCF 邀请你加入最终用户社区

退出移动版