文 | 白开水不加糖\
出品 | OSC开源社区(ID:oschina2013)
InfoWorld 颁布了 2021 年最佳开源软件榜单。
InfoWorld 是致力于引领 IT 决策者走在科技前沿的国内科技媒体品牌,每年 InfoWorld 都会依据软件对开源界的奉献,以及在业界的影响力评比出当年的“最佳开源软件” (InfoWorld’s Best of Open Source Software Awards, Bossies),该奖项评比曾经连续了十多年。
InfoWorld 称,此次获奖的 28 个开源我的项目代表了当今开源软件所能提供的最好和最具创新性的软件–软件开发、开发、云原生计算、机器学习等等。
接下来具体看看每一个我的项目(点击每个我的项目名可跳转进入我的项目介绍页面)。
Svelte 和 SvelteKit
InfoWorld 评估道,在泛滥翻新的、开源的、前端的 JavaScript 框架中,Svelte 及其全栈对应的 SvelteKit 可能是最有野心和远见的。Svelte 一开始就通过采纳编译时策略来颠覆现状,并以杰出的性能、继续的倒退和卓越的开发者体验向前迈进。SvelteKit 现已进入公测阶段,它连续了 Svelte 的传统,通过采纳最新的工具,并将部署到无服务器环境作为一项内置性能来实现飞跃。
Minikube
InfoWorld 认为,能够思考将 Minikube 当做 Docker Desktop 的替代品。Minikube 是一个易于在本地运行 Kubernetes 的工具,可在你的笔记本电脑上的虚拟机内轻松创立单机版 Kubernetes 集群。便于尝试 Kubernetes 或应用 Kubernetes 日常开发。
Pixie
Pixie 是 Kubernetes 利用的可察看性工具,它能够查看集群的高级状态,如服务地图、集群资源和利用流量;还能够深刻到更具体的视图,如 pod 状态、火焰图和单个 full-body 利用申请。Pixie 应用 eBPF 主动收集遥测数据,它在集群本地收集、存储和查问所有的遥测数据,应用不到 5% 的集群 CPU。Pixie的用例包含集群内的网络监控、基础设施衰弱、服务性能和数据库查问分析。
FastAPI
FastAPI 是一个高性能 Web 框架,用于构建 API。次要个性:
- 疾速:十分高的性能,与 NodeJS 和 Go 相当
- 疾速编码:将性能开发速度进步约 200% 至 300%
- 更少的谬误:缩小约 40% 的人为谬误
- 直观:弱小的编辑器反对,主动补全无处不在,调试工夫更少
- 繁难:旨在易于应用和学习,缩小浏览文档的工夫。
- 简短:缩小代码反复。
- 持重:获取可用于生产环境的代码,具备主动交互式文档
- 基于规范:基于并齐全兼容 API 的凋谢规范 OpenAPI 和 JSON Schema
Crystal
作为一个提供具备 C 语言的速度和 Ruby 语言的表现力的编程语言的我的项目,Crystal 曾经开发了好几年了。随着今年年初 Crystal 1.0 的公布,该语言当初曾经足够稳固到能够用于个别工作负载。Crystal 应用动态类型和 LLVM 编译器来实现高速度,并防止在运行时呈现空援用等常见问题。Crystal 能够与现有的 C 代码接口,以进一步提高速度和便利性,它还能够应用编译时宏来扩大根底语言的语法。
Windows Terminal
Windows Terminal 是一个全新的、风行的、功能强大的命令行终端工具。蕴含很多来社区呼声很高的个性,例如:多 Tab 反对、富文本、多语言反对、可配置、主题和款式,反对 emoji 和基于 GPU 运算的文本渲染等等。同时该终端仍然合乎咱们的指标和要求,以确保它放弃疾速、高效,并且不会耗费大量内存和电源。
InfoWorld 称,只有给它工夫,Windows Terminal 终有一天会取代 Windows 中的老式控制台主机。
OBS Studio
OBS Studio 是一款用于实时流媒体和屏幕录制的软件,为高效捕捉,合成,编码,记录和流传输视频内容而设计,反对所有流媒体平台。
个性:
- 高性能实时视频/音频捕捉和混合。创立由多种起源组成的场景,包含窗口捕捉、图像、文本、浏览器窗口、网络摄像头、捕捉卡等。
- 设置有限数量的场景,用户能够通过自定义过渡无缝切换。
- 带有每个源滤波器的直观音频混合器,例如噪声门,噪声克制和增益。全面管制VST插件反对。
- 弱小且易于应用的配置选项。增加新源,复制现有源,并轻松调整其属性。
- 精简的设置面板使用户能够拜访各种配置选项,以调整播送或录制的各个方面。
- 模块化的“Dock” UI容许用户齐全依据须要重新排列布局。用户甚至能够将每个独自的 Dock 弹出到本人的窗口中。
Shotcut
Shotcut 是一款跨平台的视频编辑工具,容许人们在利用成果和分层的同时,对音频和视频轨道进行所有的规范修改。Shotcut 有一个十分沉闷的社区,并提供大量的操作视频和领导,以帮忙老手和高级摄像师。它能够在 Mac、Linux、BSD 和 Windows 上运行–只管是跨平台的,但与同类工具相比,它的界面很麻利,应用起来也绝对简略。
Weave GitOps Core
Weave GitOps 反对无效的 GitOps 工作流,以将应用程序继续交付到 Kubernetes 集群中。它基于当先的 GitOps 引擎 CNCF Flux。
Apache Solr
Apache Solr 是基于 Lucene 的全文搜寻服务器,也是最风行的企业级搜索引擎。Apache Lucene 是你所应用的大部分软件的搜寻性能背地的根底搜寻技术–包含其余搜索引擎,如 Elasticsearch。与 Elasticsearch 不同的是,Solr 放弃了它的开源许可,不过它依然是收费的。Solr 是可集群的、可在云端部署的,并且弱小到足以建设云端级的搜寻服务。它甚至包含 LTR 算法,以帮忙主动调整和加权后果。
MLflow
MLflow 由 Databricks 创立,并由 Linux 基金会托管,是一个 MLOps 平台,能够让人跟踪、治理和保护各种机器学习模型、试验及其部署。它为你提供了记录和查问试验(代码、数据、配置、后果)的工具,将数据迷信代码打包成我的项目,并将这些我的项目链入工作流程。
Orange
Orange 旨在使将数据挖掘”富有成效且乏味”。Orange 容许用户创立一个数据分析工作流程,执行各种机器学习和剖析性能以及可视化。与 R Studio 和 Jupyter等程序化或文本工具相比,Orange 是十分直观的。你能够将小部件拖到画布上以加载文件,用模型剖析数据并将后果可视化。
Flutter
Flutter 由 Google 的工程师团队打造,用于创立高性能、跨平台的挪动利用。Flutter 针对当下以及将来的挪动设施进行优化,专一于 Android and iOS 低提早的输出和高帧率。
Flutter 能够给开发者提供简略、高效的形式来构建和部署跨平台、高性能挪动利用;给用户提供丑陋、疾速、jitter-free 的 app 体验。
Apache Superset
Apache Superset 是 Airbnb (出名在线屋宇短租公司)开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),该工具在可视化、易用性和交互性上十分有特色,用户能够轻松对数据进行可视化剖析。Apache Superset 也是一款企业级商业智能 Web 应用程序。
Presto
Presto 是一个开源的分布式 SQL 引擎,用于在线剖析解决,在集群中运行。Presto 能够查问各种各样的数据源,从文件到数据库,并将后果返回到许多商业智能和剖析环境。更重要的是,Presto 容许查问数据所在的中央,包含 Hive、Cassandra、关系型数据库和专有数据存储。一个 Presto 查问能够联合多个起源的数据。Facebook 应用 Presto 对几个外部数据存储进行互动查问,包含他们的 300PB 数据仓库。
Facebook、Uber、Twitter 和阿里巴巴创建了 Presto 基金会。其余成员当初包含 Alluxio、Ahana、Upsolver 和英特尔。
Apache Arrow
Apache Arrow 为立体和分层数据定义了一种独立于语言的柱状内存格局,为古代 CPU 和 GPU 上的高效剖析操作而组织。Arrow 内存格局还反对零拷贝读取,以便在没有序列化开销的状况下进行闪电式的数据拜访。Arrow 库可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。
InterpretML
InterpretML 是一个开源的 Explainable AI(XAI)包,其中蕴含了几个最先进的机器学习可解释性技术。InterpretML 让你训练可解释的 glassbox 模型并解释黑盒零碎。InterpretML 可帮忙你理解模型的全局行为,或理解个别预测背地的起因。在它的许多性能中,InterpretML 有一个来自 Microsoft Research 的”glass box”模型,称为 Explainable Boosting Machine,它反对用黑盒模型的近似值进行 post-hoc 解释的 Lime。
Lime
Lime(local interpretable model-agnostic explanations 的简称)是一种 post-hoc 技术,通过扰动输出的特色并查看预测后果来解释任何机器学习分类器的预测。Lime 可能解释任何具备两个或更多类的黑盒分类器,其同时实用于文本和图像畛域。Lime 也被蕴含在 InterpretML 中。
Dask
Dask 是一个用于并行计算的开源库,能够将 Python 包扩大到多台机器上。Dask 能够将数据和计算散布在多个 GPU 上,无论是在同一个零碎中还是在一个多节点集群中。Dask 与 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 减速的数据分析和机器学习。它还与 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工作流程。
BlazingSQL
BlazingSQL 是一个基于 RAPIDS 生态系统构建的 GPU 减速 SQL 引擎。RAPIDS 基于 Apache Arrow 柱状内存格局,cuDF 是一个 GPU DataFrame 库,用于加载、连贯、聚合、过滤和操作数据。
BlazingSQL 是 cuDF 的 SQL 接口,具备反对大规模数据迷信工作流和企业数据集的各种性能。
Rapids
Nvidia 的 Rapids 开源软件库和 API 套件让你有能力齐全在 GPU 上执行端到端的数据迷信和剖析管道。Rapids 应用 Nvidia CUDA 基元进行底层计算优化,并通过用户敌对的 Python 接口裸露了 GPU 的并行性和高带宽内存速度。Rapids 依赖于 Apache Arrow 柱状内存格局,包含 cuDF,一个相似 Pandas 的 DataFrame 库;cuML,一个机器学习库汇合,提供 Scikit-learn 中大多数算法的 GPU 版本;以及 cuGraph,一个相似 NetworkX 的减速图剖析库。
PostHog
PostHog 是一个为开发人员构建的开源产品剖析平台。主动收集你网站或应用程序上的每个事件,无需向第三方发送数据。它在用户级别提供基于事件的剖析,捕捉你产品的应用数据以查看哪些用户在你的应用程序中执行了哪些操作。它会主动捕捉点击次数和综合浏览量,以剖析你的用户在做什么,而无需手动推送事件。
LakeFS
LakeFS 提供了一种”以治理代码的形式治理你的数据湖”的办法,为对象存储减少了一层相似于 Git 的版本控制。这种对 Git 语义的利用让用户能够创立本人的隔离的、零拷贝的数据分支,在下面工作、试验和建模剖析,而没有毁坏共享对象的危险。LakeFS 为你的数据带来了有用的 commit notes、元数据字段和 rollback 选项,同时也带来了保护数据完整性和品质的验证 hooks–在一个未提交的分支被意外地合并回生产中之前,运行格局和模式查看。通过 LakeFS,治理和爱护代码库的相熟技术能够扩大到古代数据库,如 Amazon S3 和 Azure Blob 存储。
Meltano
Meltano 是往年从 GitLab 中分离出来的,一个收费的开源 DataOps 代替传统 ELT(提取、加载、转换)的工具链。Meltano 的数据仓库框架使得为你的我的项目建模、提取和转换数据变得容易,并通过内置的剖析工具和简化报告的仪表盘来补充集成和转换管道。Meltano提供了一个牢靠的提取器和加载器库,以及对 Singer 规范的 data extracting taps 和 data loading targets 的反对,Meltano 曾经是一个数据编排的动力源。
Trino
Trino(原名 PrestoSQL)是一个分布式 SQL 剖析引擎,可能对大型分布式数据源运行极快的查问。Trino 容许你同时对数据湖、关系型存储或多个不同起源执行查问,而不须要复制或挪动数据进行解决。而且 Trino 与你的数据科学家可能应用的任何商业智能和剖析工具配合得很好,无论是交互式的还是临时性的,最大限度地缩小了学习曲线。随着数据工程师致力反对越来越多的数据源的简单剖析,Trino 提供了一种优化查问执行和减速不同起源的后果的办法。
StreamNative
StreamNative 是一个高度可扩大的音讯和事件流平台,大大简化了实时报告和剖析工具以及企业应用流的数据管道铺设。StreamNative 将 Apache Pulsar 弱小的分布式流解决架构与 Kubernetes 和混合云反对等企业额定性能、大型数据连接器库、繁难认证和受权以及用于衰弱和性能监控的专用工具相结合,既简化了基于 Pulsar 的实时应用程序的开发,又简化了大规模消息传递背板的部署和治理。
Hugging Face
Hugging Face 提供了最重要的开源深度学习资源库,它自身并不是一个深度学习框架。Hugging Face 的指标是扩大到文本之外,反对图像、音频、视频、物体检测等。Infoworld 指出,深度学习从业者应在将来几年内亲密关注这个 repo。
EleutherAI
EleutherAI 是一个由机器学习钻研人员组成的分布式小组,旨在将 GPT-3 带给所有人。2021 年伊始,EleutherAI 公布了 The Pile,是一个 825 GB 的用于训练的多样化文本数据集;并在 6 月颁布了 GPT-J,一个 60 亿参数的模型,大抵相当于 OpenAI 的 GPT-3 的 Curie variant。随着 GPT-NeoX 的呈现,EleutherAI打算将参数始终进步到 1750 亿,以与目前最宽泛的 GPT-3 模型竞争。
对此,Infoworld 评估称,“黑客对阵世界上最大的公司?这就是开源的力量。”
Colab notebooks for generative art
Infoworld 示意,一般来说 Bossies 的赢家都是库、框架、平台和操作系统等开源骨干力量。然而他们往年认为,一些卓越的开源组件也应该失去认可。
首先是 OpenAI 的 CLIP(比照语言-图像预训练)模型,一个用于生成文本和图像矢量嵌入的多模态模型。尽管 CLIP 是齐全开源的,但 OpenAI 的生成性神经网络 DALL-E 却不是。为了填补这一空白,Ryan Murdoch 和 Katherine Crowson 开发了 Colab notebooks,将 CLIP 与其余开源模型(如 BigGAN 和 VQGAN)联合起来,制作 prompt-based 生成性艺术作品。这些 notebooks 基于 MIT 许可,于过来几十年间在互联网上进行了广泛传播,被从新混合、扭转、翻译,并被用来生成了惊人的艺术作品。详情可查看 ai_curio。
以上就是 2021 年度 InfoWorld Bossie Awards 我的项目,对于每个我的项目具体的入选评语等详细信息,可查看网站原文:
https://www.infoworld.com/art…
近期热文举荐:
1.1,000+ 道 Java面试题及答案整顿(2021最新版)
2.别在再满屏的 if/ else 了,试试策略模式,真香!!
3.卧槽!Java 中的 xx ≠ null 是什么新语法?
4.Spring Boot 2.5 重磅公布,光明模式太炸了!
5.《Java开发手册(嵩山版)》最新公布,速速下载!
感觉不错,别忘了顺手点赞+转发哦!
发表回复