关于数据科学:ApacheCN-数据科学译文集-20211109-更新

计算与推断思维
- 一、数据迷信
- 二、因果和试验
- 三、Python 编程
- 四、数据类型
- 五、表格
- 六、可视化
- 七、函数和表格
- 八、随机性
- 九、教训散布
- 十、假设检验
- 十一、预计
- 十二、为什么均值重要
- 十三、预测
- 十四、回归的推断
- 十五、分类
- 十六、比拟两个样本
- 十七、更新预测
利用 Python 进行数据分析 · 第 2 版
- 第 1 章筹备工作
- 第 2 章 Python 语法根底，IPython 和 Jupyter 笔记本
- 第 3 章 Python 的数据结构、函数和文件
- 第 4 章 NumPy 根底：数组和向量计算
- 第 5 章 pandas 入门
- 第 6 章数据加载、存储与文件格式
- 第 7 章数据荡涤和筹备
- 第 8 章数据规整：聚合、合并和重塑
- 第 9 章绘图和可视化
- 第 10 章数据聚合与分组运算
- 第 11 章工夫序列
- 第 12 章 pandas 高级利用
- 第 13 章 Python 建模库介绍
- 第 14 章数据分析案例
- 附录 A NumPy 高级利用
- 附录 B 更多对于 IPython 的内容
Python 自然语言解决第二版
- 前言
- 1 语言解决与 Python
- 2 取得文本语料和词汇资源
- 3 解决原始文本
- 4 编写结构化程序
- 5 分类和标注词汇
- 6 学习分类文本
- 7 从文本提取信息
- 8 剖析句子构造
- 9 构建基于特色的语法
- 10 剖析句子的意思
- 11 语言学数据管理
- 后记：语言的挑战
- 索引
复杂性思维中文第二版
- 一、复杂性迷信
- 二、图
- 三、小世界图
- 四、无标度网络
- 五、细胞自动机
- 六、生命游戏
- 七、物理建模
- 八、自组织临界
- 九、基于智能体的模型
- 十、兽群、鸟群和交通堵塞
- 十一、进化
- 十二、单干进化
- 附录 A、算法剖析
- 附录 B、浏览列表
数据可视化的基础知识
- 欢送
- 前言
- 1 简介
- 2 可视化数据：将数据映射到美学上
- 3 坐标系和轴
- 4 色彩刻度
- 5 可视化的目录
- 6 可视化数量
- 7 可视化散布：直方图和密度图
- 8 可视化散布：教训累积散布函数和 q-q 图
- 9 一次可视化多个散布
- 10 可视化比例
- 11 可视化嵌套比例
- 12 可视化两个或多个定量变量之间的关联
- 13 可视化自变量的工夫序列和其余函数
- 14 可视化趋势
- 15 可视化天文空间数据
- 16 可视化不确定性
- 17 比例墨水原理
- 18 解决重叠点
- 19 色彩应用的常见缺点
- 20 冗余编码
- 21 多面板图形
- 22 题目，阐明和表格
- 23 均衡数据和上下文
- 24 应用较大的轴标签
- 25 防止线条图
- 26 不要走向 3D
- 27 理解最罕用的图像文件格式
- 28 抉择适合的可视化软件
- 29 讲述一个故事并提出一个观点
- 30 带注解的参考书目
- 技术注解
- 参考
TutorialsPoint NumPy 教程
NumPy 秘籍中文第二版
- 零、前言
- 一、应用 IPython
- 二、高级索引和数组概念
- 三、把握罕用函数
- 四、将 NumPy 与世界的其余中央连贯
- 五、音频和图像处理
- 六、非凡数组和通用函数
- 七、性能剖析和调试
- 八、质量保证
- 九、应用 Cython 减速代码
- 十、Scikits 的乐趣
- 十一、最新最强的 NumPy
- 十二、应用 NumPy 进行探索性和预测性数据分析
NumPy 初学者指南中文第三版
- 零、前言
- 一、NumPy 疾速入门
- 二、从 NumPy 基本原理开始
- 三、相熟罕用函数
- 四、为您带来便当的便当函数
- 五、应用矩阵和 ufunc
- 六、深刻摸索 NumPy 模块
- 七、理解非凡例程
- 八、通过测试确保品质
- 九、matplotlib 绘图
- 十、当 NumPy 不够用时 – SciPy 及更多
- 十一、玩转 Pygame
- 附录 A：小测验答案
- 附录 B：其余在线资源
- 附录 C：NumPy 函数的参考
NumPy 基础知识
- 零、前言
- 一、NumPy 简介
- 二、NumPy ndarray对象
- 三、应用 NumPy 数组
- 四、NumPy 外围和子模块
- 五、NumPy 中的线性代数
- 六、NumPy 中的傅立叶剖析
- 七、构建和散发 NumPy 代码
- 八、应用 Cython 减速 NumPy
- 九、NumPy C-API 简介
- 十、扩大浏览
精通 NumPy 数值剖析
- 零、前言
- 一、应用 NumPy 数组
- 二、NumPy 线性代数
- 三、应用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
- 四、应用线性回归预测房价
- 五、应用 NumPy 对零售分销商的客户进行聚类
- 六、NumPy，SciPy，Pandas 和 Scikit-Learn
- 七、高级 NumPy
- 八、高性能数值计算库概述
- 九、性能基准
NumPy 数组学习手册
- 零、前言
- 一、NumPy 入门
- 二、NumPy 根底
- 三、应用 NumPy 的根本数据分析
- 四、应用 NumPy 的简略预测性剖析
- 五、信号处理技术
- 六、性能剖析，调试和测试
- 七、Python 迷信生态系统
精通 SciPy
- 零、前言
- 一、数值线性代数
- 二、插值和近似
- 三、微分与积分
- 四、非线性方程式和最优化
- 五、常微分方程的初值问题
- 六、计算几何
- 七、描述性统计
- 八、推断和数据分析
- 九、数字图像处理
Pandas 秘籍
- 零、前言
- 一、Pandas 根底
- 二、数据帧基本操作
- 三、开始数据分析
- 四、抉择数据子集
- 五、布尔索引
- 六、索引对齐
- 七、分组以进行汇总，过滤和转换
- 八、将数据重组为参差的表格
- 九、组合 Pandas 对象
- 十、工夫序列剖析
- 十一、Pandas，Matplotlib 和 Seaborn 的可视化
Pandas 学习手册中文第二版
- 零、前言
- 一、Pandas 与数据分析
- 二、启动和运行 Pandas
- 三、用序列示意单变量数据
- 四、用数据帧示意表格和多元数据
- 五、数据帧的构造操作
- 六、索引数据
- 七、类别数据
- 八、数值统计办法
- 九、存取数据
- 十、整顿数据
- 十一、合并，连贯和重塑数据
- 十二、数据聚合
- 十三、工夫序列建模
- 十四、可视化
- 十五、历史股价剖析
精通 Pandas
- 零、前言
- 一、Pandas 和数据分析简介
- 二、Pandas 装置和支持软件
- 三、Pandas 数据结构
- 四、Pandas 的操作，第一局部 — 索引和抉择
- 五、Pandas 的操作，第二局部 — 数据的分组，合并和重塑
- 六、解决缺失数据，工夫序列和 Matplotlib 绘图
- 七、统计之旅 — 经典办法
- 八、贝叶斯统计简介
- 九、Pandas 库体系结构
- 十、R 与 Pandas 的比拟
- 十一、机器学习简介
NumPy 和 Pandas 数据分析实用指南
- 零、前言
- 一、配置 Python 数据分析环境
- 二、摸索 NumPy
- 三、NumPy 数组上的运算
- 四、Pandas 很乏味！什么是 Pandas？
- 五、Pandas 的算术，函数利用以及映射
- 六、排序，索引和绘图
精通 Pandas 探索性剖析
- 零、前言
- 一、解决不同品种的数据集
- 二、数据抉择
- 三、解决，转换和重塑数据
- 四、像专业人士一样可视化数据
Matplotlib 3.0 秘籍
- 零、前言
- 一、Matplotlib 的分析
- 二、根本绘图入门
- 三、绘制多个图表和子图
- 四、开发可视化来进步公布品质
- 五、应用高级性能的绘图
- 六、嵌入文本和表达式
- 七、以不同格局保留图形
- 八、开发交互式绘图
- 九、在图形用户界面中嵌入绘图
- 十、应用mplot3d工具包绘制 3D 图形
- 十一、应用axisartist工具包
- 十二、应用axes_grid1工具包
- 十三、应用 Cartopy 工具包绘制天文地图
- 十四、应用 Seaborn 工具包的探索性数据分析
Matplotlib 绘图秘籍
- 零、前言
- 一、第一步
- 二、自定义色彩和款式
- 三、解决标注
- 四、解决图形
- 五、文件输入
- 六、解决地图
- 七、解决 3D 图形
- 八、用户界面
UCSD COGS108 数据迷信实战中文笔记
- 零、数据迷信实战
- 一、Jupyter 笔记本
- 二、数据分析
- 三、Python
- 四、Python 中的数据迷信
- 五、数据收集
- 六、数据整顿
- 七、数据清理
- 八、数据隐衷和匿名化
- 九、应用 Python 进行数据可视化
- 十、散布
- 十一、测验散布
- 十三、一般最小二乘
- 十四、线性模型
- 十五、聚类
- 十六、降维
- 十七、分类
- 十八、自然语言解决
- 附录一、有用的 Python 数据迷信包
- 附录二、git/Github 版本控制工具
USF MSDS501 计算数据迷信中文讲义
- 一、起步
  - 1.1 一些动机（音频解决）
  - 1.2 Python 工具的首次尝试
  - 1.3 播放声音
- 二、设计和构建程序
  - 2.1 编程导论
  - 2.2 在内存中示意数据
  - 2.3 计算模型
  - 2.4 Python 中的编程模式
  - 2.5 数据别名
  - 2.6 应用函数组织你的代码
  - 2.7 如何浏览代码
  - 2.8 面向对象编程
- 三、要害编程模式
  - 3.1 加载文件
  - 3.2 数据帧
  - 3.3 操纵和可视化数据
- 四、用于计算和优化的迭代式办法
  - 4.1 生成平均的随机数
  - 4.2 近似平方根
  - 4.3 单变量梯度降落
- 五、常见编程工具
  - 5.1 应用 bash 走向胜利
  - 5.2 应用 git 版本控制工具
  - 5.3 在 Amazon Web Services 上启动虚拟机
- 六、可选
  - 6.1 链表
fast.ai 数值线性代数讲义中文版 v2
- 一、咱们为什么在这里
- 二、SVD 背景打消
- 三、应用 NMF 和 SVD 的主题建模
- 四、随机化 SVD
- 五、LU 合成
- 六、应用鲁棒回归的 CT 扫描的压缩感知
- 七、线性回归和衰弱后果
- 八、如何实现线性回归
- 九、PageRank 和特征值合成
- 十、实现 QR 合成
社交媒体开掘
- 第一局部数据挖掘
  - 1 应理解的编程语言
  - 2 从哪里获取数据
  - 3 用代码获取数据
  - 4 收集本人的 FACEBOOK 数据
  - 5 抓取实时站点
- 第二局部数据分析
  - 6 数据分析导论
  - 7 数据可视化
  - 8 数据分析的高级工具
  - 9 在 REDDIT 数据中寻找趋势
  - 10 测量公众人物的 Twitter 流动
  - 11 何去何从
- 附录
  - 1 编写程序通过 API 获取网站的信息
  - 2 通过解析网页间接获取哔哩某播主的详细信息
  - 3 在离线表格软件中关上和解决 csv 文件
数据迷信和人工智能技术笔记
- 一、向量、矩阵和数组
- 二、数据筹备
- 三、数据预处理
- 四、图像预处理
- 五、文本预处理
- 六、日期工夫预处理
- 七、特色工程
- 八、特征选择
- 九、模型验证
- 十、模型抉择
- 十一、线性回归
- 十二、逻辑回归
- 十三、树和森林
- 十四、K 最近邻
- 十五、反对向量机
- 十六、奢侈贝叶斯
- 十七、聚类
- 十八、Keras
- 十九、数据整顿（上）
- 十九、数据整顿（下）
- 二十、数据可视化
- 二十一、统计学
Python 和 Jupyter 机器学习入门
- 零、前言
- 一、Jupyter 基础知识
- 二、数据清理和高级机器学习
- 三、Web 爬取和交互式可视化
Python 数据迷信和机器学习实际指南
- 零、前言
- 一、入门
- 二、统计和概率回顾和 Python 实际
- 三、Matplotlib 和高级概率概念
- 四、预测模型
- 五、Python 机器学习
- 六、举荐零碎
- 七、更多数据挖掘和机器学习技术
- 八、解决实在数据
- 九、Apache Spark-大数据机器学习
- 十、测试与实验设计
精通 Python 数据迷信
- 零、前言
- 一、原始数据入门
- 二、推断统计
- 三、海底捞针
- 四、通过高级可视化感知数据
- 五、发现机器学习
- 六、应用线性回归执行预测
- 七、预计事件的可能性
- 八、应用协同过滤生成倡议
- 九、应用集成模型扩大边界
- 十、通过 K 均值聚类利用细分
- 十一、通过文本开掘剖析非结构化数据
- 十二、在大数据世界中利用 Python
Python 数据迷信本质论
- 零、前言
- 一、第一步
- 二、数据整顿
- 三、数据管道
- 四、机器学习
- 五、可视化，见解和后果
- 六、社交网络分析
- 七、超过根底的深度学习
- 八、大数据和 Spark
- 九、增强您的 Python 根底
数据迷信思维
- 零、前言
- 一、开发人员对数据迷信的认识
- 二、应用 Jupyter 笔记本和 PixieDust 的大规模数据迷信
- 三、PixieApp 深刻理解
- 四、应用 PixieGateway 服务器将 PixieApp 部署到 Web
- 五、最佳实际和高级 PixieDust 概念
- 六、TensorFlow 图像识别
- 七、大数据和 Twitter 情感剖析
- 八、金融工夫序列剖析和预测
- 九、应用图的美国国内航班数据分析
- 十、最终思维
- 十一、附录 A：PixieApp 疾速参考
Python 仿真建模实用指南
- 序言
- 第一局部：数值仿真入门
  - 一、仿真模型简介
  - 二、了解随机性和随机数
  - 三、概率和数据生成过程
- 第二局部：仿真建模算法与技术
  - 四、摸索蒙特卡罗仿真
  - 五、基于仿真的马尔可夫决策过程
  - 六、重采样办法
  - 七、利用仿真改良和优化零碎
- 第三局部：理论利用
  - 八、将仿真模型用于金融工程
  - 九、应用神经网络仿真物理现象
  - 十、项目管理建模与仿真
  - 十一、下一步是什么？

下载

Docker

docker pull apachecn0/apachecn-ds-zh
docker run -tid -p <port>:80 apachecn0/apachecn-ds-zh
# 拜访 http://localhost:{port}

PYPI

pip install apachecn-ds-zh
apachecn-ds-zh <port>
# 拜访 http://localhost:{port}

NPM

npm install -g apachecn-ds-zh
apachecn-ds-zh <port>
# 拜访 http://localhost:{port}

奉献指南

本我的项目须要校对，欢送大家提交 Pull Request。

请您怯懦地去翻译和改良翻译。尽管咱们谋求卓越，但咱们并不要求您做到美中不足，因而请不要放心因为翻译上犯错——在大部分状况下，咱们的服务器曾经记录所有的翻译，因而您不用放心会因为您的失误受到无法挽回的毁坏。（改编自维基百科）

组织介绍

拜访咱们的主页。

资助咱们

通过平台自带的打赏性能，或点击这里。

关于数据科学:ApacheCN-数据科学译文集-20211109-更新

下载

Docker

PYPI

NPM

奉献指南

组织介绍

资助咱们

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据科学:ApacheCN-数据科学译文集-20211109-更新

下载

Docker

PYPI

NPM

奉献指南

组织介绍

资助咱们

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复