乐趣区

关于数据科学:ApacheCN-数据科学译文集-20211109-更新

  • 计算与推断思维

    • 一、数据迷信
    • 二、因果和试验
    • 三、Python 编程
    • 四、数据类型
    • 五、表格
    • 六、可视化
    • 七、函数和表格
    • 八、随机性
    • 九、教训散布
    • 十、假设检验
    • 十一、预计
    • 十二、为什么均值重要
    • 十三、预测
    • 十四、回归的推断
    • 十五、分类
    • 十六、比拟两个样本
    • 十七、更新预测
  • 利用 Python 进行数据分析 · 第 2 版

    • 第 1 章 筹备工作
    • 第 2 章 Python 语法根底,IPython 和 Jupyter 笔记本
    • 第 3 章 Python 的数据结构、函数和文件
    • 第 4 章 NumPy 根底:数组和向量计算
    • 第 5 章 pandas 入门
    • 第 6 章 数据加载、存储与文件格式
    • 第 7 章 数据荡涤和筹备
    • 第 8 章 数据规整:聚合、合并和重塑
    • 第 9 章 绘图和可视化
    • 第 10 章 数据聚合与分组运算
    • 第 11 章 工夫序列
    • 第 12 章 pandas 高级利用
    • 第 13 章 Python 建模库介绍
    • 第 14 章 数据分析案例
    • 附录 A NumPy 高级利用
    • 附录 B 更多对于 IPython 的内容
  • Python 自然语言解决 第二版

    • 前言
    • 1 语言解决与 Python
    • 2 取得文本语料和词汇资源
    • 3 解决原始文本
    • 4 编写结构化程序
    • 5 分类和标注词汇
    • 6 学习分类文本
    • 7 从文本提取信息
    • 8 剖析句子构造
    • 9 构建基于特色的语法
    • 10 剖析句子的意思
    • 11 语言学数据管理
    • 后记:语言的挑战
    • 索引
  • 复杂性思维 中文第二版

    • 一、复杂性迷信
    • 二、图
    • 三、小世界图
    • 四、无标度网络
    • 五、细胞自动机
    • 六、生命游戏
    • 七、物理建模
    • 八、自组织临界
    • 九、基于智能体的模型
    • 十、兽群、鸟群和交通堵塞
    • 十一、进化
    • 十二、单干进化
    • 附录 A、算法剖析
    • 附录 B、浏览列表
  • 数据可视化的基础知识

    • 欢送
    • 前言
    • 1 简介
    • 2 可视化数据:将数据映射到美学上
    • 3 坐标系和轴
    • 4 色彩刻度
    • 5 可视化的目录
    • 6 可视化数量
    • 7 可视化散布:直方图和密度图
    • 8 可视化散布:教训累积散布函数和 q-q 图
    • 9 一次可视化多个散布
    • 10 可视化比例
    • 11 可视化嵌套比例
    • 12 可视化两个或多个定量变量之间的关联
    • 13 可视化自变量的工夫序列和其余函数
    • 14 可视化趋势
    • 15 可视化天文空间数据
    • 16 可视化不确定性
    • 17 比例墨水原理
    • 18 解决重叠点
    • 19 色彩应用的常见缺点
    • 20 冗余编码
    • 21 多面板图形
    • 22 题目,阐明和表格
    • 23 均衡数据和上下文
    • 24 应用较大的轴标签
    • 25 防止线条图
    • 26 不要走向 3D
    • 27 理解最罕用的图像文件格式
    • 28 抉择适合的可视化软件
    • 29 讲述一个故事并提出一个观点
    • 30 带注解的参考书目
    • 技术注解
    • 参考
  • TutorialsPoint NumPy 教程
  • NumPy 秘籍中文第二版

    • 零、前言
    • 一、应用 IPython
    • 二、高级索引和数组概念
    • 三、把握罕用函数
    • 四、将 NumPy 与世界的其余中央连贯
    • 五、音频和图像处理
    • 六、非凡数组和通用函数
    • 七、性能剖析和调试
    • 八、质量保证
    • 九、应用 Cython 减速代码
    • 十、Scikits 的乐趣
    • 十一、最新最强的 NumPy
    • 十二、应用 NumPy 进行探索性和预测性数据分析
  • NumPy 初学者指南中文第三版

    • 零、前言
    • 一、NumPy 疾速入门
    • 二、从 NumPy 基本原理开始
    • 三、相熟罕用函数
    • 四、为您带来便当的便当函数
    • 五、应用矩阵和 ufunc
    • 六、深刻摸索 NumPy 模块
    • 七、理解非凡例程
    • 八、通过测试确保品质
    • 九、matplotlib 绘图
    • 十、当 NumPy 不够用时 – SciPy 及更多
    • 十一、玩转 Pygame
    • 附录 A:小测验答案
    • 附录 B:其余在线资源
    • 附录 C:NumPy 函数的参考
  • NumPy 基础知识

    • 零、前言
    • 一、NumPy 简介
    • 二、NumPy ndarray对象
    • 三、应用 NumPy 数组
    • 四、NumPy 外围和子模块
    • 五、NumPy 中的线性代数
    • 六、NumPy 中的傅立叶剖析
    • 七、构建和散发 NumPy 代码
    • 八、应用 Cython 减速 NumPy
    • 九、NumPy C-API 简介
    • 十、扩大浏览
  • 精通 NumPy 数值剖析

    • 零、前言
    • 一、应用 NumPy 数组
    • 二、NumPy 线性代数
    • 三、应用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
    • 四、应用线性回归预测房价
    • 五、应用 NumPy 对零售分销商的客户进行聚类
    • 六、NumPy,SciPy,Pandas 和 Scikit-Learn
    • 七、高级 NumPy
    • 八、高性能数值计算库概述
    • 九、性能基准
  • NumPy 数组学习手册

    • 零、前言
    • 一、NumPy 入门
    • 二、NumPy 根底
    • 三、应用 NumPy 的根本数据分析
    • 四、应用 NumPy 的简略预测性剖析
    • 五、信号处理技术
    • 六、性能剖析,调试和测试
    • 七、Python 迷信生态系统
  • 精通 SciPy

    • 零、前言
    • 一、数值线性代数
    • 二、插值和近似
    • 三、微分与积分
    • 四、非线性方程式和最优化
    • 五、常微分方程的初值问题
    • 六、计算几何
    • 七、描述性统计
    • 八、推断和数据分析
    • 九、数字图像处理
  • Pandas 秘籍

    • 零、前言
    • 一、Pandas 根底
    • 二、数据帧基本操作
    • 三、开始数据分析
    • 四、抉择数据子集
    • 五、布尔索引
    • 六、索引对齐
    • 七、分组以进行汇总,过滤和转换
    • 八、将数据重组为参差的表格
    • 九、组合 Pandas 对象
    • 十、工夫序列剖析
    • 十一、Pandas,Matplotlib 和 Seaborn 的可视化
  • Pandas 学习手册中文第二版

    • 零、前言
    • 一、Pandas 与数据分析
    • 二、启动和运行 Pandas
    • 三、用序列示意单变量数据
    • 四、用数据帧示意表格和多元数据
    • 五、数据帧的构造操作
    • 六、索引数据
    • 七、类别数据
    • 八、数值统计办法
    • 九、存取数据
    • 十、整顿数据
    • 十一、合并,连贯和重塑数据
    • 十二、数据聚合
    • 十三、工夫序列建模
    • 十四、可视化
    • 十五、历史股价剖析
  • 精通 Pandas

    • 零、前言
    • 一、Pandas 和数据分析简介
    • 二、Pandas 装置和支持软件
    • 三、Pandas 数据结构
    • 四、Pandas 的操作,第一局部 — 索引和抉择
    • 五、Pandas 的操作,第二局部 — 数据的分组,合并和重塑
    • 六、解决缺失数据,工夫序列和 Matplotlib 绘图
    • 七、统计之旅 — 经典办法
    • 八、贝叶斯统计简介
    • 九、Pandas 库体系结构
    • 十、R 与 Pandas 的比拟
    • 十一、机器学习简介
  • NumPy 和 Pandas 数据分析实用指南

    • 零、前言
    • 一、配置 Python 数据分析环境
    • 二、摸索 NumPy
    • 三、NumPy 数组上的运算
    • 四、Pandas 很乏味!什么是 Pandas?
    • 五、Pandas 的算术,函数利用以及映射
    • 六、排序,索引和绘图
  • 精通 Pandas 探索性剖析

    • 零、前言
    • 一、解决不同品种的数据集
    • 二、数据抉择
    • 三、解决,转换和重塑数据
    • 四、像专业人士一样可视化数据
  • Matplotlib 3.0 秘籍

    • 零、前言
    • 一、Matplotlib 的分析
    • 二、根本绘图入门
    • 三、绘制多个图表和子图
    • 四、开发可视化来进步公布品质
    • 五、应用高级性能的绘图
    • 六、嵌入文本和表达式
    • 七、以不同格局保留图形
    • 八、开发交互式绘图
    • 九、在图形用户界面中嵌入绘图
    • 十、应用 mplot3d 工具包绘制 3D 图形
    • 十一、应用 axisartist 工具包
    • 十二、应用 axes_grid1 工具包
    • 十三、应用 Cartopy 工具包绘制天文地图
    • 十四、应用 Seaborn 工具包的探索性数据分析
  • Matplotlib 绘图秘籍

    • 零、前言
    • 一、第一步
    • 二、自定义色彩和款式
    • 三、解决标注
    • 四、解决图形
    • 五、文件输入
    • 六、解决地图
    • 七、解决 3D 图形
    • 八、用户界面
  • UCSD COGS108 数据迷信实战中文笔记

    • 零、数据迷信实战
    • 一、Jupyter 笔记本
    • 二、数据分析
    • 三、Python
    • 四、Python 中的数据迷信
    • 五、数据收集
    • 六、数据整顿
    • 七、数据清理
    • 八、数据隐衷和匿名化
    • 九、应用 Python 进行数据可视化
    • 十、散布
    • 十一、测验散布
    • 十三、一般最小二乘
    • 十四、线性模型
    • 十五、聚类
    • 十六、降维
    • 十七、分类
    • 十八、自然语言解决
    • 附录一、有用的 Python 数据迷信包
    • 附录二、git/Github 版本控制工具
  • USF MSDS501 计算数据迷信中文讲义

    • 一、起步

      • 1.1 一些动机(音频解决)
      • 1.2 Python 工具的首次尝试
      • 1.3 播放声音
    • 二、设计和构建程序

      • 2.1 编程导论
      • 2.2 在内存中示意数据
      • 2.3 计算模型
      • 2.4 Python 中的编程模式
      • 2.5 数据别名
      • 2.6 应用函数组织你的代码
      • 2.7 如何浏览代码
      • 2.8 面向对象编程
    • 三、要害编程模式

      • 3.1 加载文件
      • 3.2 数据帧
      • 3.3 操纵和可视化数据
    • 四、用于计算和优化的迭代式办法

      • 4.1 生成平均的随机数
      • 4.2 近似平方根
      • 4.3 单变量梯度降落
    • 五、常见编程工具

      • 5.1 应用 bash 走向胜利
      • 5.2 应用 git 版本控制工具
      • 5.3 在 Amazon Web Services 上启动虚拟机
    • 六、可选

      • 6.1 链表
  • fast.ai 数值线性代数讲义中文版 v2

    • 一、咱们为什么在这里
    • 二、SVD 背景打消
    • 三、应用 NMF 和 SVD 的主题建模
    • 四、随机化 SVD
    • 五、LU 合成
    • 六、应用鲁棒回归的 CT 扫描的压缩感知
    • 七、线性回归和衰弱后果
    • 八、如何实现线性回归
    • 九、PageRank 和特征值合成
    • 十、实现 QR 合成
  • 社交媒体开掘

    • 第一局部 数据挖掘

      • 1 应理解的编程语言
      • 2 从哪里获取数据
      • 3 用代码获取数据
      • 4 收集本人的 FACEBOOK 数据
      • 5 抓取实时站点
    • 第二局部 数据分析

      • 6 数据分析导论
      • 7 数据可视化
      • 8 数据分析的高级工具
      • 9 在 REDDIT 数据中寻找趋势
      • 10 测量公众人物的 Twitter 流动
      • 11 何去何从
    • 附录

      • 1 编写程序通过 API 获取网站的信息
      • 2 通过解析网页间接获取哔哩某播主的详细信息
      • 3 在离线表格软件中关上和解决 csv 文件
  • 数据迷信和人工智能技术笔记

    • 一、向量、矩阵和数组
    • 二、数据筹备
    • 三、数据预处理
    • 四、图像预处理
    • 五、文本预处理
    • 六、日期工夫预处理
    • 七、特色工程
    • 八、特征选择
    • 九、模型验证
    • 十、模型抉择
    • 十一、线性回归
    • 十二、逻辑回归
    • 十三、树和森林
    • 十四、K 最近邻
    • 十五、反对向量机
    • 十六、奢侈贝叶斯
    • 十七、聚类
    • 十八、Keras
    • 十九、数据整顿(上)
    • 十九、数据整顿(下)
    • 二十、数据可视化
    • 二十一、统计学
  • Python 和 Jupyter 机器学习入门

    • 零、前言
    • 一、Jupyter 基础知识
    • 二、数据清理和高级机器学习
    • 三、Web 爬取和交互式可视化
  • Python 数据迷信和机器学习实际指南

    • 零、前言
    • 一、入门
    • 二、统计和概率回顾和 Python 实际
    • 三、Matplotlib 和高级概率概念
    • 四、预测模型
    • 五、Python 机器学习
    • 六、举荐零碎
    • 七、更多数据挖掘和机器学习技术
    • 八、解决实在数据
    • 九、Apache Spark- 大数据机器学习
    • 十、测试与实验设计
  • 精通 Python 数据迷信

    • 零、前言
    • 一、原始数据入门
    • 二、推断统计
    • 三、海底捞针
    • 四、通过高级可视化感知数据
    • 五、发现机器学习
    • 六、应用线性回归执行预测
    • 七、预计事件的可能性
    • 八、应用协同过滤生成倡议
    • 九、应用集成模型扩大边界
    • 十、通过 K 均值聚类利用细分
    • 十一、通过文本开掘剖析非结构化数据
    • 十二、在大数据世界中利用 Python
  • Python 数据迷信本质论

    • 零、前言
    • 一、第一步
    • 二、数据整顿
    • 三、数据管道
    • 四、机器学习
    • 五、可视化,见解和后果
    • 六、社交网络分析
    • 七、超过根底的深度学习
    • 八、大数据和 Spark
    • 九、增强您的 Python 根底
  • 数据迷信思维

    • 零、前言
    • 一、开发人员对数据迷信的认识
    • 二、应用 Jupyter 笔记本和 PixieDust 的大规模数据迷信
    • 三、PixieApp 深刻理解
    • 四、应用 PixieGateway 服务器将 PixieApp 部署到 Web
    • 五、最佳实际和高级 PixieDust 概念
    • 六、TensorFlow 图像识别
    • 七、大数据和 Twitter 情感剖析
    • 八、金融工夫序列剖析和预测
    • 九、应用图的美国国内航班数据分析
    • 十、最终思维
    • 十一、附录 A:PixieApp 疾速参考
  • Python 仿真建模实用指南

    • 序言
    • 第一局部:数值仿真入门

      • 一、仿真模型简介
      • 二、了解随机性和随机数
      • 三、概率和数据生成过程
    • 第二局部:仿真建模算法与技术

      • 四、摸索蒙特卡罗仿真
      • 五、基于仿真的马尔可夫决策过程
      • 六、重采样办法
      • 七、利用仿真改良和优化零碎
    • 第三局部:理论利用

      • 八、将仿真模型用于金融工程
      • 九、应用神经网络仿真物理现象
      • 十、项目管理建模与仿真
      • 十一、下一步是什么?

下载

Docker

docker pull apachecn0/apachecn-ds-zh
docker run -tid -p <port>:80 apachecn0/apachecn-ds-zh
# 拜访 http://localhost:{port} 

PYPI

pip install apachecn-ds-zh
apachecn-ds-zh <port>
# 拜访 http://localhost:{port} 

NPM

npm install -g apachecn-ds-zh
apachecn-ds-zh <port>
# 拜访 http://localhost:{port} 

奉献指南

本我的项目须要校对,欢送大家提交 Pull Request。

请您怯懦地去翻译和改良翻译。尽管咱们谋求卓越,但咱们并不要求您做到美中不足,因而请不要放心因为翻译上犯错——在大部分状况下,咱们的服务器曾经记录所有的翻译,因而您不用放心会因为您的失误受到无法挽回的毁坏。(改编自维基百科)

组织介绍

拜访咱们的主页。

资助咱们

通过平台自带的打赏性能,或点击这里。

退出移动版