Darawhale-暑期组队学习计划

45次阅读

共计 5037 个字符,预计需要花费 13 分钟才能阅读完成。

Datawhale 暑期组队学习计划

马上就要开始啦

这次共组织 15 个组队学习

涵盖了 AI 领域从理论知识到动手实践的内容

按照下面给出的最完备学习路线分类

难度系数分为 三档

可以按照需要参加

学习路线

基础知识

1 Python 基础

课程简介

课程设计:马晶敏,叶梁

组队学习说明:学习 python 基础知识,针对 python 小白的学习之路

任务路线:基础知识 → 函数 → 第三方模块 → 类和对象 → 基础爬虫

组队学习周期:10 天

定位人群:python 小白

难度系数低

每个任务完成大概所需时间:2~4h/ 天,根据个人学习接受能力强弱有所浮动

任务安排:

Task1:环境搭建 + python 初体验 + python 基础讲解 + python 数值基本知识 (2 天)

Task2:列表 + 元组 + string 字符串 + 字符串格式化问题 (2 天)

Task3:数组 + 集合 + 判断语句 + 三目表达式 + 循环语句 (2 天)

Task4:数组 + 集合 + 判断语句 + 三目表达式 + 循环语句 (2 天)

Task5:函数 + file + os 模块 + datetime 模块 (2 天)

2 LeetCode

课程简介

课程设计:老表、于鸿飞、杨皓博

组队学习说明:Leetcode 刷题组队学习,从零开始每天一道算法题,在良好的学习氛围下,培养刷题习惯,学习算法思想。(不限制编程语言)

任务路线:腾讯精选练习(50 题)顺序每天一道题。

地址链接:

https://leetcode-cn.com/probl…

组队学习周期:50 天(50 题全部完成即结束)

定位人群:适合有一门语言基础的同学

难度系数中

每个任务完成大概所需时间:2~3h/ 天

任务安排:

选取腾讯精选练习(50 题)解答

3 统计学

课程简介

课程设计:王佳鑫、许辉

组队学习说明:学习内容涵盖统计学中所有的主要知识,并对其分部分进行梳理总结。

任务路线:根据所学习内容进行

(1)统计学基本知识、二项及泊松分布、大数定律、正态分布等内容的总结进行整体的回顾、梳理与完善;

(2)中心极限定理、置信区间、假设检验等内容的总结进行整体的回顾、梳理与完善。

组队学习周期: 7 天

定位人群:微积分、基本概率知识储备

难度系数中

每个任务完成大概所需时间:2-3h/ 天

学习内容:

(1)本次统计学学习以网易云可汗学院公开课为主:

视频链接:

http://open.163.com/special/K…

(2)并以《深入浅出统计学》为辅:

书籍链接:

https://pan.baidu.com/s/1dCV6…

任务安排:

Task1:统计学基本知识 + 二项及泊松分布 + 大数定律 + 正态分布 (2 天)

Task2:中心极限定理 + 置信区间 (1 天)

Task3:假设检验 (2 天)

Task4:线性回归 + 卡方分布 + 方差分析 (2 天)

4 编程

课程简介

课程设计:光城、LeoLRH

组队学习说明:利用自己所熟知的编程语言,具有一定基础,讨论在面试中可能出现的数据结构问题,一起学习重温经典数据结构

任务路线:数组 → 链表 → 栈 → 队列 → 递归 → 排序 → 二分查找 → 哈希表 → 字符串 → 二叉树 → 堆 → 图 → 回溯 → 分治 → 动态规划

组队学习周期:15 天甚至往上大概 16 天左右(周末进行整体整理讨论)(每天任务时间具体看任务情况)

定位人群:有一门语言基础和算法基础的同学

难度系数高,小白慎入!!!

每个任务完成大概所需时间:平均每天学习时间在 1 个小时左右,晚上统一,半个小时进行集体讨论总结打卡。

任务安排:

Task1:数组 + 链表 (2 天)

Task2:栈 + 队列 + 递归 (3 天)

Task3:排序 + 二分查找 (2 天)

Task4:散列表(哈希表) + 字符串 (2 天)

Task5:二叉树 + 堆 (2 天)

Task6:图 (2 天)

Task7:递归 + 回溯 + 分治 + 动态规划 (2 天)

数据分析 / 挖掘

1 Excel 入门

课程简介

课程设计:杨煜,李严

组队学习说明:职场人士必备学习内容。通过集中式学习和大量实战练习,快速了解并掌握 Excel 核心功能,保证今后工作中用得到。

任务路线:基础界面 → 基础文件操作 & 单元格操作 → 基础函数 → 查找函数 vlookup 和 match/index → 基础图表 → 数据透视表

组队学习周期:12 天

定位人群:小白,或有一点基础但不熟练的人群;初入职场人群必学;

难度系数低

每个任务完成大概所需时间: 2-3h/ 每天

任务安排:

Task1:基础界面 + 文件操作 + 基础单元格操作 (3 天)

Task2:单元格引用 + 运算符 + 文本函数 + 逻辑函数 + 计算函数 (2 天)

Task3:vlookup 函数用法 + match&index + 双条件查找 (2 天)

Task4:图表类型 + 图表类型选择指南 + 图表的构成要素 (3 天)

Task5:数据透视表 + 实现数据分段统计 + 变更值汇总依据 + 设置三种值百分比 + 计算字段 & 计算项 (2 天)

2 MySQL

课程简介

课程设计:杨皓博 孙涛 杨煜

组队学习说明:一周内快速了解并掌握 MySQL 的主要内容。通过大量 SQL 语句的实战练习,可以在简历上写熟练掌握 MySQL。(注意:本课程只关注 SQL 查询语句本身,对数据库的涉及较少。)

任务路线:MySQL 软件安装及数据库基础 → 查询语句 → 表操作 → 表联结 → MySQL 实战 → MySQL 实战 – 复杂项目

组队学习周期: 8 天

定位人群:小白

难度系数低

每个任务完成大概所需时间:2-3h

任务安排:

Task1:软件安装及数据库基础 + 查询语句 (3 天)

Task2:表操作 (3 天)

Task3:MySQL 实战 (1 天)

Task4:MySQL 实战 – 复杂项目 (1 天)

3 数据分析

课程简介

课程设计:金娟娟

组队学习说明:以《python for data analysis》为辅,学习重要的 python 库

任务路线:重要的 python 库

(numpy/pandas/matplotlib/seaborn 等) → 数据清洗和分析

组队学习周期:22 天

定位人群:有一点 python 基础,但不太会 python 库的数据分析小白;

难度系数低

每个任务完成大概所需时间:2~4h/ 天,根据个人学习接受能力强弱有所浮动

任务安排:

预备任务:github + jupyter (1 天)

Task1:第 4 章 numpy + 作业 1 (2 天)

Task2:第 5 章 pandas (2 天)

Task3:第 6 章数据载入 (2 天)

Task4:第 7 章数据清洗 (2 天)

Task5:第 8 章数据联合 (2 天)

Task6:第 10 章数据聚合 (2 天)

Task7:第 12 章高阶 pandas + 作业 2 (2 天)

Task8:第 9 章 matplotlib + 作业 3 (2 天)

Task9:第 11 章时间序列 (2 天)

Task10:大作业 + 总结 (3 天)

4 爬虫

课程简介

课程设计:光城、李方

组队学习说明:

从零基础到能独立完成一个简易的爬虫项目

任务路线:请求 → re → beautifulsoup → lxml → selenium → IP 问题 → 实战小项目

组队学习周期: 8 天

定位人群:有 Python 基础。

难度系数中

每个任务完成大概所需时间:2-3h/ 天

任务安排:

Task1:get 与 post 请求 + 正则表达式 (2 天)

Task2:beautifulsoup + xpath (2 天)

Task3:selenium + IP (2 天)

Task4:实战大项目 (2 天)

机器学习

1 初级算法梳理

课程简介

课程设计:苏静、康兵兵

组队学习说明:通过查阅书籍或参考文献、学习视频等,对传统机器学习算法进行梳理

任务路线:线性回归 → 逻辑回归 → 决策树

组队学习周期: 6 天

定位人群:有概率论、矩阵运算、求导、泰勒展开等基础数学知识;

难度系数低

每个任务完成大概所需时间:2~3h/ 天

任务安排:

Task1:线性回归算法梳理 (2 天)

Task2:逻辑回归算法梳理 (2 天)

Task3:决策树算法梳理 (2 天)

2 高级算法梳理

课程简介

课程设计:黑桃,刘广月,于鸿飞

组队学习说明:通过查阅相关文献,对机器学习算法进行梳理

任务路线:RF → GBDT → XGB

组队学习周期: 7 天

定位人群:有概率论、矩阵运算、求导、泰勒展开等基础数学知识;

难度系数中

每个任务完成大概所需时间:2~3h/ 天

任务安排:

Task1:随机森林算法梳理 (2 天)

Task2:GBDT 算法梳理 (2 天)

Task3:XGB 算法梳理 (3 天)

Task4:LightGBM 算法梳理 (3 天)

深度学习

1 PyTorch

课程简介

课程设计:许辉 李奇锋

组队学习说明:通过学习 pytorch 的基本操作,最终完成手写数字的识别

任务路线:安装 pytorch → 设立图并计算 → 实现逻辑回归 → 构建多层神经网络 → PyTorch 实现 L1,L2 正则化以及 Dropout → 书写优化器代码 → 用 PyTorch 完成手写数字识别

组队学习周期:7 天

定位人群:熟悉 python 的基础用法

难度系数中

任务完成所需时间:2-3h/ 天

任务安排:

Task1:PyTorch 的基本概念 (2 天)

Task2:设立计算图并自动计算 (2 天)

Task3:PyTorch 实现 Logistic regression (2 天)

Task4:PyTorch 实现多层网络 (2 天)

Task5:PyTorch 实现 L1,L2 正则化以及 Dropout (2 天)

Task6:PyTorch 理解更多神经网络优化方法 (2 天)

Task7:手写数字识别 (2 天)

理论应用

1 spark 入门

课程简介

课程设计:Summer

组队学习说明:学习 spark 基础知识,针对 spark 小白的学习之路

任务路线:运行原理 → 环境搭建 → RDD 编程 → SparkSQL → MLlib → 常用算法

组队学习周期:12 天

定位人群:spark 小白

难度系数中

每个任务完成大概所需时间:2~4h/ 天,根据个人学习接受能力强弱有所浮动

任务安排:

Task1:运行原理,RDD 设计,DAG,安装与使用 (3 天)

Task2:RDD 编程,熟悉算子,读写文件 (3 天)

Task3:DataFrame,SparkSQL (2 天)

Task4:MLlib 流设计,特征工程 (2 天)

Task5:逻辑回归,决策树 (2 天)

2 数据挖掘实战

课程简介

课程设计:范晶晶、李碧涵、

组队学习说明:应用机器学习算法,完整地走完一个数据挖掘项目流程

任务路线:数据分析 → 特征工程 → 模型构建 → 模型评估 → 模型调优 → 模型融合

组队学习周期:12 天

定位人群:有 Python 基础,sklearn 基础。

难度系数中

每个任务完成大概所需时间:2-3h/ 天

任务安排:

Task1:数据分析 (2 天)

Task2:特征工程 (2 天)

Task3:模型构建 (2 天)

Task4:模型评估 (2 天)

Task5:模型调优 (2 天)

Task6:模型融合 (2 天)

3 自然语言处理基础(理论 + 实践)

课程简介

课程设计:jepson

组队学习说明:学习自然语言处理理论,并且通过对某些数据集的文本分类任务不断优化来进行实践。

任务路线:特征提取 → 特征选择 → 文本表示 → 传统机器学习算法跑模型 → LDA 生成新特征

定位人群:有 Python 基础,基本框架的基础(例如 TensorFlow、Keras 和 pyTorch 等)!

难度系数高

组队学习周期: 8 天

每个任务完成大概所需时间:3~4h/ 天

任务安排:

预备任务:tensorflow 安装 +tensrflow 基础 +NLP

Task1:数据集探索 (2 天)

Task2:特征提取 (2 天)

Task3:特征选择 (2 天)

Task4:传统机器学习 + 讨论(2 天)

4 自然语言处理进阶(理论 + 实践)

课程简介

课程设计jepson

组队学习说明 学习自然语言处理理论,并且通过对某些数据集的文本分类任务不断优化来进行实践。

任务路线word2vec 算法跑模型 → 卷积神经网络算法跑模型 → 循环神经网络算法跑模型 → 注意力机制算法跑模型→ Bert

定位人群:学完自然语言处理入门组队学习的同学或有自然语言处理基础的巨佬!

难度系数高

组队学习周期:14 天

每个任务完成大概所需时间:3~4h/ 天

任务安排

Task1:数据集探索 (2 天)

Task2:神经网络基础 (2 天)

Task3:简单神经网络 + 讨论 (2 天)

Task4:卷积神经网络 (2 天)

Task5:循环神经网络 (2 天)

Task6:Attention 原理 + 讨论 (2 天)

Task7:Bert+ 讨论 (2 天)

5 NLP 论文复现

课程简介

课程设计:杨开漠,王翔

任务路线:论文学习 → 研读模型 → 跑模型 → 针对学习中存在的问题进行后期讨论

定位人群:具有 nlp 基础、代码阅读能力以及论文学习能力;

难度系数高

组队学习周期:14 天(1 篇 / 周)

每个任务完成大概所需时间:3~4h/ 天

任务安排:

Task1:论文 1 发布 + 论文研读笔记作业 + 后期讨论 (7 天)

Task2:论文 2 发布 + 论文研读笔记作业 + 后期讨论 (7 天)

组队学习将在 8 月 1 号 陆续开始报名

具体学习将在 高校群 在职群 分享进群二维码

进群方式

正文完
 0