Handbook for Data Science and Artificial Intelligence
search
快速搜索
edit
Edit on Github
Q&A
GitHub
CodeBook
HomePage
Search
Handbook for Data Science and Artificial Intelligence
內容目录
数据科学与人工智能简介
1. 数据科学基础
1.1. 数据获取
1.2. 数据存储与读取
1.2.1. 文件存储
1.2.2. 数据库
图形数据库、NOSQL 和 Neo4j
伯克利推出世界最快的KVS数据库Anna:秒杀Redis和Cassandra
1.3. 特征工程
1.3.1. 数据预处理
1.3.2.1. 特征分析
1.3.2.2. 特征构建
1.3.2.3. 特征评估
1.3.3.1. FeatureTools
LightGBM
xgboost如何使用MAE或MAPE作为目标函数? - superbrother的文章 - 知乎
1.4. 延伸: Pandas与Sklearn的阿喀琉斯之踵
2. 机器学习基础
3. 深度学习基础
3.1. BP神经网络
3.2.1. 序列分析 —— RNN
3.2.2.1. 卷积
卷积有多少种?一文读懂深度学习中的各种卷积 - 机器之心的文章 - 知乎
Understanding Convolutions
如何通俗易懂地解释卷积? - 马同学的回答 - 知乎
CNN入门讲解:卷积层是如何提取特征的? - 蒋竺波的文章 - 知乎
“卷积”其实没那么难以理解 - J Pan的文章 - 知乎
3.2.2.2. 欧拉结构 —— CNN
CNN(卷积神经网络)最早是哪一年提出,是如何发展的? - 余霆嵩的回答 - 知乎
深度神经网络中的感受野(Receptive Field) - 蓝荣祎的文章 - 知乎
卷积神经网络的一些细节思考(卷积、池化层的作用)
VGG in TensorFlow
CNN简史 - Lunarnai的文章 - 知乎
Understanding Convolutional Neural Networks for NLP
3.2.2.3. 非欧结构 —— GNN
Atwood J, Towsley D. Diffusion-convolutional neural networks
谱聚类(spectral clustering)原理总结
GraphSAGE: GCN落地必读论文 - 风浪的文章 - 知乎
如何理解 Graph Convolutional Network(GCN)? - superbrother的回答 - 知乎
如何理解 Graph Convolutional Network(GCN)? - Johnny Richards的回答 - 知乎
Monti F, Otness K, Bronstein M M. Motifnet: a motif-based graph convolutional network for directed graphs
向往的GAT(图注意力模型) - superbrother的文章 - 知乎
graph convolutional network有什么比较好的应用task? - superbrother的回答 - 知乎
3.3.1. 梯度消失与梯度爆炸
3.3.2. 解释性
4. 杂记
4.1. 知识图谱
4.2. 元学习
4.3. 风险控制
4.4. 强化学习
附录
主要符号一览
数学基础
线性代数基础
微积分基础
概率统计基础
信息论基础
计算机基础
编程基础
Python基础
Makefile 基础
makefile介绍
算法基础
经典算法
马尔科夫链, PageRank算法, 与代数图论
如何得到幂法收敛的Markov转移矩阵
!
!
图论
计算机系统基础
linux 基本指令
计算机硬件基础
服务器管理指南
架构基础
版本控制
自动文档
单元测试
Pytest 使用手册
自动部署
Web开发
Package Management
Front End
Back End
Format Configuration
Abbreviation
可视化
Handbook for Data Science and Artificial Intelligence
內容目录
数据科学与人工智能简介
1. 数据科学基础
1.1. 数据获取
1.2. 数据存储与读取
1.2.1. 文件存储
1.2.2. 数据库
图形数据库、NOSQL 和 Neo4j
伯克利推出世界最快的KVS数据库Anna:秒杀Redis和Cassandra
1.3. 特征工程
1.3.1. 数据预处理
1.3.2.1. 特征分析
1.3.2.2. 特征构建
1.3.2.3. 特征评估
1.3.3.1. FeatureTools
LightGBM
xgboost如何使用MAE或MAPE作为目标函数? - superbrother的文章 - 知乎
1.4. 延伸: Pandas与Sklearn的阿喀琉斯之踵
2. 机器学习基础
3. 深度学习基础
3.1. BP神经网络
3.2.1. 序列分析 —— RNN
3.2.2.1. 卷积
卷积有多少种?一文读懂深度学习中的各种卷积 - 机器之心的文章 - 知乎
Understanding Convolutions
如何通俗易懂地解释卷积? - 马同学的回答 - 知乎
CNN入门讲解:卷积层是如何提取特征的? - 蒋竺波的文章 - 知乎
“卷积”其实没那么难以理解 - J Pan的文章 - 知乎
3.2.2.2. 欧拉结构 —— CNN
CNN(卷积神经网络)最早是哪一年提出,是如何发展的? - 余霆嵩的回答 - 知乎
深度神经网络中的感受野(Receptive Field) - 蓝荣祎的文章 - 知乎
卷积神经网络的一些细节思考(卷积、池化层的作用)
VGG in TensorFlow
CNN简史 - Lunarnai的文章 - 知乎
Understanding Convolutional Neural Networks for NLP
3.2.2.3. 非欧结构 —— GNN
Atwood J, Towsley D. Diffusion-convolutional neural networks
谱聚类(spectral clustering)原理总结
GraphSAGE: GCN落地必读论文 - 风浪的文章 - 知乎
如何理解 Graph Convolutional Network(GCN)? - superbrother的回答 - 知乎
如何理解 Graph Convolutional Network(GCN)? - Johnny Richards的回答 - 知乎
Monti F, Otness K, Bronstein M M. Motifnet: a motif-based graph convolutional network for directed graphs
向往的GAT(图注意力模型) - superbrother的文章 - 知乎
graph convolutional network有什么比较好的应用task? - superbrother的回答 - 知乎
3.3.1. 梯度消失与梯度爆炸
3.3.2. 解释性
4. 杂记
4.1. 知识图谱
4.2. 元学习
4.3. 风险控制
4.4. 强化学习
附录
主要符号一览
数学基础
线性代数基础
微积分基础
概率统计基础
信息论基础
计算机基础
编程基础
Python基础
Makefile 基础
makefile介绍
算法基础
经典算法
马尔科夫链, PageRank算法, 与代数图论
如何得到幂法收敛的Markov转移矩阵
!
!
图论
计算机系统基础
linux 基本指令
计算机硬件基础
服务器管理指南
架构基础
版本控制
自动文档
单元测试
Pytest 使用手册
自动部署
Web开发
Package Management
Front End
Back End
Format Configuration
Abbreviation
可视化
Handbook for Data Science and Artificial Intelligence
¶
数据科学与人工智能简介
1. 数据科学基础
1.1. 数据获取
1.1.1. 检索
1.1.2. 公开数据集
1.1.3. 爬虫
1.1.3.1. 参考资料
1.2. 数据存储与读取
1.2.1. 文件存储
1.2.1.1. 非结构化存储 —— 文本与图片
1.2.1.2. 半结构化存储 —— csv, json 与 pickle
1.2.1.3. 结构化存储 —— 知识图谱
1.2.2. 数据库
1.2.2.1. 关系型数据库 —— MySQL
1.2.2.2. 非关系型数据库
1.2.2.2.1. 键值数据库 —— MongoDB
1.2.2.2.2. 图数据库 —— Neo4j
1.2.2.2.3. 文本数据库 —— ElasticSearch
1.2.2.3. 参考资料
图形数据库、NOSQL 和 Neo4j
伯克利推出世界最快的KVS数据库Anna:秒杀Redis和Cassandra
1.3. 特征工程
1.3.1. 数据预处理
1.3.1.1. 数据清理
1.3.1.2. 数据集成
1.3.1.3. 数据变换
1.3.1.4. 数据规约
1.3.1.4.1. 参考资料
1.3.2. 特征构建与特征选择
1.3.2.1. 特征分析
1.3.2.1.1. 可视化分析
1.3.2.1.2. 统计分析
1.3.2.1.3. 参考资料
1.3.2.2. 特征构建
1.3.2.3. 特征评估
1.3.2.3.1. 参考资料
1.3.3. 延伸:特征工程神器
1.3.3.1. FeatureTools
1.3.3.1.1. 参考资料
LightGBM
参考资料
1.4. 延伸: Pandas与Sklearn的阿喀琉斯之踵
1.4.1. Segment Fault
1.4.2. 游标与迭代器
1.4.3. 异步读入
2. 机器学习基础
2.1. 决策树
2.2. 方法评估
2.2.1. 分类评估 —— ACC,PRF 与 AUC
2.2.2. 回归评估 —— MAE,MSE 与 R2
2.2.3. 欠拟合与过拟合
2.3. 集成学习
2.3.1. 偏差与方差
2.3.2. 集成学习方法简介
2.3.3. Review for XGBoost and LightGBM
2.4. LR与SVM
2.5. 优化与搜索
3. 深度学习基础
3.1. BP神经网络
3.1.1. 伪逆与梯度
3.1.2. 计算图
3.2. 变种
3.2.1. 序列分析 —— RNN
3.2.1.1. 序列分析简介
3.2.1.2. 机器翻译
3.2.1.3. 中文文本分类
3.2.2. 结构分析
3.2.2.1. 卷积
3.2.2.1.1. 卷积分类
3.2.2.1.2. 参考资料
3.2.2.2. 欧拉结构 —— CNN
3.2.2.2.1. 参考资料
3.2.2.2.2. TextCNN
3.2.2.3. 非欧结构 —— GNN
3.2.2.3.1. 消息传播
3.2.2.3.2. GCN
3.2.2.3.3. GAT
3.2.2.3.4. 应用
3.2.2.3.5. 阅读材料
3.3. 深度网络的两朵乌云
3.3.1. 梯度消失与梯度爆炸
3.3.1.1. 乘性算子与加性算子
3.3.1.2. LSTM 与 GRU
3.3.1.3. ResNet
3.3.2. 解释性
3.3.2.1. 注意力机制
3.3.2.2. Understand with the gradient
4. 杂记
4.1. 知识图谱
4.1.1. 资源列表
4.2. 元学习
4.2.1. 参考
4.3. 风险控制
4.3.1. 信用评级
4.3.1.1. 参考资料
4.3.1.2. 阅读列表
4.4. 强化学习
4.4.1. 一些关键性的概念
4.4.1.1. 折扣加权平均
4.4.1.2. bootstrap (自举)
4.4.1.3. 最大化偏差
4.4.1.4. 对比
4.4.1.4.1. DP vs MC vs TD
4.4.2. 探索利用窘境
4.4.2.1. off-policy:
4.4.3. 参考资料
4.4.4. 环境
4.4.4.1. Gym
4.4.4.1.1. A New Gym Env
附录
主要符号一览
数学基础
计算机基础
算法基础
计算机系统基础
架构基础
Web开发
Package Management
Front End
Back End
Format Configuration
Abbreviation
可视化
Next
数据科学与人工智能简介