前沿学术 | 周志华、李航、邱锡鹏、李沐、Aston Zhang 5位专家指导,机器之心发布ML术语中英对照词表

转自:机器之心

几年前机器之心发布了一个旨在构建 AI 领域术语库的开源项目「Artificial-Intelligence-Terminology-Database」(简称「AITD」)。最近,该项目迎来了第三版。除了常规的更新之外,机器之心还在周志华教授、李航博士、邱锡鹏教授、李沐博士、Aston Zhang 博士等领域专家的指导及帮助下形成了「机器学习」专题篇。未来,机器之心还将会持续完善术语的收录和扩展阅读的构建,另外我们也希望更多 AI 技术社区成员参与到术语库的构建之中,具体的参与方式可以查看文章详情。

2017 年,机器之心发布了第一版人工智能术语库「Artificial-Intelligence-Terminology-Database」(以下简称「AITD」),一个旨在构建 AI 领域专业术语库的开源项目。术语库的前两版主要是将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望为大家写论文、中文博客、阅读文章提供帮助。此外,读者可以积极指出我们编译的不当之处,以提高我们的专业性。同时,这也是一份开放的表单,希望越来越多的人能够提供增添、修改建议,为人工智能的传播助力,共同推进知识高效、广泛地传播。
2021 年 6 月,《动手学深度学习》的作者李沐博士在与机器之心「AITD」项目团队的交流中提到自己当年在校学习时也曾经因不同的教科书中术语使用标准不一致、中英术语夹杂等问题感到困扰。与此同时,李沐博士提到李航博士正在联合周志华教授、邱锡鹏教授等多位机器学习领域经典教科书作者,希望一起统一下领域术语的翻译,为社区统一专业术语的中文使用提供一个参考。基于这样的一个契机,机器之心「AITD」项目组在周志华教授、李航博士的主持下,邱锡鹏教授、李沐博士、Aston Zhang 博士的指导和帮助下,完成了对多本机器学习领域经典教科书术语中文翻译统一,并发布「AITD」Version 3.0,在 AI 术语库中加入「专项领域」系列。
在与专家讨论的过程中,不同的专家对同一个词的翻译也会有分歧。在这种情况下,专家们会从自身经验、理解出发,帮助其余专家理解自己这样翻译的一个背景知识。经过专家们不断的讨论,对于一个词的翻译最终会接近或达到一个共识。
在此过程中,我们也记录了一些有意思的结果。例如 “Robust” 经常会被翻译为“鲁棒性”,专家们认为这个翻译缺少了中文的美感。此外,在控制论中有将 “Robust” 翻译成“强健性的,在经过专家讨论之后,我们将“稳健性”作为“Robust”的推荐翻译;“Dropout”一直没有较好的翻译,几位专家根据 Dropout 原文中的定义,一致认为“暂退法”是比较较为合适的翻译;“Zero/Few/One-shot Learning”一般翻译为“零/少/单样本学习”,但专家们认为“样本”不严谨,因为它并不是真的“零/少/单”样本,而是在建立一个映射之后,再利用少量样本进行迁移。翻译成样本的话,很容易跟学习理论中真正的“小样本学习”混淆了。尤其是“shot”本身并没有“样本”的含义,而是“快照”的含义更接近,于是专家们倾向翻译为“零/少/单试学习”。以下是李航博士微博关于一些推荐翻译介绍的截图。

李航博士微博截图,注:其中「掩玛」一词书写错误,应为「掩码」,已纠正。

项目地址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology-Database

GitBook 地址:https://jiqizhixin.gitbook.io/artificial-intelligence-terminology-database/

划重点:「AITD」Version 3.0「专项领域」机器学习篇完整内容在本文文末收录。

「AITD」Version 3.0 更新了什么?

1、第三版术语库发布,包含了 2094 个术语


「AITD」Version 3.0 相较于第一版的 500 词、第二版的 755 词,在规模上扩大了不少。术语库第三版包含了 2094 个专业术语。


2、增加了领域专题 Section,第一个 Section 为机器学习(Machine Learning)篇,包含了 726 个术语


在周志华教授、李航博士、邱锡鹏教授、李沐博士、Aston Zhang 博士指导和帮助下「AITD」项目团队完成了第一个「专项领域」篇 ——「机器学习」篇,并收录在 Version 3.0 的更新中。在后续的版本更新中,机器之心将搜集自权威教科书、论文等具有公信力的资料源中的术语表进行校验汇总,并从中筛选出一些具有争议、没有翻译等情况的术语给到领域专家进行集中讨论以确认翻译、统一翻译。


3、优化了术语的组织形式,每一个术语都会有如下的字段帮助大家更全面地理解

  • 索引编号:考虑到讨论交流、数据库维护的效率,我们将使用「Artificial-Intelligence-Terminology-Database」的缩写 AITD 并加上数字作为术语的编号,根据当前术语库的首字母顺序进行标注,索引编号将从 AITD-00000 开始;
  • 英文术语:英文术语;
  • 中文翻译:该英文术语目前推荐的中文翻译;
  • 常用缩写:该英文术语常用的缩写形式;
  • 来源 & 扩展:来源 & 扩展是对该术语的注解,在前两版中的内容为机器之心往期的相关文章。我们希望不仅能提供相对应的术语,同时还希望能为读者提供每一个术语的来源和概念上的扩展。从第三版起,我们将关联更多的资源内容,包括但不限于教科书、论文等来源。但由于这一部分工作量较大,我们将与读者共同推进这一部分扩展的进程,进一步提升术语信度。
  • 备注:关于该术语的一些注解。
4、增加了知识共享许可证


本作品将采用知识共享署名 - 非商业性使用 - 相同方式共享 4.0 国际许可协议(CC BY-NC-SA 4.0)进行许可。同时,我们响应了 GitHub 仓库中网友的建议,增加了 GitBook 的链接,方便大家查阅。

「AITD」后续有什么计划?

本项目中所有英文专业术语对照的中文都来自机器之心编译的文章和系列机器学习教科书(如周志华教授的《机器学习》、李航博士的《统计学习方法》、邱锡鹏教授的《神经网络与深度学习》、李沐博士的《动手学深度学习》、李宏毅教授的《机器学习方法》和 Ian Goodfellow 的《深度学习》中译版等),我们力求在提供准确翻译的同时保留最常用的形式。同时,为了保证术语翻译的准确性,我们将此项目向读者开源,并希望能与读者共同迭代术语的准确度。
除了日常编译工作积累之外,我们将逐专项领域基于权威教科书及文献,联合领域专家进一步扩展并完善本仓库,为社区提供具有统一性的 AI 及相关领域的中英术语翻译对照参考。在接下来的一段时间里,机器之心将从三个方面持续完善术语的收录和扩展阅读的构建:

①  继续完善基础术语的构建,即通过权威教科书或其它有公信力的资料抽取常见术语;

②  续性地把编译论文或其他资料中所出现的非常见术语更新到术语库中;

③  联合更多专项领域专家,构建专项领域术语库。自「AITD」Version 3.0 起,机器之心「AITD」项目团队将基于以下标准开展「专项领域」术语库工作:

1)基于权威教科书、论文等具有公信力的资料源提取词汇。

2)邀请对应领域专家进行专业指导目前 「AITD」Version 3.0 已包含机器学习(Machine Learning)篇,本项目还将逐步更新更多专项领域篇,在此「AITD」项目组邀请各位专项领域专家学者共同参与指导专项领域篇的形成工作,对「AITD」项目感兴趣并希望贡献一部分您的时间支持这个项目的领域专家学者可通过 lab@jiqizhixin.com 联系我们。

致谢!

衷心感谢以下专家参与了包含但不限于术语提供、校对、翻译研讨等工作,为该项目扩展了专项领域术语收录的覆盖度、提升了术语中文翻译用法的准确性、专业性及公信力,感谢老师们的辛勤贡献(排名以 A~Z 进行排序):

1. Aston Zhang 博士,《动手学深度学习》作者

2. 李航博士,《统计学习方法》作者

3. 李沐博士,《动手学深度学习》作者

4. 邱锡鹏教授,《神经网络与深度学习》作者

5. 周志华教授,《机器学习》作者

读者及用户的反馈意见和更新建议将贯穿整个阶段,我们也将在项目致谢页中展示对该项目起积极作用的读者及用户。如果您在使用术语库的过程中若发现了存在的错误、或是想要扩展术语库的内容、讨论特定术语的翻译等等非常欢迎大家提 Issue 与我们以及各位读者进行讨论(请附带来源,以便我们能更客观地更新词汇)。同时也非常欢迎读者们进行 Fork、提 Pull Request,共同加强术语的编译质量以及扩充术语库的规模。

参与「AITD」!

我们邀请更多感兴趣一起参与「AITD」项目的小伙伴通过加入「机器之心分析师网络」加入到「AITD」项目工作中来。除了旨在构建 AI 领域术语库的「Artificial-Intelligence-Terminology-Database」,机器之心目前还有「开放知识库」 GitHub 项目,例如 ——
「ML-Tutorial-Experiment」算法教程与实现项目目前共获得 2400+ Star。它目前有五篇详细的教程文章,即 CNN 的实现、经典 GAN 的推导实现、 CapsNet 的解读、LSTM 等语言建模和基于 Transformer 的神经机器翻译实现。我们希望能提供高质量和能实现的技术文章,在这些文章中,我们所使用的代码块或整体实现都是我们预先测试的,且提供的 Jupyter Notebook 都带有代码注释,非常适合初学者随文章阅读。
项目地址:https://github.com/jiqizhixin/ML-Tutorial-Experiment
「SyncedLeg2018」 机器之腿项目是源于机器之心 2018 年暑期实习生 Hackathon 的输出成果,可基于微信历史文章与相应的流量数据、分析统计出热点词汇。
项目地址:https://github.com/jiqizhixin/SyncedLeg2018
加入机器之心分析师网络,在参与机器之心发起的人工智能及相关技术领域的「开放知识库」项目之外,还将有机会受邀作为特约分析师 

  •  现场参与国内外学术、学术及产业盛会,现场观察。
  •  参与热点技术解读、指标分析、性能评测等专业性技术分析项目。
  •  参与热点事件解读、产业前景分析等专业性产业分析项目。

在过去的五年里数百位兼职分析师们利用自己的工作、学习之余的闲暇时间,与机器之心的全职分析师们共同构建 AI 知识库、维护开源项目、撰写技术分析、开展专业调研、联合发布报告等等。参与机器之心全球开放项目的分析师大部分来自于内一流的研究机构及一流人工智能企业,其中包括卡耐基梅隆大学,滑铁卢大学,多伦多大学,加州大学洛杉矶分校,清华大学等等。

「AITD」Version 3.0:「机器学习」专项领域术语中英对照表

英文术语中文翻译
0-1 Loss Function0-1损失函数
Accept-Reject Sampling Method接受-拒绝抽样法/接受-拒绝采样法
Accumulated Error Backpropagation累积误差反向传播
Accuracy精度
Acquisition Function采集函数
Action动作
Activation Function激活函数
Active Learning主动学习
Adaptive Bitrate Algorithm自适应比特率算法
Adaptive BoostingAdaBoost
Adaptive Gradient AlgorithmAdaGrad
Adaptive Moment Estimation AlgorithmAdam算法
Adaptive Resonance Theory自适应谐振理论
Additive Model加性模型
Affinity Matrix亲和矩阵
Agent智能体
Algorithm算法
Alpha-Beta Pruningα-β修剪法
Anomaly Detection异常检测
Approximate Inference近似推断
Area Under ROC CurveAUC
Artificial Intelligence人工智能
Artificial Neural Network人工神经网络
Artificial Neuron人工神经元
Attention注意力
Attention Mechanism注意力机制
Attribute属性
Attribute Space属性空间
Autoencoder自编码器
Automatic Differentiation自动微分
Autoregressive Model自回归模型
Back Propagation反向传播
Back Propagation Algorithm反向传播算法
Back Propagation Through Time随时间反向传播
Backward Induction反向归纳
Backward Search反向搜索
Bag of Words词袋
Bandit赌博机/老虎机
Base Learner基学习器
Base Learning Algorithm基学习算法
Baseline基准
Batch批量
Batch Normalization批量规范化
Bayes Decision Rule贝叶斯决策准则
Bayes Model Averaging贝叶斯模型平均
Bayes Optimal Classifier贝叶斯最优分类器
Bayes' Theorem贝叶斯定理
Bayesian Decision Theory贝叶斯决策理论
Bayesian Inference贝叶斯推断
Bayesian Learning贝叶斯学习
Bayesian Network贝叶斯网/贝叶斯网络
Bayesian Optimization贝叶斯优化
Beam Search束搜索
Benchmark基准
Belief Network信念网/信念网络
Belief Propagation信念传播
Bellman Equation贝尔曼方程
Bernoulli Distribution伯努利分布
Beta Distribution贝塔分布
Between-Class Scatter Matrix类间散度矩阵
BFGSBFGS
Bias偏差/偏置
Bias In Affine Function偏置
Bias In Statistics偏差
Bias Shift偏置偏移
Bias-Variance Decomposition偏差 - 方差分解
Bias-Variance Dilemma偏差 - 方差困境
Bidirectional Recurrent Neural Network双向循环神经网络
Bigram二元语法
Bilingual Evaluation UnderstudyBLEU
Binary Classification二分类
Binomial Distribution二项分布
Binomial Test二项检验
Boltzmann Distribution玻尔兹曼分布
Boltzmann Machine玻尔兹曼机
BoostingBoosting
Bootstrap AggregatingBagging
Bootstrap Sampling自助采样法
Bootstrapping自助法/自举法
Break-Event Point平衡点
Bucketing分桶
Calculus of Variations变分法
Cascade-Correlation级联相关
Catastrophic Forgetting灾难性遗忘
Categorical Distribution类别分布
Cell单元
Chain Rule链式法则
Chebyshev Distance切比雪夫距离
Class类别
Class-Imbalance类别不平衡
Classification分类
Classification And Regression Tree分类与回归树
Classifier分类器
Clique
Cluster
Cluster Assumption聚类假设
Clustering聚类
Clustering Ensemble聚类集成
Co-Training协同训练
Coding Matrix编码矩阵
Collaborative Filtering协同过滤
Competitive Learning竞争型学习
Comprehensibility可解释性
Computation Graph计算图
Computational Learning Theory计算学习理论
Conditional Entropy条件熵
Conditional Probability条件概率
Conditional Probability Distribution条件概率分布
Conditional Random Field条件随机场
Conditional Risk条件风险
Confidence置信度
Confusion Matrix混淆矩阵
Conjugate Distribution共轭分布
Connection Weight连接权
Connectionism连接主义
Consistency一致性
Constrained Optimization约束优化
Context Variable上下文变量
Context Vector上下文向量
Context Window上下文窗口
Context Word上下文词
Contextual Bandit上下文赌博机/上下文老虎机
Contingency Table列联表
Continuous Attribute连续属性
Contrastive Divergence对比散度
Convergence收敛
Convex Optimization凸优化
Convex Quadratic Programming凸二次规划
Convolution卷积
Convolutional Kernel卷积核
Convolutional Neural Network卷积神经网络
Coordinate Descent坐标下降
Corpus语料库
Correlation Coefficient相关系数
Cosine Similarity余弦相似度
Cost代价
Cost Curve代价曲线
Cost Function代价函数
Cost Matrix代价矩阵
Cost-Sensitive代价敏感
Covariance协方差
Covariance Matrix协方差矩阵
Critical Point临界点
Cross Entropy交叉熵
Cross Validation交叉验证
Curse of Dimensionality维数灾难
Cutting Plane Algorithm割平面法
Data Mining数据挖掘
Data Set数据集
Davidon-Fletcher-PowellDFP
Decision Boundary决策边界
Decision Function决策函数
Decision Stump决策树桩
Decision Tree决策树
Decoder解码器
Decoding解码
Deconvolution反卷积
Deconvolutional Network反卷积网络
Deduction演绎
Deep Belief Network深度信念网络
Deep Boltzmann Machine深度玻尔兹曼机
Deep Convolutional Generative Adversarial Network深度卷积生成对抗网络
Deep Learning深度学习
Deep Neural Network深度神经网络
Deep Q-Network深度Q网络
Delta-Bar-DeltaDelta-Bar-Delta
Denoising去噪
Denoising Autoencoder去噪自编码器
Denoising Score Matching去躁分数匹配
Density Estimation密度估计
Density-Based Clustering密度聚类
Derivative导数
Determinant行列式
Diagonal Matrix对角矩阵
Dictionary Learning字典学习
Dimension Reduction降维
Directed Edge有向边
Directed Graphical Model有向图模型
Directed Separation有向分离
Dirichlet Distribution狄利克雷分布
Discriminative Model判别式模型
Discriminator判别器
Discriminator Network判别网络
Distance Measure距离度量
Distance Metric Learning距离度量学习
Distributed Representation分布式表示
Diverge发散
Divergence散度
Diversity多样性
Diversity Measure多样性度量/差异性度量
Domain Adaptation领域自适应
Dominant Strategy主特征值
Dominant Strategy占优策略
Down Sampling下采样
Dropout暂退法
Dropout Boosting暂退Boosting
Dropout Method暂退法
Dual Problem对偶问题
Dummy Node哑结点
Dynamic Bayesian Network动态贝叶斯网络
Dynamic Programming动态规划
Early Stopping早停
Eigendecomposition特征分解
Eigenvalue特征值
Element-Wise Product逐元素积
Embedding嵌入
Empirical Conditional Entropy经验条件熵
Empirical Distribution经验分布
Empirical Entropy经验熵
Empirical Error经验误差
Empirical Risk经验风险
Empirical Risk Minimization经验风险最小化
Encoder编码器
Encoding编码
End-To-End端到端
Energy Function能量函数
Energy-Based Model基于能量的模型
Ensemble Learning集成学习
Ensemble Pruning集成修剪
Entropy
Episode回合
Epoch
Error误差
Error Backpropagation Algorithm误差反向传播算法
Error Backpropagation误差反向传播
Error Correcting Output Codes纠错输出编码
Error Rate错误率
Error-Ambiguity Decomposition误差-分歧分解
Estimator估计/估计量
Euclidean Distance欧氏距离
Evidence证据
Evidence Lower Bound证据下界
Exact Inference精确推断
Example样例
Expectation期望
Expectation Maximization期望最大化
Expected Loss期望损失
Expert System专家系统
Exploding Gradient梯度爆炸
Exponential Loss Function指数损失函数
Factor因子
Factorization因子分解
Feature特征
Feature Engineering特征工程
Feature Map特征图
Feature Selection特征选择
Feature Vector特征向量
Featured Learning特征学习
Feedforward前馈
Feedforward Neural Network前馈神经网络
Few-Shot Learning少试学习
Filter滤波器
Fine-Tuning微调
Fluctuation振荡
Forget Gate遗忘门
Forward Propagation前向传播/正向传播
Forward Stagewise Algorithm前向分步算法
Fractionally Strided Convolution微步卷积
Frobenius NormFrobenius 范数
Full Padding全填充
Functional泛函
Functional Neuron功能神经元
Gated Recurrent Unit门控循环单元
Gated RNN门控RNN
Gaussian Distribution高斯分布
Gaussian Kernel高斯核
Gaussian Kernel Function高斯核函数
Gaussian Mixture Model高斯混合模型
Gaussian Process高斯过程
Generalization Ability泛化能力
Generalization Error泛化误差
Generalization Error Bound泛化误差上界
Generalize泛化
Generalized Lagrange Function广义拉格朗日函数
Generalized Linear Model广义线性模型
Generalized Rayleigh Quotient广义瑞利商
Generative Adversarial Network生成对抗网络
Generative Model生成式模型
Generator生成器
Generator Network生成器网络
Genetic Algorithm遗传算法
Gibbs Distribution吉布斯分布
Gibbs Sampling吉布斯采样/吉布斯抽样
Gini Index基尼指数
Global Markov Property全局马尔可夫性
Global Minimum全局最小
Gradient梯度
Gradient Clipping梯度截断
Gradient Descent梯度下降
Gradient Descent Method梯度下降法
Gradient Exploding Problem梯度爆炸问题
Gram MatrixGram 矩阵
Graph Convolutional Network图卷积神经网络/图卷积网络
Graph Neural Network图神经网络
Graphical Model图模型
Grid Search网格搜索
Ground Truth真实值
Hadamard ProductHadamard积
Hamming Distance汉明距离
Hard Margin硬间隔
Hebbian Rule赫布法则
Hidden Layer隐藏层
Hidden Markov Model隐马尔可夫模型
Hidden Variable隐变量
Hierarchical Clustering层次聚类
Hilbert Space希尔伯特空间
Hinge Loss Function合页损失函数/Hinge损失函数
Hold-Out留出法
Hyperparameter超参数
Hyperparameter Optimization超参数优化
Hypothesis假设
Hypothesis Space假设空间
Hypothesis Test假设检验
Identity Matrix单位矩阵
Imitation Learning模仿学习
Importance Sampling重要性采样
Improved Iterative Scaling改进的迭代尺度法
Incremental Learning增量学习
Independent and Identically Distributed独立同分布
Indicator Function指示函数
Individual Learner个体学习器
Induction归纳
Inductive Bias归纳偏好
Inductive Learning归纳学习
Inductive Logic Programming归纳逻辑程序设计
Inference推断
Information Entropy信息熵
Information Gain信息增益
Inner Product内积
Instance示例
Internal Covariate Shift内部协变量偏移
Inverse Matrix逆矩阵
Inverse Resolution逆归结
Isometric Mapping等度量映射
Jacobian Matrix雅可比矩阵
Jensen InequalityJensen不等式
Joint Probability Distribution联合概率分布
K-Armed Bandit Problemk-摇臂老虎机
K-Fold Cross Validationk 折交叉验证
Karush-Kuhn-Tucker ConditionKKT条件
Karush–Kuhn–TuckerKarush–Kuhn–Tucker
Kernel Function核函数
Kernel Method核方法
Kernel Trick核技巧
Kernelized Linear Discriminant Analysis核线性判别分析
KL DivergenceKL散度
L-BFGSL-BFGS
Label标签
Label Space标记空间
Lagrange Duality拉格朗日对偶性
Lagrange Multiplier拉格朗日乘子
Language Model语言模型
Laplace Smoothing拉普拉斯平滑
Laplacian Correction拉普拉斯修正
Latent Dirichlet Allocation潜在狄利克雷分配
Latent Semantic Analysis潜在语义分析
Latent Variable潜变量/隐变量
Law of Large Numbers大数定律
Layer Normalization层规范化
Lazy Learning懒惰学习
Leaky Relu泄漏修正线性单元/泄漏整流线性单元
Learner学习器
Learning学习
Learning By Analogy类比学习
Learning Rate学习率
Learning Vector Quantization学习向量量化
Least Square Method最小二乘法
Least Squares Regression Tree最小二乘回归树
Left Singular Vector左奇异向量
Likelihood似然
Linear Chain Conditional Random Field线性链条件随机场
Linear Classification Model线性分类模型
Linear Classifier线性分类器
Linear Dependence线性相关
Linear Discriminant Analysis线性判别分析
Linear Model线性模型
Linear Regression线性回归
Link Function联系函数
Local Markov Property局部马尔可夫性
Local Minima局部极小
Local Minimum局部极小
Local Representation局部式表示/局部式表征
Log Likelihood对数似然函数
Log Linear Model对数线性模型
Log-Likelihood对数似然
Log-Linear Regression对数线性回归
Logistic Function对数几率函数
Logistic Regression对数几率回归
Logit对数几率
Long Short Term Memory长短期记忆
Long Short-Term Memory Network长短期记忆网络
Loopy Belief Propagation环状信念传播
Loss Function损失函数
Low Rank Matrix Approximation低秩矩阵近似
Machine Learning机器学习
Macron-R宏查全率
Manhattan Distance曼哈顿距离
Manifold流形
Manifold Assumption流形假设
Manifold Learning流形学习
Margin间隔
Marginal Distribution边缘分布
Marginal Independence边缘独立性
Marginalization边缘化
Markov Chain马尔可夫链
Markov Chain Monte Carlo马尔可夫链蒙特卡罗
Markov Decision Process马尔可夫决策过程
Markov Network马尔可夫网络
Markov Process马尔可夫过程
Markov Random Field马尔可夫随机场
Mask掩码
Matrix矩阵
Matrix Inversion逆矩阵
Max Pooling最大汇聚
Maximal Clique最大团
Maximum Entropy Model最大熵模型
Maximum Likelihood Estimation极大似然估计
Maximum Margin最大间隔
Mean Filed平均场
Mean Pooling平均汇聚
Mean Squared Error均方误差
Mean-Field平均场
Memory Network记忆网络
Message Passing消息传递
Metric Learning度量学习
Micro-R微查全率
Minibatch小批量
Minimal Description Length最小描述长度
Minimax Game极小极大博弈
Minkowski Distance闵可夫斯基距离
Mixture of Experts混合专家模型
Mixture-of-Gaussian高斯混合
Model模型
Model Selection模型选择
Momentum Method动量法
Monte Carlo Method蒙特卡罗方法
Moral Graph端正图/道德图
Moralization道德化
Multi-Class Classification多分类
Multi-Head Attention多头注意力
Multi-Head Self-Attention多头自注意力
Multi-Kernel Learning多核学习
Multi-Label Learning多标记学习
Multi-Layer Feedforward Neural Networks多层前馈神经网络
Multi-Layer Perceptron多层感知机
Multinomial Distribution多项分布
Multiple Dimensional Scaling多维缩放
Multiple Linear Regression多元线性回归
Multitask Learning多任务学习
Multivariate Normal Distribution多元正态分布
Mutual Information互信息
N-Gram ModelN元模型
Naive Bayes Classifier朴素贝叶斯分类器
Naive Bayes朴素贝叶斯
Nearest Neighbor Classifier最近邻分类器
Negative Log Likelihood负对数似然函数
Neighbourhood Component Analysis近邻成分分析
Net Input净输入
Neural Network神经网络
Neural Turing Machine神经图灵机
Neuron神经元
Newton Method牛顿法
No Free Lunch Theorem没有免费午餐定理
Noise-Contrastive Estimation噪声对比估计
Nominal Attribute列名属性
Non-Convex Optimization非凸优化
Non-Metric Distance非度量距离
Non-Negative Matrix Factorization非负矩阵分解
Non-Ordinal Attribute无序属性
Norm范数
Normal Distribution正态分布
Normalization规范化
Nuclear Norm核范数
Number of Epochs轮数
Numerical Attribute数值属性
Object Detection目标检测
Oblique Decision Tree斜决策树
Occam's Razor奥卡姆剃刀
Odds几率
Off-Policy异策略
On-Policy同策略
One-Dependent Estimator独依赖估计
One-Hot独热
Online Learning在线学习
Optimizer优化器
Ordinal Attribute有序属性
Orthogonal正交
Orthogonal Matrix正交矩阵
Out-Of-Bag Estimate包外估计
Outlier异常点
Over-Parameterized过度参数化
Overfitting过拟合
Oversampling过采样
Pac-LearnablePAC可学习
Padding填充
Pairwise Markov Property成对马尔可夫性
Parallel Distributed Processing分布式并行处理
Parameter参数
Parameter Estimation参数估计
Parameter Space参数空间
Parameter Tuning调参
Parametric ReLU参数化修正线性单元/参数化整流线性单元
Part-Of-Speech Tagging词性标注
Partial Derivative偏导数
Partially Observable Markov Decision Processes部分可观测马尔可夫决策过程
Partition Function配分函数
Perceptron感知机
Performance Measure性能度量
Perplexity困惑度
Pointer Network指针网络
Policy策略
Policy Gradient策略梯度
Policy Iteration策略迭代
Polynomial Kernel Function多项式核函数
Pooling汇聚
Pooling Layer汇聚层
Positive Definite Matrix正定矩阵
Post-Pruning后剪枝
Potential Function势函数
Power Method幂法
Pre-Training预训练
Precision查准率/准确率
Prepruning预剪枝
Primal Problem主问题
Primary Visual Cortex初级视觉皮层
Principal Component Analysis主成分分析
Prior先验
Probabilistic Context-Free Grammar概率上下文无关文法
Probabilistic Graphical Model概率图模型
Probabilistic Model概率模型
Probability Density Function概率密度函数
Probability Distribution概率分布
Probably Approximately Correct概率近似正确
Proposal Distribution提议分布
Prototype-Based Clustering原型聚类
Proximal Gradient Descent近端梯度下降
Pruning剪枝
Quadratic Loss Function平方损失函数
Quadratic Programming二次规划
Quasi Newton Method拟牛顿法
Radial Basis Function径向基函数
Random Forest随机森林
Random Sampling随机采样
Random Search随机搜索
Random Variable随机变量
Random Walk随机游走
Recall查全率/召回率
Receptive Field感受野
Reconstruction Error重构误差
Rectified Linear Unit修正线性单元/整流线性单元
Recurrent Neural Network循环神经网络
Recursive Neural Network递归神经网络
Regression回归
Regularization正则化
Regularizer正则化项
Reinforcement Learning强化学习
Relative Entropy相对熵
Reparameterization再参数化/重参数化
Representation表示
Representation Learning表示学习
Representer Theorem表示定理
Reproducing Kernel Hilbert Space再生核希尔伯特空间
Rescaling再缩放
Reset Gate重置门
Residual Connection残差连接
Residual Network残差网络
Restricted Boltzmann Machine受限玻尔兹曼机
Reward奖励
Ridge Regression岭回归
Right Singular Vector右奇异向量
Risk风险
Robustness稳健性
Root Node根结点
Rule Learning规则学习
Saddle Point鞍点
Sample样本
Sample Complexity样本复杂度
Sample Space样本空间
Scalar标量
Selective Ensemble选择性集成
Self Information自信息
Self-Attention自注意力
Self-Organizing Map自组织映射网
Self-Training自训练
Semi-Definite Programming半正定规划
Semi-Naive Bayes Classifiers半朴素贝叶斯分类器
Semi-Restricted Boltzmann Machine半受限玻尔兹曼机
Semi-Supervised Clustering半监督聚类
Semi-Supervised Learning半监督学习
Semi-Supervised Support Vector Machine半监督支持向量机
Sentiment Analysis情感分析
Separating Hyperplane分离超平面
Sequential Covering序贯覆盖
Sigmoid Belief NetworkSigmoid信念网络
Sigmoid FunctionSigmoid函数
Signed Distance带符号距离
Similarity Measure相似度度量
Simulated Annealing模拟退火
Simultaneous Localization And Mapping即时定位与地图构建
Singular Value奇异值
Singular Value Decomposition奇异值分解
Skip-Gram Model跳元模型
Smoothing平滑
Soft Margin软间隔
Soft Margin Maximization软间隔最大化
SoftmaxSoftmax/软最大化
Softmax FunctionSoftmax函数/软最大化函数
Softmax RegressionSoftmax回归/软最大化回归
Softplus FunctionSoftplus函数
Span张成子空间
Sparse Coding稀疏编码
Sparse Representation稀疏表示
Sparsity稀疏性
Specialization特化
Splitting Variable切分变量
Squashing Function挤压函数
Standard Normal Distribution标准正态分布
State状态
State Value Function状态值函数
State-Action Value Function状态-动作值函数
Stationary Distribution平稳分布
Stationary Point驻点
Statistical Learning统计学习
Steepest Descent最速下降法
Stochastic Gradient Descent随机梯度下降
Stochastic Matrix随机矩阵
Stochastic Process随机过程
Stratified Sampling分层采样
Stride步幅
Structural Risk结构风险
Structural Risk Minimization结构风险最小化
Subsample子采样
Subsampling下采样
Subset Search子集搜索
Subspace子空间
Supervised Learning监督学习
Support Vector支持向量
Support Vector Expansion支持向量展式
Support Vector Machine支持向量机
Surrogat Loss替代损失
Surrogate Function替代函数
Surrogate Loss Function代理损失函数
Symbolism符号主义
Tangent Propagation正切传播
Teacher Forcing强制教学
Temporal-Difference Learning时序差分学习
Tensor张量
Test Error测试误差
Test Sample测试样本
Test Set测试集
Threshold阈值
Threshold Logic Unit阈值逻辑单元
Threshold-Moving阈值移动
Tied Weight捆绑权重
Tikhonov RegularizationTikhonov正则化
Time Delay Neural Network时延神经网络
Time Homogenous Markov Chain时间齐次马尔可夫链
Time Step时间步
Token词元
Token词元
Tokenization词元化
Tokenizer词元分析器
Topic Model话题模型
Topic Modeling话题分析
Trace
Training训练
Training Error训练误差
Training Sample训练样本
Training Set训练集
Transductive Learning直推学习
Transductive Transfer Learning直推迁移学习
Transfer Learning迁移学习
TransformerTransformer
Transformer ModelTransformer模型
Transpose转置
Transposed Convolution转置卷积
Trial And Error试错
Trigram三元语法
Turing Machine图灵机
Underfitting欠拟合
Undersampling欠采样
Undirected Graphical Model无向图模型
Uniform Distribution均匀分布
Unigram一元语法
Unit单元
Universal Approximation Theorem通用近似定理
Universal Approximator通用近似器
Universal Function Approximator通用函数近似器
Unknown Token未知词元
Unsupervised Layer-Wise Training无监督逐层训练
Unsupervised Learning无监督学习
Update Gate更新门
Upsampling上采样
V-StructureV型结构
Validation Set验证集
Validity Index有效性指标
Value Function Approximation值函数近似
Value Iteration值迭代
Vanishing Gradient Problem梯度消失问题
Vapnik-Chervonenkis DimensionVC维
Variable Elimination变量消去
Variance方差
Variational Autoencoder变分自编码器
Variational Inference变分推断
Vector向量
Vector Space Model向量空间模型
Version Space版本空间
Viterbi Algorithm维特比算法
Vocabulary词表
Warp线程束
Weak Learner弱学习器
Weakly Supervised Learning弱监督学习
Weight权重
Weight Decay权重衰减
Weight Sharing权共享
Weighted Voting加权投票
Whitening白化
Winner-Take-All胜者通吃
Within-Class Scatter Matrix类内散度矩阵
Word Embedding词嵌入
Word Sense Disambiguation词义消歧
Word Vector词向量
Zero Padding零填充
Zero-Shot Learning零试学习
Zipf's Law齐普夫定律

发表评论

电子邮件地址不会被公开。 必填项已用*标注