在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。 不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。 本文将详细介绍不平衡样本数据的常见场景、处理方法以及在实践中需要注意的问题,帮助你在模型训练前有效地进 ...
本文作为AI可解释性系列的第二部分,旨在以汉语整理并阅读归因方法(Attribution)相关的论文,并持续更新。
归因方法主要研究如何解释深度神经网络的决策过程,通过识别输入特征对模型输出的贡献程度,对模型的决策过程输出为人类可以理解的图像或者量化指标,帮助我们理解模型的决策依据。 ...
一、Prompt编排技术原理 1. 结构化Prompt设计JBoltAI通过领域驱动设计(DDD)将业务需求拆解为原子化指令单元,构建三层结构: 业务意图层:定义核心目标(如营销转化、风险拦截) 场景规则层:注入行业知识(如金融合规条款、医疗术语库 交互执行层:集成多模态输出模板(文本/表格/流程图 ...
在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。 无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。 线性模型,以其简洁高效的特点,成为了应对多分类问题的有力工具之一。 本文将探讨线性模型解决多分类问题的原理、策略以及优缺点,并通过代码示 ...
在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。 LDA通过寻找特征空间中能够最大化类间方差和最小化类内方差的方向,实现数据的降维和分类。 本文主要介绍LDA的基本原理,展示其如何解决分类问题,以及 ...
github:https://github.com/icey-zhang/SuperYOLO article:https://www.sfu.ca/~zhenman/files/J12-TGRS2023-SuperYOLO.pdf 环境: PyTorch 2.5.1 Python 3.12(ubun ...
本文作为AI可解释性系列的第一部分,旨在以汉语整理并阅读对抗攻击(Adversarial Attack)相关的论文,并持续更新。与此同时,AI可解释性系列的第二部分:归因方法(Attribution)也即将上线,敬请期待。 ...
摘要:本文详细记录了使用 PyTorch 从零搭建一个图像分类模型的过程,涵盖卷积神经网络(CNN)、数据预处理、模型设计、训练调试与优化。通过对 CIFAR-10 数据集的处理实践,结合经典文献和 2025 年最新研究趋势,深入探讨了技术细节,并辅以完整实践源码的过程和结论。我选择用 PyTorc ...
《Transformer自然语言处理实战》聚焦 Hugging Face Transformers 库,系统讲解 Transformer 模型在 NLP 任务中的应用。涵盖文本分类、命名实体识别、机器翻译等核心技术,并提供实践案例,帮助读者快速掌握模型微调与部署。适合 NLP 初学者及希望深入理解 ... ...
《Transformer自然语言处理实战》聚焦 Hugging Face Transformers 库,系统讲解 Transformer 模型在 NLP 任务中的应用。涵盖文本分类、命名实体识别、机器翻译等核心技术,并提供实践案例,帮助读者快速掌握模型微调与部署。适合 NLP 初学者及希望深入理解 ... ...
微积分笔记05:矩阵求导在深度学习中的应用 5.1 算法简述 设存在一张像素大小为\(\sqrt n \times \sqrt n\)的样本图片,即该图片总像素个数\(=n\) 现需采用神经网络对其进行识别,过程如下: (1)生成向量\(X_{1\times n}\): 设存在向量\(X_{1\ti ...
本文分析《Communication-Efficient Learning of Deep Networks from Decentralized Data》,聚焦联邦学习在去中心化数据中的通信优化,探讨高效训练深度网络与数据隐私保护的方法。这不仅为AI与安全应用奠基,还为未来与区块链的融合提供潜力... ...
微积分笔记04:常见的矩阵求导运算 4.1 常规矩阵求导示例 4.1.1 求导示例1:\(f(x)=A_{m\times n}\cdot x_{n \times 1}\) \(\Rightarrow f'_{x^T}(x)=A_{m\times n}\) 如: \[A= \begin{bmatrix ...
微积分笔记03:多元函数的极值 3.1 多元函数存在极值的必要条件 设存在函数\(f(x,y)\),若该函数在点\((x_0,y_0)\)处具有偏导数,则有: \[\tag{1} f(x,y)存在极值 \Rightarrow \begin{cases} f'_x(x_0,y_0)=0\\ f'_y( ...
微积分笔记02:多元函数的泰勒展开式&海森矩阵 2.1 二元函数的n阶泰勒展开式 设二维坐标系中存在点\((x_0,y_0)\)及其邻域内的某个点\((x_0+\Delta x,y_0+\Delta y)\) 设存在函数\(z=f(x,y)\),且\(f(x,y)\)在点\((x_0,y_0)\)的 ...
设备端可离线不联网Android 人脸识别、动作及近红外IR活体检测、人脸图质量检测以及人脸搜索(1:N和M:N),快速集成实现人脸识别,人脸搜索功能 ...
微积分笔记01:方向导数与梯度 1.1 方向导数 1.1.1 方向导数引入 设二维坐标系中存在点\(P(x_0,y_0)\),且存在某一方向\(l\),\(l\)与\(x\)轴夹角为\(\alpha\),\(l\)与y轴夹角为\(\beta\) 若点\(P\)沿方向\(l\)移动了t个单位距离后得到 ...
20.SVD分解及其应用 20.1 奇异值的概念 设存在复数矩阵\(A_{mn}\),且\(R(A)=r\) 则对矩阵\((A^H\cdot A)_{nn}\)的特征值进行分析如下: 设存在n阶行向量\(x\),则可将\((A^H\cdot A)_{nn}\)转换为二次型,可得: \[\qquad ...
依存结构 与编译器中的解析树类似,NLP中的解析树是用于分析句子的句法结构。使用的结构主要有两种类型——短语结构和依存结构。短语结构文法使用短语结构语法将词组织成嵌套成分。后面的内容会展开对它做更详细的说明。我们现在关注依存语法。 句子的依存结构展示了单词依赖于另外一个单词 (修饰或者是参数)。词与 ...
1. 全连接层 前文中我们讨论的几乎都是全连接层,也就是在层间,每个神经元都与前一层的所有神经元相连接,如图: 也就是每层的每个feature,都与前一层所有features相关联,是前一层所有features乘以一个权重矩阵W得来的。(这里为了简化理解,我们暂不考虑bias,activation ...