刷新
不平衡样本数据的救星:数据再分配策略

博主头像 在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。 不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。 本文将详细介绍不平衡样本数据的常见场景、处理方法以及在实践中需要注意的问题,帮助你在模型训练前有效地进 ...

AI可解释性 II | Saliency Maps-based 归因方法(Attribution)论文导读(持续更新)

博主头像 本文作为AI可解释性系列的第二部分,旨在以汉语整理并阅读归因方法(Attribution)相关的论文,并持续更新。 归因方法主要研究如何解释深度神经网络的决策过程,通过识别输入特征对模型输出的贡献程度,对模型的决策过程输出为人类可以理解的图像或者量化指标,帮助我们理解模型的决策依据。 ...

JBoltAI的Prompt编排技术:重塑企业智能交互新生态

博主头像 一、Prompt编排技术原理 1. 结构化Prompt设计JBoltAI通过领域驱动设计(DDD)将业务需求拆解为原子化指令单元,构建三层结构: 业务意图层:定义核心目标(如营销转化、风险拦截) 场景规则层:注入行业知识(如金融合规条款、医疗术语库 交互执行层:集成多模态输出模板(文本/表格/流程图 ...

线性模型与多分类问题:简单高效的力量

博主头像 在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。 无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。 线性模型,以其简洁高效的特点,成为了应对多分类问题的有力工具之一。 本文将探讨线性模型解决多分类问题的原理、策略以及优缺点,并通过代码示 ...

线性判别分析(LDA):降维与分类的完美结合

博主头像 在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。 LDA通过寻找特征空间中能够最大化类间方差和最小化类内方差的方向,实现数据的降维和分类。 本文主要介绍LDA的基本原理,展示其如何解决分类问题,以及 ...

从零开始:基于 PyTorch 的图像分类模型

博主头像 摘要:本文详细记录了使用 PyTorch 从零搭建一个图像分类模型的过程,涵盖卷积神经网络(CNN)、数据预处理、模型设计、训练调试与优化。通过对 CIFAR-10 数据集的处理实践,结合经典文献和 2025 年最新研究趋势,深入探讨了技术细节,并辅以完整实践源码的过程和结论。我选择用 PyTorc ...

微积分笔记05:矩阵求导在深度学习中的应用

博主头像 微积分笔记05:矩阵求导在深度学习中的应用 5.1 算法简述 设存在一张像素大小为\(\sqrt n \times \sqrt n\)的样本图片,即该图片总像素个数\(=n\) 现需采用神经网络对其进行识别,过程如下: (1)生成向量\(X_{1\times n}\): 设存在向量\(X_{1\ti ...

联邦学习:去中心化数据下的深度网络优化

博主头像 本文分析《Communication-Efficient Learning of Deep Networks from Decentralized Data》,聚焦联邦学习在去中心化数据中的通信优化,探讨高效训练深度网络与数据隐私保护的方法。这不仅为AI与安全应用奠基,还为未来与区块链的融合提供潜力... ...

微积分笔记03:多元函数的极值

博主头像 微积分笔记03:多元函数的极值 3.1 多元函数存在极值的必要条件 设存在函数\(f(x,y)\),若该函数在点\((x_0,y_0)\)处具有偏导数,则有: \[\tag{1} f(x,y)存在极值 \Rightarrow \begin{cases} f'_x(x_0,y_0)=0\\ f'_y( ...

微积分笔记01:方向导数与梯度

博主头像 微积分笔记01:方向导数与梯度 1.1 方向导数 1.1.1 方向导数引入 设二维坐标系中存在点\(P(x_0,y_0)\),且存在某一方向\(l\),\(l\)与\(x\)轴夹角为\(\alpha\),\(l\)与y轴夹角为\(\beta\) 若点\(P\)沿方向\(l\)移动了t个单位距离后得到 ...

线性代数笔记20.SVD分解及其应用

博主头像 20.SVD分解及其应用 20.1 奇异值的概念 设存在复数矩阵\(A_{mn}\),且\(R(A)=r\) 则对矩阵\((A^H\cdot A)_{nn}\)的特征值进行分析如下: 设存在n阶行向量\(x\),则可将\((A^H\cdot A)_{nn}\)转换为二次型,可得: \[\qquad ...

依存结构与依存分析笔记 (CS224N-3)

依存结构 与编译器中的解析树类似,NLP中的解析树是用于分析句子的句法结构。使用的结构主要有两种类型——短语结构和依存结构。短语结构文法使用短语结构语法将词组织成嵌套成分。后面的内容会展开对它做更详细的说明。我们现在关注依存语法。 句子的依存结构展示了单词依赖于另外一个单词 (修饰或者是参数)。词与 ...

10 卷积神经网络CNN原理

博主头像 1. 全连接层 前文中我们讨论的几乎都是全连接层,也就是在层间,每个神经元都与前一层的所有神经元相连接,如图: 也就是每层的每个feature,都与前一层所有features相关联,是前一层所有features乘以一个权重矩阵W得来的。(这里为了简化理解,我们暂不考虑bias,activation ...

123···12>