【强化学习笔记】从数学推导到电机控制:深入理解 Policy Gradient 与 Sim-to-Real。
【强化学习笔记】从数学推导到电机控制:深入理解 Policy Gradient 与 Sim-to-Real 前言: 最近在研究基于 legged_gym 的四足机器人控制。在啃代码和论文的过程中,Policy Gradient(策略梯度)是一个绕不开的核心概念。 面对一堆 \(\nabla\) 和 ...
还在痛苦前端的拖拽排序吗?SortableJS 轻松搞定
产品扔过来一个需求:这个列表需要实现拖拽排序,心里面慌不慌? 如果要手搓一个这个功能,那代码可就很感人了。 大概有这么些逻辑:鼠标按下 -> 开始拖动 -> 拖动中实时改变位置 -> 拖动结束判断是否允许释放 -> 不允许缩放怎么做 -> 允许缩放又怎么做。 要实现这一大堆逻辑,那画面很美~~ 别慌 ...
OpenCVSharp:HOG行人检测
概述 HOG行人检测是一种基于方向梯度直方图特征的计算机视觉目标检测技术,它通过计算图像局部区域的梯度方向直方图来描述目标的外观形状特征。该算法首先将图像分割为小的连通区域(细胞单元),计算每个单元内像素的梯度方向并生成直方图,然后将相邻的细胞单元组合成块并对块内的直方图进行归一化处理,最终形成能够 ...
Python环境管理利器Conda:从入门到避坑实战指南
本文深入解析了Python包管理工具Conda的核心功能、与pip和uv的对比、常用命令、常见问题解决方案以及离线部署方法。重点阐述了Conda在管理复杂数据科学环境方面的优势,如跨语言依赖处理和严格的环境隔离,并提供了解决环境冲突和提升安装速度的实用技巧,帮助开发者高效管理项目环境。 ...
MAF快速入门(7)工作流的状态共享
在实际业务场景中,一个AI工作流的多个步骤之间往往需要共享上下文数据,例如用户原始输入、模型的输出缓存等。在MAF中,提供了一个 WorkflowContext 的模型,它原生提供了工作流上下文的状态共享能力。 ...
深入理解Linux IPIP隧道:原理、配置与实战
引言 在Linux网络虚拟化领域,隧道技术是实现跨网络通信的关键技术之一。特别是在容器化和Kubernetes环境中,Flannel等网络插件的早期版本广泛使用IPIP隧道来实现Pod间的跨节点通信。本文将深入探讨IPIP隧道的工作原理、配置方法及其在容器网络中的应用。 1.什么是IPIP隧道? I ...
具身智能:零基础入门睿尔曼机械臂(四)—— 夹爪无响应?官方例程踩坑与排错实战
摘要: 本文针对睿尔曼机械臂夹爪控制例程中“指令成功但夹爪无动作”的问题,通过“软件复查→硬件测量→通信排查”三阶段定位故障根源:官方例程遗漏了末端端口电压初始化(默认0V导致夹爪无供电)和通信协议配置(指令无法识别)。解决方案包括:1)通过示教器或代码配置24V输出电压;2)在示教器设置匹配的波特... ...
Streamlit + LangChain 1.0 简单实现智能问答前后端
Streamlit 是一款专为数据科学家和机器学习工程师设计的 Python 库,可快速将数据脚本转换为交互式 Web 应用,无需前端开发经验,所以最近研究了一下,结合LangChain 1.0 实现了简单的智能问答前后端应用,大模型使用DeepSeek。 ...
20251217 - Yearn 攻击事件2:协议授人以柄错设地址,黑客自断一臂巧控价格
背景信息 20251217,Yearn 距离上次被攻击不到一个月,又被攻击了。这次被攻击的是自动化收益优化金库 yTUSD。攻击的原因是因为 yTUSD 协议错误配置了相关的衍生品代币地址,导致攻击者可以通过该代币操纵 share 价格,套取超额的 yTUSD 代币。 Exploit TX:http ...
[表单]HTML Learn Data Day 1
弄了几天服务器,注册了一个域名,现在个人网站终于可以访问了 很简陋,毕竟html才学到第1天,后续慢慢美化,欢迎访问:reisentyan.cn 黑马程序员的课就是好,不长不短,内容细致度还不错,关键是讲课的教师,口齿清晰逻辑顺畅,听了就学到了 今日学习内容 1. 基础排版与转义字符 转义字符:在 ...
Oracle等待事件:性能诊断与优化的核心指南
等待事件是Oracle数据库性能优化的关键抓手,自Oracle 7.0.12版本引入以来,已成为DBA定位瓶颈、优化系统的核心工具。它通过记录进程在数据库操作中的各类等待行为,直观反映系统资源竞争、I/O瓶颈等潜在问题,为针对性优化提供明确方向。 一、等待事件的核心概念与分类 1. 源起与发展 等待 ...
ROS2概念之DDS
我们在《ROS2概述和基于RK3588的环境搭建》中对ROS和ROS2做了对比,其中最多的变化就是DDS。我们在前面文章中介绍的话题、服务、动作,他们底层通信的具体实现过程,都是靠DDS来完成的,它相当于是ROS机器人系统中的神经网络。 一、通信模型 DDS的核心是通信,能够实现通信的模型和软件框架 ...
C++ 原子操作使用及源码剖析
原子操作是指不可被中断的单个或一组操作 在多线程环境下,原子操作的执行过程中不会被其他线程打断,要么完全执行完毕,要么完全不执行,不存在 “执行一半” 的中间状态。 它的核心价值是解决多线程对共享数据的竞态条件(Race Condition) 问题(比如两个线程同时读写同一个变量,导致数据错乱),是 ...
吴恩达深度学习课程四:计算机视觉 第二周:经典网络结构 (三)1×1卷积与Inception网络
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第四课的第二周内容,2.5到2. ...
Python - UV 为每个项目创建独立、干净的Python工作空间
Anaconda、miniconda 慎用, 有商业授权风险,可以选择 UV: https://docs.astral.sh/uv/ GitHub:https://github.com/astral-sh/uv 中文站:https://uv.doczh.com/ https://www.bilibi ...
Flink源码阅读:如何生成StreamGraph
Flink 中有四种执行图,分别是 StreamGraph、JobGraph、ExecutionGraph 和 Physical Graph。今天我们来看下我们编写的 Flink 程序代码是如何生成 StreamGraph 的。 ...
别再迷信“准确率”了!一文读懂 AI 图像分割的黄金标尺 —— Dice 系数
1. 引言:99% 的准确率,可能意味着模型是个“废物”? 想象这样一个痛点场景: 你正在训练一个 AI 模型,任务是从脑部核磁共振(MRI)扫描中找出极小的肿瘤区域。你熬夜跑完代码,发现模型在验证集上的 Accuracy(准确率)高达 99.9%! 你兴奋地开了香槟,但当你把预测结果打印出来一看, ...
生成式引擎优化(GEO优化)全维度技术指南
生成式引擎优化(GEO优化)全维度技术指南 一、引言 1.1 技术背景 生成式引擎优化(GEO优化)是生成式AI技术与传统搜索引擎优化(SEO)、推荐引擎优化深度融合的新兴技术方向。随着大语言模型(LLM)、生成式对抗网络(GAN)等技术的成熟,互联网内容生产、检索与分发模式发生根本性变革——传统基 ...
负载均衡的概念、分类、算法、健康检查机制及高可用解决方案
负载均衡的概念、分类、算法、健康检查机制及高可用解决方案 一、负载均衡的基本概念与作用 张张的网站因访问量激增(从几人到1万用户)导致服务器崩溃,通过负载均衡解决。 负载均衡像交通指挥中心,通过反向代理服务器提供唯一访问入口,统一接收用户请求后按规则分配给后端多台服务器,可提高网站并发量,还能实时监 ...


