大模型RAG实战,从被骂不靠谱到成为部门MVP,这是我的踩坑全记录

博主头像 一切的起点是一顿臭骂 上个月,我被领导叫进办公室骂了整整二十分钟。 起因是这样的——我们部门负责维护一套内部知识库系统,里面沉淀了公司近五年的技术文档、故障处理手册、还有各种规范流程。问题是,这玩意儿除了当摆设,几乎没人用。为啥?因为搜索太烂了,关键词匹配的那种,你搜服务器宕机怎么办,它给你返回一堆 ...

为什么 AI 服务器首选 Ubuntu?难道 OEL 和 RHEL 不香吗?

博主头像 在 AI 圈子里,如果你去租一台 GPU 算力服务器,或者看大模型的部署教程,你会发现一个有趣的现象:Ubuntu 几乎是默认选项。 很多习惯了企业级系统(如 RHEL、CentOS 或 OEL)的朋友可能会纳闷:既然 NVIDIA 驱动也支持红帽系系统,为什么大家偏偏对 Ubuntu 这种“社区感 ...

OData 协议的智能化语义互操作

博主头像 在当今复杂多变的企业数字化转型进程中,数据协议的标准化与互操作性已成为支撑业务敏捷性与决策智能的核心基石。开放数据协议(Open Data Protocol,简称 OData)作为一种基于 REST 架构风格的开放协议,自 2007 年由微软公司(Microsoft)发起以来,经历了从私有规范到全球 ...

SEAL全同态加密CKKS方案入门详解

博主头像 本文以微软的开源全同态库SEAL中CKKS方案为参照,依次介绍了CKKS方案相关的核心原理,以及方案实施标准流程,最后给出了一个一个简单的SEAL库CKKS方案示例程序,并给出相应的运行结果。 ...

Avalonia.Controls.DataGrid自动合并列

Winform在用的DataGridView修改为通过线条和透明的方式实现了合并列的效果。一段时间也在留意Avalonia.Controls.DataGrid是否也有类似的做法。一直没有心思去看那些代码,水平有限,实在搞不懂XML/Content一类如何实现绘制内容的。借着AI的帮助终于能试着去修改 ...

记录一次bug:不可见字符/零宽字符

博主头像 1. 现象 在处理 CSV 文件导入时,你可能遇到过这种“灵异事件”: CSV 文件第一列叫 tag_id。 程序用 encoding/csv 读进 Map 后,尝试用 mp["tag_id"] 取值。 结果: 永远返回空值,但打印整个 Map 时,肉眼看 Key 确实是 tag_id。 而这其实是 ...

KMP模式匹配算法——详细讲解、清晰易懂

博主头像 KMP算法是由D.E. Knuth、J.H. Morris和V.R. Pratt(其中Knuth和Pratt共同研究, Mor-ris独立研究)发表一个模式匹配算法,KMP算法的最大特点使得它在处理大量文本匹配的问题时,比暴力枚举算法有更好的性能。 关于字符串匹配,是字符串很重要的知识点,也是面试笔... ...

Oracle ADG环境VIP高可用部署实操

博主头像 在Oracle ADG高可用架构中,配置虚拟IP(VIP)是核心优化手段之一,其核心目的是实现ADG主备切换后,业务应用无需修改数据源IP,大幅降低业务中断时长,这一设计思路同样适用于其他数据库的HA架构。本次实操围绕Oracle ADG主备节点完成VIP自动切换脚本部署,同时解决了脚本运行中su操 ...

解剖 Python:关于指针、GIL 与异步内核

博主头像 本文以 C++ 系统视角,解构 Python 的底层原理。深度剖析 `PyObject` 内存布局、GIL 的原子性幻觉及 `asyncio` 的 epoll 本质。通过 C++ 扩展打破边界,揭示“胶水语言”如何通过牺牲单核计算,换取极致的调度效率与生态垄断。 ...

spring-事务管理

博主头像 事务支持 什么是事务? 在一个业务流程中,需要多条DML(insert、delete、update)语句联合才能完成。这些语句必须同时成功或者同时失败。这样才能保证数据安全。 多条DML同时成功或者同时失败,叫做事务。 事务处理的四个过程 开启事务 执行业务代码 提交事务(没出现异常,提交成功。co ...

基于DWS的向量计算功能实现简单的商品搜索推荐系统

博主头像 本文分享自华为云社区《基于DWS的向量计算功能实现简单的商品搜索推荐系统》 1. 前言 适用版本:【9.1.1.200(及以上)】 在生成式 AI 与大模型(LLM)重塑技术栈的今天,数据处理的需求已经从单一的“精确匹配”转向了“语义理解”。传统的数据库系统在处理结构化数据(如订单金额、用户ID)方 ...

用 LangChain 驱动本地 Ollama 模型

博主头像 这两年,大模型几乎成了开发者的“标配工具”: 写代码、查资料、做总结、当智能助手。 但你有没有认真想过一个问题: 我们真的必须把所有请求都发到云端 API 吗? 随着模型体积持续下降、硬件性能快速提升,以及 Ollama 这类工具逐渐成熟, 本地运行大模型,已经从早期的“极客尝鲜”,演进为一种可以在 ...

追更 HelloGitHub 一整年,终于等到了这篇年度盘点

博主头像 转眼一年又过去了,春节将至 HelloGitHub 也迎来了一年一度的年度盘点时刻。 接下来,就让我们一起来看看,都有哪些开源项目入选了《2025 年 HelloGitHub 年度热门开源项目》。需要说明的是,入选并不是按照 Star 增长或“出圈”程度作为唯一标准,而是更看重来自 HelloGit ...

从零学习Kafka:数据存储

博主头像 不知道有没有朋友和我一样,虽然了解 Kafka 的逻辑存储,例如 Broker、Topic、Partition 这些概念,但是对于底层数据是如何存储还是比较模糊。这样聊起来 Kafka 数据存储时总有种一知半解的感觉。今天我们就一起来看一下 Kafka 底层数据到底是怎么存储的。 ...

123···100>