<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:media="http://search.yahoo.com/mrss/" version="2.0"><channel><title>qingyao的博客</title><link>https://yaoblog.site/</link><atom:link href="https://yaoblog.site/rss.xml" rel="self" type="application/rss+xml"/><description>qingyao的博客</description><generator>Halo v2.24.1</generator><language>zh-cn</language><image><url>https://yaoblog.site/upload/logo.avif</url><title>qingyao的博客</title><link>https://yaoblog.site/</link></image><lastBuildDate>Sat, 20 Jun 2026 21:09:32 GMT</lastBuildDate><item><title><![CDATA[Qwen3.6-27B 模型效果实测]]></title><link>https://yaoblog.site/archives/qwen3.6-27bmo-xing-xiao-guo</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=Qwen3.6-27B%20%E6%A8%A1%E5%9E%8B%E6%95%88%E6%9E%9C%E5%AE%9E%E6%B5%8B&amp;url=/archives/qwen3.6-27bmo-xing-xiao-guo" width="1" height="1" alt="" style="opacity:0;">模型部署 模型下载 用魔塔命令下载模型文件，Qwen/Qwen3.6-27B modelscope download --model Qwen/Qwen3.6-27B --local_dir /data/Qwen3.6-27B docker-compose.y]]></description><guid isPermaLink="false">/archives/qwen3.6-27bmo-xing-xiao-guo</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Mon, 1 Jun 2026 03:59:51 GMT</pubDate></item><item><title><![CDATA[模型的调优]]></title><link>https://yaoblog.site/archives/mo-xing-de-diao-you</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%B0%83%E4%BC%98&amp;url=/archives/mo-xing-de-diao-you" width="1" height="1" alt="" style="opacity:0;">目前的生产场景中，模型调优分为两种，第一种就是公网模型的调优，第二种就是机器学习的模型调优，按照目前的情况来看，我做公网模型的调优的场景会多一点，第二种在生产场景中几乎没有遇到； 公网模型调优： 往往在用 MaxKB 智能体平台中，客户在使用一些公网模型老是发现回答出现幻觉（答非所问、胡编乱造）的场]]></description><guid isPermaLink="false">/archives/mo-xing-de-diao-you</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Fri, 29 May 2026 03:05:10 GMT</pubDate></item><item><title><![CDATA[OpenClaw 批量解析带有人工字迹的 PDF 文件]]></title><link>https://yaoblog.site/archives/openclawpi-liang-jie-xi-dai-you-ren-gong-zi-ji-de-pdfwen-jian-nei-rong-cun-chu-dao-zhi-ding-wen-jian-jia-zhong</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=OpenClaw%20%E6%89%B9%E9%87%8F%E8%A7%A3%E6%9E%90%E5%B8%A6%E6%9C%89%E4%BA%BA%E5%B7%A5%E5%AD%97%E8%BF%B9%E7%9A%84%20PDF%20%E6%96%87%E4%BB%B6&amp;url=/archives/openclawpi-liang-jie-xi-dai-you-ren-gong-zi-ji-de-pdfwen-jian-nei-rong-cun-chu-dao-zhi-ding-wen-jian-jia-zhong" width="1" height="1" alt="" style="opacity:0;">目前 OpenClaw 使用的模型大都为 LLM 大语言模型，无法解析一些 png、ppt 类型的文档，需要用外部的工具或者使用其他的 Skill 去解析 PDF 解决方案： 使用minerU 的skill 地址：https://github.com/Nebutra/MinerU-Skill tok]]></description><guid isPermaLink="false">/archives/openclawpi-liang-jie-xi-dai-you-ren-gong-zi-ji-de-pdfwen-jian-nei-rong-cun-chu-dao-zhi-ding-wen-jian-jia-zhong</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Wed, 27 May 2026 08:23:41 GMT</pubDate></item><item><title><![CDATA[混元 HY-MT2 翻译模型]]></title><link>https://yaoblog.site/archives/hun-yuan-hy-mt2fan-yi-mo-xing</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E6%B7%B7%E5%85%83%20HY-MT2%20%E7%BF%BB%E8%AF%91%E6%A8%A1%E5%9E%8B&amp;url=/archives/hun-yuan-hy-mt2fan-yi-mo-xing" width="1" height="1" alt="" style="opacity:0;">5月22号，腾子发布并开源了一款专注于支持 33 种语言之间互译的翻译模型。其中，HY-MT2-7B 是在 WMT25 夺冠模型HY-MT-7B 基础上的升级版本，针对解释性翻译和混合语言场景进行了优化，新增了术语干预、上下文翻译和格式化翻译功能。Hy-MT2 在通用翻译、实际业务、专业领域及指令对]]></description><guid isPermaLink="false">/archives/hun-yuan-hy-mt2fan-yi-mo-xing</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Wed, 27 May 2026 02:08:03 GMT</pubDate></item><item><title><![CDATA[探讨一下不同行业对于模型的选型]]></title><link>https://yaoblog.site/archives/tan-tao-yi-xia-bu-tong-xing-ye-dui-yu-mo-xing-de-xuan-xing</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E6%8E%A2%E8%AE%A8%E4%B8%80%E4%B8%8B%E4%B8%8D%E5%90%8C%E8%A1%8C%E4%B8%9A%E5%AF%B9%E4%BA%8E%E6%A8%A1%E5%9E%8B%E7%9A%84%E9%80%89%E5%9E%8B&amp;url=/archives/tan-tao-yi-xia-bu-tong-xing-ye-dui-yu-mo-xing-de-xuan-xing" width="1" height="1" alt="" style="opacity:0;">本章是用来总结一下，AI 迅速发展的这两年，我负责过的项目客户，他们在自己行业中选择的模型和我对这些模型在使用方面的一下看法吧。 教育行业 国内大学中约50个客户左右：（一个客户可能使用的模型系列是多种的） 使用Qwen系列的占65%，使用ChatGPT的有42%，使用方舟的有18%，使用kimi的]]></description><guid isPermaLink="false">/archives/tan-tao-yi-xia-bu-tong-xing-ye-dui-yu-mo-xing-de-xuan-xing</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Tue, 12 May 2026 07:39:39 GMT</pubDate></item><item><title><![CDATA[MaxKB 对接本地私有大模型对接报错]]></title><link>https://yaoblog.site/archives/maxkb-dui-jie-ben-di-si-you-da-mo-xing-dui-jie-bao-cuo</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=MaxKB%20%E5%AF%B9%E6%8E%A5%E6%9C%AC%E5%9C%B0%E7%A7%81%E6%9C%89%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%AF%B9%E6%8E%A5%E6%8A%A5%E9%94%99&amp;url=/archives/maxkb-dui-jie-ben-di-si-you-da-mo-xing-dui-jie-bao-cuo" width="1" height="1" alt="" style="opacity:0;">背景： 客户在内网部署了本地大模型，model_base_url为域名为https://xxxxxx.com/v1，在部署MaxKB的服务器和容器中都能curl 通，但是在MaxKB 的前端页面确对接失败，一直显示 connection error 解决方法： 客户用的是自签名证书，即使在系统层cu]]></description><guid isPermaLink="false">/archives/maxkb-dui-jie-ben-di-si-you-da-mo-xing-dui-jie-bao-cuo</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Mon, 11 May 2026 03:43:53 GMT</pubDate></item><item><title><![CDATA[根目录磁盘空间不足迁移docker目录]]></title><link>https://yaoblog.site/archives/gen-mu-lu-ci-pan-kong-jian-bu-zu-qian-yi-dockermu-lu</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E6%A0%B9%E7%9B%AE%E5%BD%95%E7%A3%81%E7%9B%98%E7%A9%BA%E9%97%B4%E4%B8%8D%E8%B6%B3%E8%BF%81%E7%A7%BBdocker%E7%9B%AE%E5%BD%95&amp;url=/archives/gen-mu-lu-ci-pan-kong-jian-bu-zu-qian-yi-dockermu-lu" width="1" height="1" alt="" style="opacity:0;">1.准备工作 查询 Docker 默认安装路径 docker info | grep "Docker Root Dir" 开始迁移之前，复制原 Docker 安装（存储）目录到新的路径,这里示例使用的是opt目录 cp -a /var/lib/docker /opt/ 备份原目录（不要直接删除） m]]></description><guid isPermaLink="false">/archives/gen-mu-lu-ci-pan-kong-jian-bu-zu-qian-yi-dockermu-lu</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Mon, 11 May 2026 03:37:10 GMT</pubDate></item><item><title><![CDATA[MaxKB 处理图片类型PDF进行知识库入库]]></title><link>https://yaoblog.site/archives/cehsi</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=MaxKB%20%E5%A4%84%E7%90%86%E5%9B%BE%E7%89%87%E7%B1%BB%E5%9E%8BPDF%E8%BF%9B%E8%A1%8C%E7%9F%A5%E8%AF%86%E5%BA%93%E5%85%A5%E5%BA%93&amp;url=/archives/cehsi" width="1" height="1" alt="" style="opacity:0;">背景 有些工厂，他们的企业知识文档不是常规的文本格式文档，而且类似图片+表格的形式进行展示的，如下： 这种有表格有图片的pdf，如果直接上传到MaxKB 中识别成文字内容是错乱的，一个大的分段内容会被截取，具体如下：]]></description><guid isPermaLink="false">/archives/cehsi</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><category>场景</category><pubDate>Sat, 2 May 2026 14:08:46 GMT</pubDate></item><item><title><![CDATA[function calling 的机制原理]]></title><link>https://yaoblog.site/archives/function-calling-de-ji-zhi-yuan-li</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=function%20calling%20%E7%9A%84%E6%9C%BA%E5%88%B6%E5%8E%9F%E7%90%86&amp;url=/archives/function-calling-de-ji-zhi-yuan-li" width="1" height="1" alt="" style="opacity:0;">什么是 function calling function calling 是open ai 创建的能让大模型调用外部工具的一套规则，我们按照这套规则去编写代码，那么我们就能让大语言模型调用我们定义的一些外部工具。 场景： 原来的大语言模型只能指导我们但无法做出实际的行动。有了function ca]]></description><guid isPermaLink="false">/archives/function-calling-de-ji-zhi-yuan-li</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Sat, 2 May 2026 12:32:15 GMT</pubDate></item><item><title><![CDATA[在规定时间发送邮箱]]></title><link>https://yaoblog.site/archives/zai-gui-ding-shi-jian-fa-song-you-xiang</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E5%9C%A8%E8%A7%84%E5%AE%9A%E6%97%B6%E9%97%B4%E5%8F%91%E9%80%81%E9%82%AE%E7%AE%B1&amp;url=/archives/zai-gui-ding-shi-jian-fa-song-you-xiang" width="1" height="1" alt="" style="opacity:0;">背景 某高校为释放办公室老师日常大量重复性工作的时间精力以及提高办公室老师日常的办公效率，考虑到学校数据安全性的问题，考虑购入一台openclaw一体机，为办公室10个左右教师团队每人配置一只小龙虾。刘老师和林老师均无IT背景也不懂技术，但刘老师对AI产品非常关注并且深有研究。 场景 校园中需要给学]]></description><guid isPermaLink="false">/archives/zai-gui-ding-shi-jian-fa-song-you-xiang</guid><dc:creator>Administrator</dc:creator><category>场景</category><pubDate>Thu, 30 Apr 2026 08:39:39 GMT</pubDate></item><item><title><![CDATA[场景四]]></title><link>https://yaoblog.site/archives/chang-jing-si</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E5%9C%BA%E6%99%AF%E5%9B%9B&amp;url=/archives/chang-jing-si" width="1" height="1" alt="" style="opacity:0;">数字化管理与业务闭环自动化方案 场景一：高层管理——从“人找数据”到“数据找人” 【核心背景】]]></description><guid isPermaLink="false">/archives/chang-jing-si</guid><dc:creator>Administrator</dc:creator><category>场景</category><pubDate>Thu, 30 Apr 2026 07:58:53 GMT</pubDate></item><item><title><![CDATA[maxkb 调用本地 minerU 实现敏感文件本地入库]]></title><link>https://yaoblog.site/archives/maxkb-diao-yong-ben-di-mineru-shi-xian-min-gan-wen-jian-ben-di-ru-ku</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=maxkb%20%E8%B0%83%E7%94%A8%E6%9C%AC%E5%9C%B0%20minerU%20%E5%AE%9E%E7%8E%B0%E6%95%8F%E6%84%9F%E6%96%87%E4%BB%B6%E6%9C%AC%E5%9C%B0%E5%85%A5%E5%BA%93&amp;url=/archives/maxkb-diao-yong-ben-di-mineru-shi-xian-min-gan-wen-jian-ben-di-ru-ku" width="1" height="1" alt="" style="opacity:0;">背景 公司的机密文件需要进行PDF解析成可读性的markdown 格式并进行入库，用于后续搭建智能体做专用知识库。 本地部署 minerU minerU 是目前开源的解析工具中比较出色的产品，用云端的模型测试过，效果符合预期结果，不论是数学的复杂公式还是复杂文本现在都能实现解析。 本地部署 mine]]></description><guid isPermaLink="false">/archives/maxkb-diao-yong-ben-di-mineru-shi-xian-min-gan-wen-jian-ben-di-ru-ku</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Thu, 30 Apr 2026 03:54:53 GMT</pubDate></item><item><title><![CDATA[监控竞品的公众号]]></title><link>https://yaoblog.site/archives/jian-kong-jing-pin-de-gong-zhong-hao</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E7%9B%91%E6%8E%A7%E7%AB%9E%E5%93%81%E7%9A%84%E5%85%AC%E4%BC%97%E5%8F%B7&amp;url=/archives/jian-kong-jing-pin-de-gong-zhong-hao" width="1" height="1" alt="" style="opacity:0;">极致了数据网，这个可以通过他们的api 去获取微信公众号的文章信息，不过需要收费； https://www.dajiala.com/main/interface?actnav=0 请求示例 curl --location --request POST 'https://www.dajiala.com]]></description><guid isPermaLink="false">/archives/jian-kong-jing-pin-de-gong-zhong-hao</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Thu, 30 Apr 2026 02:57:02 GMT</pubDate></item><item><title><![CDATA[通过SMB协议连接共享盘实现openclaw 读写文件]]></title><link>https://yaoblog.site/archives/tong-guo-smbxie-yi-lian-jie-gong-xiang-pan-shi-xian-openclaw-du-xie-wen-jian</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E9%80%9A%E8%BF%87SMB%E5%8D%8F%E8%AE%AE%E8%BF%9E%E6%8E%A5%E5%85%B1%E4%BA%AB%E7%9B%98%E5%AE%9E%E7%8E%B0openclaw%20%E8%AF%BB%E5%86%99%E6%96%87%E4%BB%B6&amp;url=/archives/tong-guo-smbxie-yi-lian-jie-gong-xiang-pan-shi-xian-openclaw-du-xie-wen-jian" width="1" height="1" alt="" style="opacity:0;">背景 资料存放在共享盘中，想要对共享盘的资料进行读写操作。 例如：有个 excel 表格，表格中记录这线索名称和最近一次的沟通内容，需要结合沟通内容给出结论，该客户是否有购买意向，是否能发展为客户； 验证可行性 通过 1Panel 部署 OpenCLaw 需要修改容器权限，修改docker-comp]]></description><guid isPermaLink="false">/archives/tong-guo-smbxie-yi-lian-jie-gong-xiang-pan-shi-xian-openclaw-du-xie-wen-jian</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Thu, 30 Apr 2026 02:16:38 GMT</pubDate></item><item><title><![CDATA[MaxKB 的 RAG 检索机制]]></title><link>https://yaoblog.site/archives/maxkb-de-rag-jian-suo-ji-zhi</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=MaxKB%20%E7%9A%84%20RAG%20%E6%A3%80%E7%B4%A2%E6%9C%BA%E5%88%B6&amp;url=/archives/maxkb-de-rag-jian-suo-ji-zhi" width="1" height="1" alt="" style="opacity:0;">chunks 概念 Chunks 指的是把原始文档拆分成的一段段小文本片段（段落、句子、固定 token 段等），每个 chunk 作为一个向量的基础单元，用于向量化和检索。 必要性 向量模型输入长度有限（如最多 512 或 8192 tokens） 太长的文本嵌入效果反而下降（信息稀释） RAG]]></description><guid isPermaLink="false">/archives/maxkb-de-rag-jian-suo-ji-zhi</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Wed, 29 Apr 2026 08:54:39 GMT</pubDate></item><item><title><![CDATA[MaxKB 使用全量检索为空的问题]]></title><link>https://yaoblog.site/archives/maxkb-shi-yong-quan-liang-jian-suo-wei-kong-de-wen-ti</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=MaxKB%20%E4%BD%BF%E7%94%A8%E5%85%A8%E9%87%8F%E6%A3%80%E7%B4%A2%E4%B8%BA%E7%A9%BA%E7%9A%84%E9%97%AE%E9%A2%98&amp;url=/archives/maxkb-shi-yong-quan-liang-jian-suo-wei-kong-de-wen-ti" width="1" height="1" alt="" style="opacity:0;">现象 客户使用向量检索是有分段返回的，但是使用全量检索发现检索为空，但是知识库中是存在这个问题的相关分段的。]]></description><guid isPermaLink="false">/archives/maxkb-shi-yong-quan-liang-jian-suo-wei-kong-de-wen-ti</guid><dc:creator>Administrator</dc:creator><category>工作问题</category><pubDate>Wed, 29 Apr 2026 06:54:32 GMT</pubDate></item><item><title><![CDATA[业务场景三]]></title><link>https://yaoblog.site/archives/ye-wu-chang-jing-san</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E4%B8%9A%E5%8A%A1%E5%9C%BA%E6%99%AF%E4%B8%89&amp;url=/archives/ye-wu-chang-jing-san" width="1" height="1" alt="" style="opacity:0;">1. 核心诉求 管理层希望通过企业微信作为统一入口，利用自然语言（如“查询上季度销售回款情况”）实时调取财务数据。核心目标是打破财务报表的时空限制，实现决策数据化、即时化。 2. 业务约束 极高安全性（数据不出域）：财务数据属于企业核心机密，严格禁止流向云端大模型。 私有化基础设施：利用 1Pane]]></description><guid isPermaLink="false">/archives/ye-wu-chang-jing-san</guid><dc:creator>Administrator</dc:creator><category>场景</category><pubDate>Wed, 29 Apr 2026 02:35:03 GMT</pubDate></item><item><title><![CDATA[业务场景二]]></title><link>https://yaoblog.site/archives/ye-wu-chang-jing-er</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E4%B8%9A%E5%8A%A1%E5%9C%BA%E6%99%AF%E4%BA%8C&amp;url=/archives/ye-wu-chang-jing-er" width="1" height="1" alt="" style="opacity:0;">1. 核心痛点：人工分拣软硬件需求 目前每个新项目都会产生一份软硬件交织的混合需求文档。 现状：人工逐条阅读需求文档、判断软硬件需求并分拣到不同的表格中。 代价：这是一种高耗能、低产出的重复劳动，占据了资深工程师大量本应投入在技术方案设计、开发上的时间。]]></description><guid isPermaLink="false">/archives/ye-wu-chang-jing-er</guid><dc:creator>Administrator</dc:creator><category>场景</category><pubDate>Wed, 29 Apr 2026 02:26:44 GMT</pubDate></item><item><title><![CDATA[gpustack 部署本地视觉模型]]></title><link>https://yaoblog.site/archives/gpustack-bu-shu-ben-di-shi-jue-mo-xing</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=gpustack%20%E9%83%A8%E7%BD%B2%E6%9C%AC%E5%9C%B0%E8%A7%86%E8%A7%89%E6%A8%A1%E5%9E%8B&amp;url=/archives/gpustack-bu-shu-ben-di-shi-jue-mo-xing" width="1" height="1" alt="" style="opacity:0;">下载谷歌仓库的llama.cpp镜像（yusiwen/llama.cpp的镜像它的启动命令有点不一样目前还没试出来） docker pull ghcr.io/ggml-org/llama.cpp:server-cuda12-b7666 在gpustack 中导入下面yaml 说明： -m ：表示模型]]></description><guid isPermaLink="false">/archives/gpustack-bu-shu-ben-di-shi-jue-mo-xing</guid><dc:creator>Administrator</dc:creator><category>AI</category><pubDate>Wed, 29 Apr 2026 02:06:03 GMT</pubDate></item><item><title><![CDATA[业务场景一]]></title><link>https://yaoblog.site/archives/zhen-shi-ye-wu-chang-jing-yi</link><description><![CDATA[<img src="https://yaoblog.site/plugins/feed/assets/telemetry.gif?title=%E4%B8%9A%E5%8A%A1%E5%9C%BA%E6%99%AF%E4%B8%80&amp;url=/archives/zhen-shi-ye-wu-chang-jing-yi" width="1" height="1" alt="" style="opacity:0;">水务场景 一、 核心业务目标 确保小区高楼层用户用水稳定，防止因水压不足导致的投诉。 时效要求：从发现水压异常到处理需在 30分钟 内响应，否则将触发业主投诉。 当前模式：24小时人工轮值盯盘，人工识别异常并通知实施人员。]]></description><guid isPermaLink="false">/archives/zhen-shi-ye-wu-chang-jing-yi</guid><dc:creator>Administrator</dc:creator><category>场景</category><pubDate>Tue, 28 Apr 2026 09:51:40 GMT</pubDate></item></channel></rss>