技术架构

TokenDNC 的技术路线以知识增强、图谱推理、智能体协作和模型适配为核心,兼顾准确性、可控性与长期演进。

智能体工程链路

从知识接入到模型输出,每一层都保留评估和审计接口,让方案可以持续调优。

业务系统与知识源文档、数据库、API
RAG架构分块、召回、重排
GraphRAG架构实体、关系、证据链
多智能体编排技术规划、执行、复核
大模型微调能力提示词工程、harness工程、评测闭环

RAG架构

将企业私有知识接入大模型上下文,通过检索增强、来源引用和重排策略降低幻觉。

GraphRAG架构

把实体、事件和关系组织成图谱,支持跨文档推理、证据追踪与复杂业务问答。

多智能体编排技术

将复杂任务拆分给规划、检索、审阅、执行等角色,让智能体协作过程更可控。

大模型微调能力

通过提示词工程、harness工程、样本构建与评测体系,让模型更贴近行业语境。

架构分层

TokenDNC 的工程架构以“知识可信、流程可控、输出可评测、系统可集成”为原则,确保智能体能够稳定进入客户现有业务环境。

01

数据接入层

连接文档库、数据库、表格、工单、Wiki 和第三方 API,统一处理格式转换、权限映射、增量同步和来源记录。

02

检索增强层

通过分块策略、Embedding、向量数据库、关键词召回、Rerank 和上下文压缩,让模型基于可信证据回答。

03

智能体编排层

将复杂任务拆分为规划、检索、推理、工具调用、复核和输出多个角色,提升流程稳定性与可解释性。

04

评测与治理

建设评测集、输出评分、异常样本池和版本记录,用数据判断每次提示词、模型或知识更新是否真正变好。

05

部署与集成

支持与 SSO、OA、CRM、LMS、合同系统、知识库和消息工具集成,并根据安全要求选择云端或私有化部署。

06

安全与权限

围绕数据隔离、访问控制、审计日志、敏感信息脱敏和人工复核建立边界,避免智能体越权输出。

工具与框架生态

TokenDNC 采用可插拔技术栈,不把客户锁死在单一框架上;我们会根据场景复杂度、部署环境和团队技术栈选择合适的智能体工程组件。

LangChain

用于快速组织模型调用、Prompt 模板、工具调用、Retriever 和 RAG 链路,适合把企业知识库、业务 API 与大模型能力连接起来。

  • 沉淀可复用的提示词模板、工具封装和检索链路。
  • 适合构建问答、摘要、信息抽取、文档分析等标准智能体能力。
  • 可与向量数据库、结构化数据库和内部服务 API 组合使用。
编排基础 RAG Chain Tool Call Prompt Template

LangGraph

用于构建有状态、多步骤、可回溯的智能体工作流,特别适合需要规划、分支、人工确认和多角色协作的复杂业务任务。

  • 把智能体任务拆成图节点,明确每一步的状态、输入和输出。
  • 支持循环、条件分支、检查点和人工介入,降低复杂流程失控风险。
  • 适合合同审阅、临床文书质控、企业知识流转等多阶段任务。
状态编排 Multi-Agent Checkpoint Human-in-loop

LlamaIndex 与 Haystack

用于数据连接、索引构建、检索策略实验和知识库治理,帮助不同格式的文档资料进入可检索、可引用的智能体上下文。

  • LlamaIndex 更适合快速接入多源文档、构建索引和组合查询策略。
  • Haystack 适合构建可控的检索流水线、Reader/Retriever 组合和企业级搜索能力。
  • 两者都可作为 RAG 与 GraphRAG 的知识接入和检索实验层。
知识索引 Connector Retriever Pipeline

Milvus、pgvector 与 Elastic

用于承载向量检索、混合检索和关键词搜索能力,让智能体在不同规模、不同权限边界的知识库中找到可靠证据。

  • Milvus 适合大规模向量检索和独立向量数据库部署。
  • pgvector 适合已经以 PostgreSQL 为核心的数据系统,降低引入新组件的成本。
  • Elastic 适合关键词、过滤条件和向量混合召回的企业搜索场景。
向量数据库 Hybrid Search Rerank Evidence

vLLM 与模型服务

用于提升私有化或专属模型部署时的推理吞吐、响应速度和成本控制能力,并为不同任务配置模型路由策略。

  • 对高并发问答、批量文档处理和后台评测任务提供更稳定的推理服务。
  • 结合模型路由,让简单任务使用轻量模型,复杂任务调用更强模型。
  • 可与日志、限流和缓存策略配合,提升生产环境可运营性。
推理服务 Model Router Batch Cost Control

Ragas、DeepEval 与观测工具

用于评估 RAG 命中率、答案忠实度、上下文相关性和任务成功率,把“感觉不错”的智能体变成可量化迭代的工程系统。

  • Ragas 适合对检索增强问答做答案相关性、上下文召回和忠实度评估。
  • DeepEval 适合围绕任务指标构建单元测试、回归测试和质量门禁。
  • 结合 OpenTelemetry 或 LangSmith 类观测工具追踪调用链路和异常样本。
质量评测 Regression Trace Guardrail

工程治理能力

AI 应用真正进入生产环境后,关键不只是“答得像”,而是每次回答都能被解释、被追踪、被复盘,并且能随着业务变化稳定迭代。

Prompt 与 Harness 工程

将提示词、工具调用、Few-shot 样例、输出结构和评测脚本纳入版本管理,让迭代过程可复现。

  • 为不同业务角色维护独立提示词模板和输出规范。
  • 用 Harness 统一跑批评测,比较不同模型和策略的真实表现。
  • 保留上线版本与实验版本,降低快速迭代带来的回归风险。

模型适配与微调

根据场景成本、响应速度、领域术语和合规要求,组合通用大模型、轻量模型、LoRA 微调和规则校验。

  • 对高价值、高重复任务构建领域样本,提升输出稳定性。
  • 在需要严格格式或专业语境的任务中引入微调与后处理。
  • 通过模型路由让简单问题走低成本链路,复杂任务走高能力链路。