Architecture | TokenDNC

技术架构

TokenDNC 的技术路线以知识增强、图谱推理、智能体协作和模型适配为核心，兼顾准确性、可控性与长期演进。

智能体工程链路

从知识接入到模型输出，每一层都保留评估和审计接口，让方案可以持续调优。

业务系统与知识源文档、数据库、API

RAG架构分块、召回、重排

GraphRAG架构实体、关系、证据链

多智能体编排技术规划、执行、复核

大模型微调能力提示词工程、harness工程、评测闭环

RAG架构

将企业私有知识接入大模型上下文，通过检索增强、来源引用和重排策略降低幻觉。

GraphRAG架构

把实体、事件和关系组织成图谱，支持跨文档推理、证据追踪与复杂业务问答。

多智能体编排技术

将复杂任务拆分给规划、检索、审阅、执行等角色，让智能体协作过程更可控。

大模型微调能力

通过提示词工程、harness工程、样本构建与评测体系，让模型更贴近行业语境。

架构分层

TokenDNC 的工程架构以“知识可信、流程可控、输出可评测、系统可集成”为原则，确保智能体能够稳定进入客户现有业务环境。

数据接入层

连接文档库、数据库、表格、工单、Wiki 和第三方 API，统一处理格式转换、权限映射、增量同步和来源记录。

检索增强层

通过分块策略、Embedding、向量数据库、关键词召回、Rerank 和上下文压缩，让模型基于可信证据回答。

智能体编排层

将复杂任务拆分为规划、检索、推理、工具调用、复核和输出多个角色，提升流程稳定性与可解释性。

评测与治理

建设评测集、输出评分、异常样本池和版本记录，用数据判断每次提示词、模型或知识更新是否真正变好。

部署与集成

支持与 SSO、OA、CRM、LMS、合同系统、知识库和消息工具集成，并根据安全要求选择云端或私有化部署。

安全与权限

围绕数据隔离、访问控制、审计日志、敏感信息脱敏和人工复核建立边界，避免智能体越权输出。

工具与框架生态

TokenDNC 采用可插拔技术栈，不把客户锁死在单一框架上；我们会根据场景复杂度、部署环境和团队技术栈选择合适的智能体工程组件。

LangChain

用于快速组织模型调用、Prompt 模板、工具调用、Retriever 和 RAG 链路，适合把企业知识库、业务 API 与大模型能力连接起来。

沉淀可复用的提示词模板、工具封装和检索链路。
适合构建问答、摘要、信息抽取、文档分析等标准智能体能力。
可与向量数据库、结构化数据库和内部服务 API 组合使用。

编排基础 RAG Chain Tool Call Prompt Template

LangGraph

用于构建有状态、多步骤、可回溯的智能体工作流，特别适合需要规划、分支、人工确认和多角色协作的复杂业务任务。

把智能体任务拆成图节点，明确每一步的状态、输入和输出。
支持循环、条件分支、检查点和人工介入，降低复杂流程失控风险。
适合合同审阅、临床文书质控、企业知识流转等多阶段任务。

状态编排 Multi-Agent Checkpoint Human-in-loop

LlamaIndex 与 Haystack

用于数据连接、索引构建、检索策略实验和知识库治理，帮助不同格式的文档资料进入可检索、可引用的智能体上下文。

LlamaIndex 更适合快速接入多源文档、构建索引和组合查询策略。
Haystack 适合构建可控的检索流水线、Reader/Retriever 组合和企业级搜索能力。
两者都可作为 RAG 与 GraphRAG 的知识接入和检索实验层。

知识索引 Connector Retriever Pipeline

Milvus、pgvector 与 Elastic

用于承载向量检索、混合检索和关键词搜索能力，让智能体在不同规模、不同权限边界的知识库中找到可靠证据。

Milvus 适合大规模向量检索和独立向量数据库部署。
pgvector 适合已经以 PostgreSQL 为核心的数据系统，降低引入新组件的成本。
Elastic 适合关键词、过滤条件和向量混合召回的企业搜索场景。

向量数据库 Hybrid Search Rerank Evidence

vLLM 与模型服务

用于提升私有化或专属模型部署时的推理吞吐、响应速度和成本控制能力，并为不同任务配置模型路由策略。

对高并发问答、批量文档处理和后台评测任务提供更稳定的推理服务。
结合模型路由，让简单任务使用轻量模型，复杂任务调用更强模型。
可与日志、限流和缓存策略配合，提升生产环境可运营性。

推理服务 Model Router Batch Cost Control

Ragas、DeepEval 与观测工具

用于评估 RAG 命中率、答案忠实度、上下文相关性和任务成功率，把“感觉不错”的智能体变成可量化迭代的工程系统。

Ragas 适合对检索增强问答做答案相关性、上下文召回和忠实度评估。
DeepEval 适合围绕任务指标构建单元测试、回归测试和质量门禁。
结合 OpenTelemetry 或 LangSmith 类观测工具追踪调用链路和异常样本。

质量评测 Regression Trace Guardrail

工程治理能力

AI 应用真正进入生产环境后，关键不只是“答得像”，而是每次回答都能被解释、被追踪、被复盘，并且能随着业务变化稳定迭代。

Prompt 与 Harness 工程

将提示词、工具调用、Few-shot 样例、输出结构和评测脚本纳入版本管理，让迭代过程可复现。

为不同业务角色维护独立提示词模板和输出规范。
用 Harness 统一跑批评测，比较不同模型和策略的真实表现。
保留上线版本与实验版本，降低快速迭代带来的回归风险。

模型适配与微调

根据场景成本、响应速度、领域术语和合规要求，组合通用大模型、轻量模型、LoRA 微调和规则校验。

对高价值、高重复任务构建领域样本，提升输出稳定性。
在需要严格格式或专业语境的任务中引入微调与后处理。
通过模型路由让简单问题走低成本链路，复杂任务走高能力链路。