Skip to content
View 854875058's full-sized avatar

Block or report 854875058

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
854875058/README.md

张浩楠

AI 数据基础设施 / 多模态数据平台 / Agent 工程化

公众号:Agent Infra 架构手记

CSDN:我不介意孤独

我主要使用 Python 构建 AI 数据处理、检索增强、智能体编排和工程自动化相关系统。

目前的实践重点是:把多模态数据、向量检索、文档解析、OCR、知识图谱、任务调度和大模型能力组合起来,沉淀成可复用的平台、工具链和工程原型。


关于我

我关注 AI 应用真正落地时背后的基础设施问题:数据怎么接入、清洗、索引、检索、治理,Agent 怎么调用工具、编排任务、管理上下文,系统怎么稳定运行并持续迭代。

相比单点 Demo,我更倾向于做端到端系统:从数据处理管道、模型服务接入、向量检索、任务调度,到前后端联调和可视化原型,尽量把想法做成能跑、能复用、能解释的工程实现。

关注方向

  • AI Data Infra:数据接入、清洗、转换、索引、治理与任务编排
  • Multimodal Pipeline:文本、图片、音频、视频、文档等多模态数据处理
  • RAG & Search:文档解析、向量检索、混合检索、知识图谱与可追溯问答
  • Agent Engineering:Function Calling、工具注册、任务执行、上下文管理与多 Agent 协作
  • Python Backend:FastAPI / Flask 服务、Redis、Ray、异步任务和自动化工具

AI Infra Projects

项目 方向 简介
Multimodal Data Lake 多模态数据平台 多模态数据湖统一管理平台,覆盖数据接入、向量检索、ETL、治理和 AI Copilot 等能力。
元枢本体 Ontology 数据治理 / 本体智能 面向企业数据治理的本体智能平台,关注语义建模、规则驱动分析和 Agent 编排。
Tower-Eye 多模态问答 / 巡检 基站智能巡检与多模态问答系统,结合 NL2SQL、向量检索、YOLO 自动标注和巡检数据分析。
Symbio Multi-Agent 多 Agent 协同框架实验,探索 DAG 编排、工具调用、记忆机制和可观测性。
PaddleOCR-NPU OCR / 推理服务 面向昇腾 NPU 的 OCR 推理服务,关注多卡调度、批量推理和生产部署。
OpenDataLab S3 Sync 数据集工具 OpenDataLab 到对象存储的数据集同步工具,支持渐进式下载上传和多存储后端。

常用技术

Python FastAPI Flask Redis PyTorch OpenCV PostgreSQL Linux Git

Python / FastAPI / Flask / Redis / Ray / PyTorch / transformers
OpenCV / PyMuPDF / LanceDB / DuckDB / PostgreSQL / Linux / Git

这里主要记录数据处理、AI 应用、Agent 工程化和自动化工具相关的项目与实践。

Pinned Loading

  1. Symbio Symbio Public

    🧬 Symbio(共生)- AI Infra 级多 Agent 协同框架 | 33 Killer Features: 动态 DAG, 本体化记忆, 防过早完成, 数据飞轮, 神经符号安全, OpenTelemetry 可观测, HITL 人类介入, MCP 原生支持, 语义缓存, PromptOps, 边缘计算, 隐私计算 | Next-Gen AI Infrastructure for M…

    Python 294

  2. ontology-driven-platform ontology-driven-platform Public

    元枢 Ontology — Enterprise ontology intelligence platform. Three-layer architecture (Semantic/Power/Dynamic) for data governance, rule-driven analytics, AI agent orchestration, and scenario-based ope…

    Vue 4 1

  3. multimodal-data-lake multimodal-data-lake Public

    🌊 多模态数据湖统一管理平台 | Enterprise multimodal data lake — BGE/CLIP/Whisper unified vector space, 10+ format ETL pipeline, cross-modal semantic search, knowledge graph extraction via DeepSeek LLM, React + …

    Python 3 2

  4. PaddleOCR-NPU PaddleOCR-NPU Public

    面向华为昇腾 NPU 的企业级 PaddleOCR 推理服务,支持多卡多实例动态扩缩容、高召回 OCR 与生产级部署。

    Python 2

  5. boncflow boncflow Public

    🚀 下一代可视化 RAG 工作流引擎 | Production-grade RAG platform — 12+ document parsers, 22 agent components, 20+ LLM integrations, GraphRAG, MCP protocol, visual drag-and-drop workflow canvas, grounded citation…

    TypeScript 1

  6. Tower-Eye Tower-Eye Public

    🗼 基站智能巡检与多模态问答系统 | Telecom tower intelligent inspection — LangGraph NL2SQL agent with self-correction, multimodal vector search (Qwen3-VL/CLIP), YOLO auto-labeling, DuckDB + LanceDB dual-engine, Ni…

    Python 1