Skip to content

关于我

你好!我是郭通,一名热爱技术的 AI 应用开发者。目前是桂林电子科技大学人工智能专业硕士研究生,专注于大模型应用、Agent 系统和多模态技术的研发与实践。

📋 基本信息

  • 性别:男
  • 年龄:25岁
  • 学历:硕士在读
  • 研究方向:人工智能、大模型应用、多模态 Agent

📞 联系方式

🎓 教育背景

桂林电子科技大学 | 人工智能 | 硕士 | GPA: 3.5 | 2023.09 - 2026.06

重庆科技大学 | 计算机科学与技术 | 本科 | GPA: 3.2 | 2019.09 - 2023.06

💼 实习经历

流连电商 | AI Agent 应用开发实习生 | 厦门 | 2026.01 - 2026.03

参与公司 AI Agent 应用与模型服务基础设施建设,主导开发多模态发票审核 Agent,推动 AI 能力与业务系统集成。

🏆 校园经历

  • 英语能力:通过 CET4
  • 奖学金:大学期间获得多项奖学金
  • 竞赛获奖
    • 🥉 中国大学生计算机设计大赛全国三等奖(国家级)
    • 🏆 省级大学生创新训练计划项目(负责人)
    • 🥉 中国高校计算机大赛团体程序设计天梯赛省级三等奖
    • 🥈 第十二届蓝桥杯省级二等奖
    • 🥉 第十三届蓝桥杯省级三等奖

💻 项目经历

企业级多模态发票审核智能 Agent 系统

技术栈:OpenClaw、飞书、Qwen3-VL、LangGraph、Prompt Engineering、Lora、FastAPI

项目描述:面向企业采购场景中发票审核依赖人工、商品信息易错配与异常沟通成本高的问题,构建多模态发票审核智能体,实现发票内容自动识别、结构化校验以及供应商侧异常问题的全流程自动化对话协商与审核闭环处理。

核心工作

  • 模型选型及微调:对比实验多家多模态模型,最终选定 Qwen3-1.7B + Qwen3-VL-4B
  • 意图路由决策:基于 LLM 的意图分类 + 关键词兜底机制
  • 多模态识别:Qwen3-VL 发票识别 + 规则引擎混合审核架构
  • LangGraph 工作流:多阶段多状态流转,支持人工介入与异常恢复
  • 缓存优化与容灾:意图识别缓存 + 降级机制保障系统可用性

AI 会议助手(基于 LangGraph 的多模态 Agent)

技术栈:LangGraph、MCP、LLM、Prompt Engineering、RAG、PostgreSQL、Nginx

项目描述:面向企业会议纪要内容冗长、格式不统一与行动项易遗漏的问题,构建多模态会议纪要智能体,实现会议内容自动结构化与可执行输出。

核心工作

  • 输入解析与路由决策:LLM 意图识别 + 规则兜底避免误触发
  • 多工具协同执行:基于 MCP 封装文档抽取、语音转文字等能力
  • 上下文构建:结合语义与 token 计数的 Chunk 策略 + RAG 机制
  • 会议类型驱动生成:差异化 Prompt 策略 + 结构化校验
  • 状态与记忆管理:PostgreSQL 持久化 + LangGraph Checkpoint

🛠️ 技术栈

AI & 大模型

  • LLM 应用开发:Qwen、GLM、DeepSeek
  • Agent 框架:LangGraph、LangChain
  • 微调技术:Lora、Prompt Engineering
  • 多模态:Qwen3-VL、OCR

后端开发

  • Python、FastAPI
  • Java、Spring Boot、MyBatis
  • RESTful API 设计与开发

数据库 & 存储

  • PostgreSQL、MySQL
  • Redis
  • 向量数据库(RAG)

运维工具

  • Linux、Nginx、Docker
  • Git 版本控制
  • MCP (Model Context Protocol)

前端开发

  • Vue.js
  • HTML5/CSS3/JavaScript (ES6+)

💡 个人优势

  • AI 实战经验:丰富的 LLM 应用和 Agent 系统开发经验
  • 全栈能力:从前端到后端到 AI 模型的完整技术栈
  • 工程化思维:注重系统可用性、容灾降级和性能优化
  • 持续学习:紧跟 AI 技术前沿,快速掌握新技术并应用于实践

🌟 专注 AI 应用开发,用智能技术创造价值

用心记录,持续成长