[LIVE] [HaoCheng-Wang/llm-proxy2] 3 endpoint(s)
ChatGPT
API Proxy/ChatGPT
2,205 characters
Status: [LIVE]
Endpoints found:
https://api.openai.com/v1/chat/completions
https://api.openai.com/v1/chat
https://api.openai.com/v1/chat/completions`
Source: https://github.com/HaoCheng-Wang/llm-proxy2
# LLM Proxy — 智能体与大模型 API 通信拦截记录系统
截获和记录智能体与大模型 API 之间 HTTP 通信的代理系统。支持流式/非流式请求、SSE 重组为完整 JSON、JSON 树形查看、实时刷新、多用户隔离。
## 目录
- [核心设计](#核心设计)
- [完整数据流](#完整数据流)
- [数据模型](#数据模型)
- [安全设计](#安全设计)
- [高并发设计](#高并发设计)
- [SSE 流式处理](#sse-流式处理)
- [大数据量导出:端到端流式架构](#大数据量导出端到端流式架构)
- [各层关键设计](#各层关键设计)
- [一次性 Ticket 鉴权](#一次性-ticket-鉴权)
- [两条导出路径](#两条导出路径)
- [format=simple 模式](#formatsimple-模式)
- [每行处理性能](#每行处理性能零解析-vs-jsonloadsdumps)
- [Nginx 流式 gzip 压缩](#nginx-流式-gzip-压缩)
- [LONGTEXT 列按需选取](#longtext-列按需选取)
- [复合索引与 COUNT 加速](#复合索引与-count-加速)
- [生成器异常恢复](#生成器异常恢复)
- [导出进度日志](#导出进度日志)
- [ORDER BY 为什么不会拖慢速度](#order-by-为什么不会拖慢速度)
- [编译 SQL 日志](#编译-sql-日志)
- [实测效果](#实测效果)
- [各优化项贡献](#各优化项贡献)
- [瓶颈分析](#瓶颈分析)
- [部署方式](#部署方式)
- [API 接口](#api-接口)
- [环境变量](#环境变量)
## 核心设计
### 共享代理(Shared Proxy)
整个系统只监听一个 TCP 端口(默认 3998),通过 URL 路径中的代理编号区分不同用户:
```mermaid
flowchart LR
A[智能体 Agent] -->|"POST /12345/v1/chat/completions"| B[LLM Proxy :3998]
B -->|"查缓存/DB → target_url"| C[目标 LLM API]
C -->|"响应"| B
B -->|"记录"| D[(MySQL)]
B -->|"透传"| A
```
| 特性 | 实现 |
|------|------|
| 编号 | 5 位随机数,系统分配,永不冲突 |
| 服务器 | 单进程 FastAPI + asynci