24 Commits

Author SHA1 Message Date
yangdx
fde0aa32c7 pre-commit run --all-files 2025-01-17 14:28:24 +08:00
yangdx
a561879040 Translate comments to English 2025-01-17 14:27:27 +08:00
yangdx
fa9765ecd9 pre-commit run --all-files 2025-01-17 14:20:55 +08:00
yangdx
939e399dd4 Translate comment to English 2025-01-17 13:36:31 +08:00
yangdx
3138ae7599 添加对 mix 查询模式的支持 2025-01-17 11:04:36 +08:00
yangdx
847963d19a 修复 /query 和 /query/stream 端点处理stream模式是的错误 2025-01-17 03:35:03 +08:00
yangdx
34d6b85adb 修复清理查询前缀时未能正确清理空格的问题 2025-01-17 01:50:07 +08:00
yangdx
95ff048a9e 为Ollama API添加性能统计功能
- 新增token估算函数
- 记录流式响应时间
- 计算输入输出token数
- 统计响应生成时间
- 返回详细的性能指标
2025-01-16 19:42:34 +08:00
yangdx
ea22d62c25 移除调试日志打印代码 2025-01-15 23:11:15 +08:00
yangdx
9632a8f0dc 解决查询命中缓存时流式响应未遵循Ollma规范的问题
- rag返回结果未字符串时,响应分两次发送
- 第一次发送查询内容
- 第二次发送统计信息
2025-01-15 23:09:50 +08:00
yangdx
ca2caf47bc 修改流式响应的输出格式:从event-stream改为x-ndjson 2025-01-15 22:14:57 +08:00
yangdx
6d44178f63 修复测试用例流结束判断 2025-01-15 21:26:20 +08:00
yangdx
af9ac188f0 增强聊天接口的调试和性能统计功能
- 添加原始请求日志记录
- 修改响应结构以包含性能统计
- 更新测试用例以展示性能数据
- 优化响应格式为字典结构
- 增加请求体解码功能
2025-01-15 21:15:12 +08:00
yangdx
8ef1248c76 将OllamaChatRequest的stream参数默认值改为True 2025-01-15 20:54:22 +08:00
yangdx
f81b1cdf0a 为Ollama API返回结果添加图像字段和性能统计信息
- 在OllamaMessage中添加images字段
- 响应消息中增加images字段
- 完成标记中添加性能统计信息
- 更新测试用例以处理性能统计
- 移除测试用例中的/naive前缀
2025-01-15 20:46:45 +08:00
yangdx
23f838ec94 优化流式响应处理并添加测试用例
- 修复流式响应中的完成标记逻辑
- 添加非流式调用测试
- 添加流式调用测试
- 优化JSON序列化,支持非ASCII字符
- 确保生成器在完成标记后立即结束
2025-01-15 20:18:17 +08:00
yangdx
f15f97a51d 临时保存 2025-01-15 19:32:03 +08:00
yangdx
828af49d6b 能够正确调用rag,rag执行完成后,无法返回内容 2025-01-15 18:47:01 +08:00
yangdx
4e5517a602 修复rag调用参数不正确问题 2025-01-15 18:27:35 +08:00
yangdx
882da88603 解决模型名称返回错误问题 2025-01-15 18:19:39 +08:00
yangdx
fd50c3a240 修改流处理逻辑,修改 /api/tags错误 2025-01-15 17:43:00 +08:00
yangdx
c1f4f4a20e 优化ollama返回数据的格式 2025-01-15 15:06:28 +08:00
yangdx
be134878fe 完成ollma接口的代码编写 2025-01-15 14:31:49 +08:00
yangdx
b97d1ecd72 修改文件名 2025-01-15 13:35:20 +08:00