858 Commits

Author SHA1 Message Date
david
f6eeedb050 add concurrent embedding limit 2024-12-10 09:01:21 +08:00
david
d0a4ef252e fix: rare embedding issue. 2024-12-10 09:00:22 +08:00
Ikko Eltociear Ashimine
b8cddb6c72
chore: update llm.py
intialize -> initialize
2024-12-09 22:08:06 +09:00
zrguo
e5cc43ad3c
Merge pull request #434 from magicyuan876/main
提取关键词的prompt优化
2024-12-09 20:55:27 +08:00
david
3210c8f5bd fix unicode_escape. 2024-12-09 19:14:27 +08:00
Magic_yuan
e7ac7daee8
Merge branch 'HKUDS:main' into main 2024-12-09 18:17:01 +08:00
Magic_yuan
9724b59e19 提取关键词时LLM输出的关键词跟随用户提问的语言,可以避免一些指定英文而偶发的一些LLM输出的JSON不规范导致JSON解析失败的问题 2024-12-09 18:15:09 +08:00
zrguo
725284e8ba
Update __version__ 2024-12-09 18:12:08 +08:00
zrguo
3e112c0d05
Merge pull request #432 from ChenZiHong-Gavin/main
fix(lightrag): use is_closed() instead of _closed
2024-12-09 18:08:43 +08:00
zrguo
4c89a1a620
Merge pull request #429 from davidleon/improvement/lazy_external_load
fix extra kwargs error: keyword_extraction.
2024-12-09 18:07:30 +08:00
zrguo
7b0f3ffcda
Merge branch 'main' into main 2024-12-09 17:55:56 +08:00
Larfii
2ba20910bb fix naive_query 2024-12-09 17:45:01 +08:00
zrguo
71af34196f
Merge branch 'main' into fix-entity-name-string 2024-12-09 17:30:40 +08:00
chenzihong
25d8430a60
Merge branch 'HKUDS:main' into main 2024-12-09 17:10:42 +08:00
chenzihong
9dd51f1f35 fix(lightrag): use is_closed() instead of _closed 2024-12-09 17:10:13 +08:00
Larfii
ffa95e0461 Fix jina embedding 2024-12-09 17:05:17 +08:00
david
9717ad87fc fix extra kwargs error: keyword_extraction.
add lazy_external_load to reduce external lib deps whenever it's not necessary for user.
2024-12-09 15:35:35 +08:00
Magic_yuan
865e76a083 修复bug
https://github.com/HKUDS/LightRAG/issues/306
主要修改包括:
在存储文本块数据时增加了验证,确保只存储有效的数据
在处理文本块之前增加了空列表检查
在截断文本块之前过滤掉无效的数据
增加了更多的日志警告信息
查询的修改:
添加了对 chunks 的有效性检查,过滤掉无效的 chunks:
2024-12-09 15:08:30 +08:00
partoneplay
a7fcb653e3 Merge remote-tracking branch 'origin/main' and fix syntax 2024-12-09 12:36:55 +08:00
zrguo
0a8d88212a
Merge pull request #423 from davidleon/feature/jina_embedding
add jina embedding
2024-12-09 10:18:50 +08:00
david
97d1894077 add jina embedding 2024-12-08 22:20:41 +08:00
Magic_yuan
779ed604d8 清理多余注释 2024-12-08 17:38:49 +08:00
Magic_yuan
39c2cb11f3 清理多余注释 2024-12-08 17:37:58 +08:00
Magic_yuan
ccf44dc334 feat(cache): 增加 LLM 相似性检查功能并优化缓存机制
- 在 embedding 缓存配置中添加 use_llm_check 参数
- 实现 LLM 相似性检查逻辑,作为缓存命中的二次验证- 优化 naive 模式的缓存处理流程
- 调整缓存数据结构,移除不必要的 model 字段
2024-12-08 17:35:52 +08:00
Magic_yuan
dc2a45004a 缓存计算函数迁移到工具类 2024-12-08 10:37:55 +08:00
partoneplay
a8e09ba6c5 Add support for OpenAI Compatible Streaming output 2024-12-07 14:53:15 +08:00
partoneplay
50a17bb4f9 delete unreachable code 2024-12-07 14:53:15 +08:00
Saujanya Verma
5a33ce1c1a Fix: Ensure entity_or_relation_name is a string in _handle_entity_relation_summary 2024-12-06 20:54:01 +05:30
magicyuan876
4da7dd1865 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:35:09 +08:00
yuanxiaobin
6a010abb62 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:35:09 +08:00
magicyuan876
efdd4b8b8e 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:23:18 +08:00
yuanxiaobin
a1c4a036fd 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:23:18 +08:00
magicyuan876
8d9fc01b4c 解决冲突 2024-12-06 15:09:50 +08:00
yuanxiaobin
633fb55b5b 解决冲突 2024-12-06 15:09:50 +08:00
magicyuan876
8924d2b8fc Merge remote-tracking branch 'origin/main'
# Conflicts:
#	lightrag/llm.py
#	lightrag/operate.py
2024-12-06 15:06:00 +08:00
yuanxiaobin
ad4b0d1ba9 Merge remote-tracking branch 'origin/main'
# Conflicts:
#	lightrag/llm.py
#	lightrag/operate.py
2024-12-06 15:06:00 +08:00
magicyuan876
786aa92b48 fix(utils): 修复 JSON 日志编码问题
- 在 json.dumps 中添加 ensure_ascii=False 参数,以支持非 ASCII 字符编码
-这个修改确保了包含中文等非 ASCII 字符的日志信息能够正确处理和显示
2024-12-06 14:32:41 +08:00
yuanxiaobin
558068f611 fix(utils): 修复 JSON 日志编码问题
- 在 json.dumps 中添加 ensure_ascii=False 参数,以支持非 ASCII 字符编码
-这个修改确保了包含中文等非 ASCII 字符的日志信息能够正确处理和显示
2024-12-06 14:32:41 +08:00
magicyuan876
e619b09c8a 重构缓存处理逻辑
- 提取通用缓存处理逻辑到新函数 handle_cache 和 save_to_cache
- 使用 CacheData 类统一缓存数据结构
- 优化嵌入式缓存和常规缓存的处理流程
- 添加模式参数以支持不同查询模式的缓存策略
- 重构 get_best_cached_response 函数,提高缓存查询效率
2024-12-06 14:29:16 +08:00
yuanxiaobin
584258078f 重构缓存处理逻辑
- 提取通用缓存处理逻辑到新函数 handle_cache 和 save_to_cache
- 使用 CacheData 类统一缓存数据结构
- 优化嵌入式缓存和常规缓存的处理流程
- 添加模式参数以支持不同查询模式的缓存策略
- 重构 get_best_cached_response 函数,提高缓存查询效率
2024-12-06 14:29:16 +08:00
zrguo
f2a208c343 Merge branch 'main' into main 2024-12-06 11:38:27 +08:00
zrguo
ad991f904d
Merge branch 'main' into main 2024-12-06 11:38:27 +08:00
Suroy
979f30d20b Update oracle_impl.py
Fixed typing error in python3.9
2024-12-06 11:06:20 +08:00
Suroy
0614a93608
Update oracle_impl.py
Fixed typing error in python3.9
2024-12-06 11:06:20 +08:00
magicyuan876
5dfb74ef2d 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:40:48 +08:00
yuanxiaobin
7c4bbe2474 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:40:48 +08:00
magicyuan876
6c29a37f20 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:28:35 +08:00
yuanxiaobin
8a69604966 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:28:35 +08:00
magicyuan876
6540d11096 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:21:53 +08:00
yuanxiaobin
f2a1897b61 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:21:53 +08:00