Fix: Gemini parameters error (#9520)

### What problem does this PR solve? Fix Gemini parameters error. ### Type of change - [x] Bug Fix (non-breaking change which fixes an issue) --------- Co-authored-by: Kevin Hu <kevinhu.sh@gmail.com>
2025-11-28 07:58:16 +00:00 · 2025-08-18 14:51:10 +08:00 · 2025-08-18 14:51:10 +08:00 · fe32952825
commit fe32952825
parent 5808aef28c
2 changed files with 13 additions and 38 deletions
--- a/conf/llm_factories.json
+++ b/conf/llm_factories.json
@ -1146,60 +1146,35 @@
                    "llm_name": "gemini-2.5-flash",
                    "tags": "LLM,CHAT,1024K,IMAGE2TEXT",
                    "max_tokens": 1048576,
-                    "model_type": "image2text",
+                    "model_type": "chat",
                    "is_tools": true
                },
                {
                    "llm_name": "gemini-2.5-pro",
                    "tags": "LLM,CHAT,IMAGE2TEXT,1024K",
                    "max_tokens": 1048576,
-                    "model_type": "image2text",
+                    "model_type": "chat",
                    "is_tools": true
                },
                {
-                    "llm_name": "gemini-2.5-flash-preview-05-20",
+                    "llm_name": "gemini-2.5-flash-lite",
                    "tags": "LLM,CHAT,1024K,IMAGE2TEXT",
                    "max_tokens": 1048576,
-                    "model_type": "image2text",
+                    "model_type": "chat",
                    "is_tools": true
                },
                {
-                    "llm_name": "gemini-2.0-flash-001",
-                    "tags": "LLM,CHAT,1024K",
-                    "max_tokens": 1048576,
-                    "model_type": "image2text",
-                    "is_tools": true
-                },
-                {
-                    "llm_name": "gemini-2.0-flash-thinking-exp-01-21",
+                    "llm_name": "gemini-2.0-flash",
                    "tags": "LLM,CHAT,1024K",
                    "max_tokens": 1048576,
                    "model_type": "chat",
                    "is_tools": true
                },
                {
-                    "llm_name": "gemini-1.5-flash",
-                    "tags": "LLM,IMAGE2TEXT,1024K",
+                    "llm_name": "gemini-2.0-flash-lite",
+                    "tags": "LLM,CHAT,1024K",
                    "max_tokens": 1048576,
-                    "model_type": "image2text"
-                },
-                {
-                    "llm_name": "gemini-2.5-pro-preview-05-06",
-                    "tags": "LLM,IMAGE2TEXT,1024K",
-                    "max_tokens": 1048576,
-                    "model_type": "image2text"
-                },
-                {
-                    "llm_name": "gemini-1.5-pro",
-                    "tags": "LLM,IMAGE2TEXT,2048K",
-                    "max_tokens": 2097152,
-                    "model_type": "image2text"
-                },
-                {
-                    "llm_name": "gemini-1.5-flash-8b",
-                    "tags": "LLM,IMAGE2TEXT,1024K",
-                    "max_tokens": 1048576,
-                    "model_type": "image2text",
+                    "model_type": "chat",
                    "is_tools": true
                },
                {
--- a/rag/llm/cv_model.py
+++ b/rag/llm/cv_model.py
@ -539,24 +539,24 @@ class GeminiCV(Base):
        return res.text, res.usage_metadata.total_token_count

    def chat(self, system, history, gen_conf, images=[]):
-        from transformers import GenerationConfig
+        generation_config = dict(temperature=gen_conf.get("temperature", 0.3), top_p=gen_conf.get("top_p", 0.7))
        try:
            response = self.model.generate_content(
                self._form_history(system, history, images),
-                generation_config=GenerationConfig(temperature=gen_conf.get("temperature", 0.3), top_p=gen_conf.get("top_p", 0.7)))
+                generation_config=generation_config)
            ans = response.text
            return ans, response.usage_metadata.total_token_count
        except Exception as e:
            return "**ERROR**: " + str(e), 0

    def chat_streamly(self, system, history, gen_conf, images=[]):
-        from transformers import GenerationConfig
        ans = ""
        response = None
        try:
+            generation_config = dict(temperature=gen_conf.get("temperature", 0.3), top_p=gen_conf.get("top_p", 0.7))
            response = self.model.generate_content(
                self._form_history(system, history, images),
-                generation_config=GenerationConfig(temperature=gen_conf.get("temperature", 0.3), top_p=gen_conf.get("top_p", 0.7)),
+                generation_config=generation_config,
                stream=True,
            )

@ -572,7 +572,7 @@ class GeminiCV(Base):
            yield response.usage_metadata.total_token_count
        else:
            yield 0
-            
+

 class NvidiaCV(Base):
    _FACTORY_NAME = "NVIDIA"