feat: SentenceTransformersDocumentEmbedder supports config_kwargs (#8433)

* initial import * adding release notes
2026-01-05 19:47:45 +00:00 · 2024-10-14 17:43:04 +02:00 · 2024-10-14 17:43:04 +02:00 · b81abc0c85
commit b81abc0c85
parent 5867fa1f34
5 changed files with 23 additions and 7 deletions
--- a/haystack/components/embedders/backends/sentence_transformers_backend.py
+++ b/haystack/components/embedders/backends/sentence_transformers_backend.py
@ -29,6 +29,7 @@ class _SentenceTransformersEmbeddingBackendFactory:
        truncate_dim: Optional[int] = None,
        model_kwargs: Optional[Dict[str, Any]] = None,
        tokenizer_kwargs: Optional[Dict[str, Any]] = None,
+        config_kwargs: Optional[Dict[str, Any]] = None,
    ):
        embedding_backend_id = f"{model}{device}{auth_token}{truncate_dim}"

@ -42,6 +43,7 @@ class _SentenceTransformersEmbeddingBackendFactory:
            truncate_dim=truncate_dim,
            model_kwargs=model_kwargs,
            tokenizer_kwargs=tokenizer_kwargs,
+            config_kwargs=config_kwargs,
        )
        _SentenceTransformersEmbeddingBackendFactory._instances[embedding_backend_id] = embedding_backend
        return embedding_backend
@ -61,6 +63,7 @@ class _SentenceTransformersEmbeddingBackend:
        truncate_dim: Optional[int] = None,
        model_kwargs: Optional[Dict[str, Any]] = None,
        tokenizer_kwargs: Optional[Dict[str, Any]] = None,
+        config_kwargs: Optional[Dict[str, Any]] = None,
    ):
        sentence_transformers_import.check()
        self.model = SentenceTransformer(
@ -71,6 +74,7 @@ class _SentenceTransformersEmbeddingBackend:
            truncate_dim=truncate_dim,
            model_kwargs=model_kwargs,
            tokenizer_kwargs=tokenizer_kwargs,
+            config_kwargs=config_kwargs,
        )

    def embed(self, data: List[str], **kwargs) -> List[List[float]]:
--- a/haystack/components/embedders/sentence_transformers_document_embedder.py
+++ b/haystack/components/embedders/sentence_transformers_document_embedder.py
@ -54,6 +54,7 @@ class SentenceTransformersDocumentEmbedder:
        truncate_dim: Optional[int] = None,
        model_kwargs: Optional[Dict[str, Any]] = None,
        tokenizer_kwargs: Optional[Dict[str, Any]] = None,
+        config_kwargs: Optional[Dict[str, Any]] = None,
        precision: Literal["float32", "int8", "uint8", "binary", "ubinary"] = "float32",
    ):
        """
@ -96,10 +97,12 @@ class SentenceTransformersDocumentEmbedder:
        :param tokenizer_kwargs:
            Additional keyword arguments for `AutoTokenizer.from_pretrained` when loading the tokenizer.
            Refer to specific model documentation for available kwargs.
+        :param config_kwargs:
+            Additional keyword arguments for `AutoConfig.from_pretrained` when loading the model configuration.
        :param precision:
            The precision to use for the embeddings.
            All non-float32 precisions are quantized embeddings.
-            Quantized embeddings are smaller in size and faster to compute, but may have a lower accuracy.
+            Quantized embeddings are smaller and faster to compute, but may have a lower accuracy.
            They are useful for reducing the size of the embeddings of a corpus for semantic search, among other tasks.
        """

@ -117,6 +120,7 @@ class SentenceTransformersDocumentEmbedder:
        self.truncate_dim = truncate_dim
        self.model_kwargs = model_kwargs
        self.tokenizer_kwargs = tokenizer_kwargs
+        self.config_kwargs = config_kwargs
        self.embedding_backend = None
        self.precision = precision

@ -149,6 +153,7 @@ class SentenceTransformersDocumentEmbedder:
            truncate_dim=self.truncate_dim,
            model_kwargs=self.model_kwargs,
            tokenizer_kwargs=self.tokenizer_kwargs,
+            config_kwargs=self.config_kwargs,
            precision=self.precision,
        )
        if serialization_dict["init_parameters"].get("model_kwargs") is not None:
@ -186,6 +191,7 @@ class SentenceTransformersDocumentEmbedder:
                truncate_dim=self.truncate_dim,
                model_kwargs=self.model_kwargs,
                tokenizer_kwargs=self.tokenizer_kwargs,
+                config_kwargs=self.config_kwargs,
            )
            if self.tokenizer_kwargs and self.tokenizer_kwargs.get("model_max_length"):
                self.embedding_backend.model.max_seq_length = self.tokenizer_kwargs["model_max_length"]
--- a/releasenotes/notes/sentence-transformer-doc-embedder-config_kwargs-d7d254c6b94887c4.yaml
+++ b/releasenotes/notes/sentence-transformer-doc-embedder-config_kwargs-d7d254c6b94887c4.yaml
@ -0,0 +1,4 @@
+---
+enhancements:
+  - |
+    SentenceTransformersDocumentEmbedder now supports config_kwargs for additional parameters when loading the model configuration
--- a/test/components/embedders/test_sentence_transformers_document_embedder.py
+++ b/test/components/embedders/test_sentence_transformers_document_embedder.py
@ -79,6 +79,7 @@ class TestSentenceTransformersDocumentEmbedder:
                "truncate_dim": None,
                "model_kwargs": None,
                "tokenizer_kwargs": None,
+                "config_kwargs": None,
                "precision": "float32",
            },
        }
@ -99,6 +100,7 @@ class TestSentenceTransformersDocumentEmbedder:
            truncate_dim=256,
            model_kwargs={"torch_dtype": torch.float32},
            tokenizer_kwargs={"model_max_length": 512},
+            config_kwargs={"use_memory_efficient_attention": True},
            precision="int8",
        )
        data = component.to_dict()
@ -120,6 +122,7 @@ class TestSentenceTransformersDocumentEmbedder:
                "truncate_dim": 256,
                "model_kwargs": {"torch_dtype": "torch.float32"},
                "tokenizer_kwargs": {"model_max_length": 512},
+                "config_kwargs": {"use_memory_efficient_attention": True},
                "precision": "int8",
            },
        }
@ -140,6 +143,7 @@ class TestSentenceTransformersDocumentEmbedder:
            "truncate_dim": 256,
            "model_kwargs": {"torch_dtype": "torch.float32"},
            "tokenizer_kwargs": {"model_max_length": 512},
+            "config_kwargs": {"use_memory_efficient_attention": True},
            "precision": "int8",
        }
        component = SentenceTransformersDocumentEmbedder.from_dict(
@ -162,6 +166,7 @@ class TestSentenceTransformersDocumentEmbedder:
        assert component.truncate_dim == 256
        assert component.model_kwargs == {"torch_dtype": torch.float32}
        assert component.tokenizer_kwargs == {"model_max_length": 512}
+        assert component.config_kwargs == {"use_memory_efficient_attention": True}
        assert component.precision == "int8"

    def test_from_dict_no_default_parameters(self):
@ -230,6 +235,7 @@ class TestSentenceTransformersDocumentEmbedder:
            token=None,
            device=ComponentDevice.from_str("cpu"),
            tokenizer_kwargs={"model_max_length": 512},
+            config_kwargs={"use_memory_efficient_attention": True},
        )
        mocked_factory.get_embedding_backend.assert_not_called()
        embedder.warm_up()
@ -242,6 +248,7 @@ class TestSentenceTransformersDocumentEmbedder:
            truncate_dim=None,
            model_kwargs=None,
            tokenizer_kwargs={"model_max_length": 512},
+            config_kwargs={"use_memory_efficient_attention": True},
        )

    @patch(
@ -291,11 +298,8 @@ class TestSentenceTransformersDocumentEmbedder:
            model="model", meta_fields_to_embed=["meta_field"], embedding_separator="\n"
        )
        embedder.embedding_backend = MagicMock()
-
        documents = [Document(content=f"document number {i}", meta={"meta_field": f"meta_value {i}"}) for i in range(5)]
-
        embedder.run(documents=documents)
-
        embedder.embedding_backend.embed.assert_called_once_with(
            [
                "meta_value 0\ndocument number 0",
@ -319,11 +323,8 @@ class TestSentenceTransformersDocumentEmbedder:
            embedding_separator="\n",
        )
        embedder.embedding_backend = MagicMock()
-
        documents = [Document(content=f"document number {i}", meta={"meta_field": f"meta_value {i}"}) for i in range(5)]
-
        embedder.run(documents=documents)
-
        embedder.embedding_backend.embed.assert_called_once_with(
            [
                "my_prefix meta_value 0\ndocument number 0 my_suffix",
--- a/test/components/embedders/test_sentence_transformers_embedding_backend.py
+++ b/test/components/embedders/test_sentence_transformers_embedding_backend.py
@ -42,6 +42,7 @@ def test_model_initialization(mock_sentence_transformer):
        truncate_dim=256,
        model_kwargs=None,
        tokenizer_kwargs=None,
+        config_kwargs=None,
    )