graphiti/core/graphiti.py

import asyncio
import logging
import os
from datetime import datetime
from time import time
from typing import Callable

from dotenv import load_dotenv
from neo4j import AsyncGraphDatabase

from core.edges import EntityEdge, EpisodicEdge
from core.llm_client import LLMClient, LLMConfig, OpenAIClient
from core.nodes import EntityNode, EpisodicNode
from core.search.search import SearchConfig, hybrid_search
from core.search.search_utils import (
	get_relevant_edges,
	get_relevant_nodes,
)
from core.utils import (
	build_episodic_edges,
	retrieve_episodes,
)
from core.utils.bulk_utils import (
	BulkEpisode,
	dedupe_edges_bulk,
	dedupe_nodes_bulk,
	extract_nodes_and_edges_bulk,
	resolve_edge_pointers,
	retrieve_previous_episodes_bulk,
)
from core.utils.maintenance.edge_operations import dedupe_extracted_edges, extract_edges
from core.utils.maintenance.graph_data_operations import (
	EPISODE_WINDOW_LEN,
	build_indices_and_constraints,
)
from core.utils.maintenance.node_operations import dedupe_extracted_nodes, extract_nodes
from core.utils.maintenance.temporal_operations import (
	invalidate_edges,
	prepare_edges_for_invalidation,
)

logger = logging.getLogger(__name__)

load_dotenv()


class Graphiti:
	def __init__(self, uri: str, user: str, password: str, llm_client: LLMClient | None = None):
		self.driver = AsyncGraphDatabase.driver(uri, auth=(user, password))
		self.database = 'neo4j'
		if llm_client:
			self.llm_client = llm_client
		else:
			self.llm_client = OpenAIClient(
				LLMConfig(
					api_key=os.getenv('OPENAI_API_KEY'),
					model='gpt-4o-mini',
					base_url='https://api.openai.com/v1',
				)
			)

	def close(self):
		self.driver.close()

	async def build_indices_and_constraints(self):
		await build_indices_and_constraints(self.driver)

	async def retrieve_episodes(
		self,
		reference_time: datetime,
		last_n: int = EPISODE_WINDOW_LEN,
		sources: list[str] | None = 'messages',
	) -> list[EpisodicNode]:
		"""Retrieve the last n episodic nodes from the graph"""
		return await retrieve_episodes(self.driver, reference_time, last_n, sources)

	# Invalidate edges that are no longer valid
	async def invalidate_edges(
		self,
		episode: EpisodicNode,
		new_nodes: list[EntityNode],
		new_edges: list[EntityEdge],
		relevant_schema: dict[str, any],
		previous_episodes: list[EpisodicNode],
	): ...

	async def add_episode(
		self,
		name: str,
		episode_body: str,
		source_description: str,
		reference_time: datetime | None = None,
		episode_type: str | None = 'string',  # TODO: this field isn't used yet?
		success_callback: Callable | None = None,
		error_callback: Callable | None = None,
	):
		"""Process an episode and update the graph"""
		try:
			start = time()

			nodes: list[EntityNode] = []
			entity_edges: list[EntityEdge] = []
			episodic_edges: list[EpisodicEdge] = []
			embedder = self.llm_client.client.embeddings
			now = datetime.now()

			previous_episodes = await self.retrieve_episodes(reference_time)
			episode = EpisodicNode(
				name=name,
				labels=[],
				source='messages',
				content=episode_body,
				source_description=source_description,
				created_at=now,
				valid_at=reference_time,
			)

			extracted_nodes = await extract_nodes(self.llm_client, episode, previous_episodes)

			# Calculate Embeddings

			await asyncio.gather(
				*[node.generate_name_embedding(embedder) for node in extracted_nodes]
			)
			existing_nodes = await get_relevant_nodes(extracted_nodes, self.driver)
			logger.info(f'Extracted nodes: {[(n.name, n.uuid) for n in extracted_nodes]}')
			new_nodes, _ = await dedupe_extracted_nodes(
				self.llm_client, extracted_nodes, existing_nodes
			)
			logger.info(f'Deduped touched nodes: {[(n.name, n.uuid) for n in new_nodes]}')
			nodes.extend(new_nodes)

			extracted_edges = await extract_edges(
				self.llm_client, episode, new_nodes, previous_episodes
			)

			await asyncio.gather(*[edge.generate_embedding(embedder) for edge in extracted_edges])

			existing_edges = await get_relevant_edges(extracted_edges, self.driver)
			logger.info(f'Existing edges: {[(e.name, e.uuid) for e in existing_edges]}')
			logger.info(f'Extracted edges: {[(e.name, e.uuid) for e in extracted_edges]}')

			deduped_edges = await dedupe_extracted_edges(
				self.llm_client, extracted_edges, existing_edges
			)

			(
				old_edges_with_nodes_pending_invalidation,
				new_edges_with_nodes,
			) = prepare_edges_for_invalidation(
				existing_edges=existing_edges, new_edges=deduped_edges, nodes=nodes
			)

			invalidated_edges = await invalidate_edges(
				self.llm_client,
				old_edges_with_nodes_pending_invalidation,
				new_edges_with_nodes,
			)

			entity_edges.extend(invalidated_edges)

			logger.info(f'Invalidated edges: {[(e.name, e.uuid) for e in invalidated_edges]}')

			logger.info(f'Deduped edges: {[(e.name, e.uuid) for e in deduped_edges]}')
			entity_edges.extend(deduped_edges)

			new_edges = await dedupe_extracted_edges(
				self.llm_client, extracted_edges, existing_edges
			)

			logger.info(f'Deduped edges: {[(e.name, e.uuid) for e in new_edges]}')

			entity_edges.extend(new_edges)
			episodic_edges.extend(
				build_episodic_edges(
					# There may be an overlap between new_nodes and affected_nodes, so we're deduplicating them
					nodes,
					episode,
					now,
				)
			)
			# Important to append the episode to the nodes at the end so that self referencing episodic edges are not built
			logger.info(f'Built episodic edges: {episodic_edges}')

			# invalidated_edges = await self.invalidate_edges(
			#     episode, new_nodes, new_edges, relevant_schema, previous_episodes
			# )

			# edges.extend(invalidated_edges)

			# Future optimization would be using batch operations to save nodes and edges
			await episode.save(self.driver)
			await asyncio.gather(*[node.save(self.driver) for node in nodes])
			await asyncio.gather(*[edge.save(self.driver) for edge in episodic_edges])
			await asyncio.gather(*[edge.save(self.driver) for edge in entity_edges])

			end = time()
			logger.info(f'Completed add_episode in {(end-start) * 1000} ms')
			# for node in nodes:
			#     if isinstance(node, EntityNode):
			#         await node.update_summary(self.driver)
			if success_callback:
				await success_callback(episode)
		except Exception as e:
			if error_callback:
				await error_callback(episode, e)
			else:
				raise e

	async def add_episode_bulk(
		self,
		bulk_episodes: list[BulkEpisode],
	):
		try:
			start = time()
			embedder = self.llm_client.client.embeddings
			now = datetime.now()

			episodes = [
				EpisodicNode(
					name=episode.name,
					labels=[],
					source='messages',
					content=episode.content,
					source_description=episode.source_description,
					created_at=now,
					valid_at=episode.reference_time,
				)
				for episode in bulk_episodes
			]

			# Save all the episodes
			await asyncio.gather(*[episode.save(self.driver) for episode in episodes])

			# Get previous episode context for each episode
			episode_pairs = await retrieve_previous_episodes_bulk(self.driver, episodes)

			# Extract all nodes and edges
			(
				extracted_nodes,
				extracted_edges,
				episodic_edges,
			) = await extract_nodes_and_edges_bulk(self.llm_client, episode_pairs)

			# Generate embeddings
			await asyncio.gather(
				*[node.generate_name_embedding(embedder) for node in extracted_nodes],
				*[edge.generate_embedding(embedder) for edge in extracted_edges],
			)

			# Dedupe extracted nodes
			nodes, uuid_map = await dedupe_nodes_bulk(self.driver, self.llm_client, extracted_nodes)

			# save nodes to KG
			await asyncio.gather(*[node.save(self.driver) for node in nodes])

			# re-map edge pointers so that they don't point to discard dupe nodes
			extracted_edges: list[EntityEdge] = resolve_edge_pointers(extracted_edges, uuid_map)
			episodic_edges: list[EpisodicEdge] = resolve_edge_pointers(episodic_edges, uuid_map)

			# save episodic edges to KG
			await asyncio.gather(*[edge.save(self.driver) for edge in episodic_edges])

			# Dedupe extracted edges
			edges = await dedupe_edges_bulk(self.driver, self.llm_client, extracted_edges)
			logger.info(f'extracted edge length: {len(edges)}')

			# invalidate edges

			# save edges to KG
			await asyncio.gather(*[edge.save(self.driver) for edge in edges])

			end = time()
			logger.info(f'Completed add_episode_bulk in {(end-start) * 1000} ms')

		except Exception as e:
			raise e

	async def search(self, query: str, num_results=10):
		search_config = SearchConfig(num_episodes=0, num_results=num_results)
		edges = (
			await hybrid_search(
				self.driver,
				self.llm_client.client.embeddings,
				query,
				datetime.now(),
				search_config,
			)
		)['edges']

		facts = [edge.fact for edge in edges]

		return facts

	async def _search(self, query: str, timestamp: datetime, config: SearchConfig):
		return await hybrid_search(
			self.driver, self.llm_client.client.embeddings, query, timestamp, config
		)
add nodes and edges 2024-08-13 14:35:43 -04:00			`import asyncio`
			`import logging`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`import os`
			`from datetime import datetime`
			`from time import time`
search updates (#14) * search updates * test updates * add opinionated search * update 2024-08-22 14:26:26 -04:00			`from typing import Callable`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00
Refactor maintenance structure, add prompt library (#4) * chore: Initial draft of stubs * chore: Add comments and mock implementation of the add_episode method * chore: Add success and error callbacks * chore: Add success and error callbacks * refactor: Fix conflicts with the latest merge 2024-08-15 12:03:41 -04:00			`from dotenv import load_dotenv`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`from neo4j import AsyncGraphDatabase`
Update Maintenance LLM Queries and Partial Schema Retrieval (#6) * search updates * add search_utils * updates * graph maintenance updates * revert extract_new_nodes * revert extract_new_edges * parallelize node searching * add edge fulltext search * search optimizations 2024-08-18 13:22:31 -04:00
search updates (#14) * search updates * test updates * add opinionated search * update 2024-08-22 14:26:26 -04:00			`from core.edges import EntityEdge, EpisodicEdge`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`from core.llm_client import LLMClient, LLMConfig, OpenAIClient`
			`from core.nodes import EntityNode, EpisodicNode`
search updates (#14) * search updates * test updates * add opinionated search * update 2024-08-22 14:26:26 -04:00			`from core.search.search import SearchConfig, hybrid_search`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`from core.search.search_utils import (`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`get_relevant_edges,`
			`get_relevant_nodes,`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`)`
Refactor maintenance structure, add prompt library (#4) * chore: Initial draft of stubs * chore: Add comments and mock implementation of the add_episode method * chore: Add success and error callbacks * chore: Add success and error callbacks * refactor: Fix conflicts with the latest merge 2024-08-15 12:03:41 -04:00			`from core.utils import (`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`build_episodic_edges,`
			`retrieve_episodes,`
Refactor maintenance structure, add prompt library (#4) * chore: Initial draft of stubs * chore: Add comments and mock implementation of the add_episode method * chore: Add success and error callbacks * chore: Add success and error callbacks * refactor: Fix conflicts with the latest merge 2024-08-15 12:03:41 -04:00			`)`
Create Bulk Add Episode for faster processing (#9) * benchmark logging * load schema updates * add extract bulk nodes and edges * updated bulk calls * compression updates * bulk updates * bulk logic first pass * updated bulk process * debug * remove exact names first * cleaned up prompt * fix bad merge * update * fix merge issues 2024-08-21 12:03:32 -04:00			`from core.utils.bulk_utils import (`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`BulkEpisode,`
			`dedupe_edges_bulk,`
			`dedupe_nodes_bulk,`
			`extract_nodes_and_edges_bulk,`
			`resolve_edge_pointers,`
			`retrieve_previous_episodes_bulk,`
feat: Initial version of temporal invalidation + tests (#8) * feat: Initial version of temporal invalidation + tests * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: time of day issue * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * revert: Tests structural changes * chore: Remove idea file * chore: Get rid of NodesWithEdges class and define a triplet type instead 2024-08-20 16:29:19 -04:00			`)`
format and linting (#18) * Makefile and format * fix podcast stuff * refactor: update import statement for transcript_parser in podcast_runner.py * format and linting * chore: Update import statements and remove unused code in maintenance module 2024-08-22 12:26:13 -07:00			`from core.utils.maintenance.edge_operations import dedupe_extracted_edges, extract_edges`
search updates (#14) * search updates * test updates * add opinionated search * update 2024-08-22 14:26:26 -04:00			`from core.utils.maintenance.graph_data_operations import (`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`EPISODE_WINDOW_LEN,`
			`build_indices_and_constraints,`
search updates (#14) * search updates * test updates * add opinionated search * update 2024-08-22 14:26:26 -04:00			`)`
Update Maintenance LLM Queries and Partial Schema Retrieval (#6) * search updates * add search_utils * updates * graph maintenance updates * revert extract_new_nodes * revert extract_new_edges * parallelize node searching * add edge fulltext search * search optimizations 2024-08-18 13:22:31 -04:00			`from core.utils.maintenance.node_operations import dedupe_extracted_nodes, extract_nodes`
feat: Initial version of temporal invalidation + tests (#8) * feat: Initial version of temporal invalidation + tests * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: time of day issue * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * revert: Tests structural changes * chore: Remove idea file * chore: Get rid of NodesWithEdges class and define a triplet type instead 2024-08-20 16:29:19 -04:00			`from core.utils.maintenance.temporal_operations import (`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`invalidate_edges,`
			`prepare_edges_for_invalidation,`
feat: Initial version of temporal invalidation + tests (#8) * feat: Initial version of temporal invalidation + tests * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: dont run int tests on CI * fix: time of day issue * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * fix: running non int tests in ci * revert: Tests structural changes * chore: Remove idea file * chore: Get rid of NodesWithEdges class and define a triplet type instead 2024-08-20 16:29:19 -04:00			`)`
add nodes and edges 2024-08-13 14:35:43 -04:00
			`logger = logging.getLogger(__name__)`

Refactor maintenance structure, add prompt library (#4) * chore: Initial draft of stubs * chore: Add comments and mock implementation of the add_episode method * chore: Add success and error callbacks * chore: Add success and error callbacks * refactor: Fix conflicts with the latest merge 2024-08-15 12:03:41 -04:00			`load_dotenv()`
chore: Initial draft of stubs (#2) * chore: Initial draft of stubs * updates * chore: Add comments and mock implementation of the add_episode method * chore: Add success and error callbacks * stub updates --------- Co-authored-by: prestonrasmussen <prasmuss15@gmail.com> 2024-08-14 10:17:12 -04:00

add nodes and edges 2024-08-13 14:35:43 -04:00			`class Graphiti:`
ruff action (#17) * ruff action * chore: Update Python version to 3.10 in lint.yml workflow * fix lint and formatting * cleanup 2024-08-22 13:06:42 -07:00			`def __init__(self, uri: str, user: str, password: str, llm_client: LLMClient \| None = None):`
			`self.driver = AsyncGraphDatabase.driver(uri, auth=(user, password))`
			`self.database = 'neo4j'`
			`if llm_client:`
			`self.llm_client = llm_client`
			`else:`
			`self.llm_client = OpenAIClient(`
			`LLMConfig(`
			`api_key=os.getenv('OPENAI_API_KEY'),`
			`model='gpt-4o-mini',`
			`base_url='https://api.openai.com/v1',`
			`)`
			`)`

			`def close(self):`
			`self.driver.close()`

			`async def build_indices_and_constraints(self):`
			`await build_indices_and_constraints(self.driver)`

			`async def retrieve_episodes(`
			`self,`
			`reference_time: datetime,`
			`last_n: int = EPISODE_WINDOW_LEN,`
			`sources: list[str] \| None = 'messages',`
			`) -> list[EpisodicNode]:`
			`"""Retrieve the last n episodic nodes from the graph"""`
			`return await retrieve_episodes(self.driver, reference_time, last_n, sources)`

			`# Invalidate edges that are no longer valid`
			`async def invalidate_edges(`
			`self,`
			`episode: EpisodicNode,`
			`new_nodes: list[EntityNode],`
			`new_edges: list[EntityEdge],`
			`relevant_schema: dict[str, any],`
			`previous_episodes: list[EpisodicNode],`
			`): ...`

			`async def add_episode(`
			`self,`
			`name: str,`
			`episode_body: str,`
			`source_description: str,`
			`reference_time: datetime \| None = None,`
			`episode_type: str \| None = 'string', # TODO: this field isn't used yet?`
			`success_callback: Callable \| None = None,`
			`error_callback: Callable \| None = None,`
			`):`
			`"""Process an episode and update the graph"""`
			`try:`
			`start = time()`

			`nodes: list[EntityNode] = []`
			`entity_edges: list[EntityEdge] = []`
			`episodic_edges: list[EpisodicEdge] = []`
			`embedder = self.llm_client.client.embeddings`
			`now = datetime.now()`

			`previous_episodes = await self.retrieve_episodes(reference_time)`
			`episode = EpisodicNode(`
			`name=name,`
			`labels=[],`
			`source='messages',`
			`content=episode_body,`
			`source_description=source_description,`
			`created_at=now,`
			`valid_at=reference_time,`
			`)`

			`extracted_nodes = await extract_nodes(self.llm_client, episode, previous_episodes)`

			`# Calculate Embeddings`

			`await asyncio.gather(`
			`*[node.generate_name_embedding(embedder) for node in extracted_nodes]`
			`)`
			`existing_nodes = await get_relevant_nodes(extracted_nodes, self.driver)`
			`logger.info(f'Extracted nodes: {[(n.name, n.uuid) for n in extracted_nodes]}')`
			`new_nodes, _ = await dedupe_extracted_nodes(`
			`self.llm_client, extracted_nodes, existing_nodes`
			`)`
			`logger.info(f'Deduped touched nodes: {[(n.name, n.uuid) for n in new_nodes]}')`
			`nodes.extend(new_nodes)`

			`extracted_edges = await extract_edges(`
			`self.llm_client, episode, new_nodes, previous_episodes`
			`)`

			`await asyncio.gather(*[edge.generate_embedding(embedder) for edge in extracted_edges])`

			`existing_edges = await get_relevant_edges(extracted_edges, self.driver)`
			`logger.info(f'Existing edges: {[(e.name, e.uuid) for e in existing_edges]}')`
			`logger.info(f'Extracted edges: {[(e.name, e.uuid) for e in extracted_edges]}')`

			`deduped_edges = await dedupe_extracted_edges(`
			`self.llm_client, extracted_edges, existing_edges`
			`)`

			`(`
			`old_edges_with_nodes_pending_invalidation,`
			`new_edges_with_nodes,`
			`) = prepare_edges_for_invalidation(`
			`existing_edges=existing_edges, new_edges=deduped_edges, nodes=nodes`
			`)`

			`invalidated_edges = await invalidate_edges(`
			`self.llm_client,`
			`old_edges_with_nodes_pending_invalidation,`
			`new_edges_with_nodes,`
			`)`

			`entity_edges.extend(invalidated_edges)`

			`logger.info(f'Invalidated edges: {[(e.name, e.uuid) for e in invalidated_edges]}')`

			`logger.info(f'Deduped edges: {[(e.name, e.uuid) for e in deduped_edges]}')`
			`entity_edges.extend(deduped_edges)`

			`new_edges = await dedupe_extracted_edges(`
			`self.llm_client, extracted_edges, existing_edges`
			`)`

			`logger.info(f'Deduped edges: {[(e.name, e.uuid) for e in new_edges]}')`

			`entity_edges.extend(new_edges)`
			`episodic_edges.extend(`
			`build_episodic_edges(`
			`# There may be an overlap between new_nodes and affected_nodes, so we're deduplicating them`
			`nodes,`
			`episode,`
			`now,`
			`)`
			`)`
			`# Important to append the episode to the nodes at the end so that self referencing episodic edges are not built`
			`logger.info(f'Built episodic edges: {episodic_edges}')`

			`# invalidated_edges = await self.invalidate_edges(`
			`# episode, new_nodes, new_edges, relevant_schema, previous_episodes`
			`# )`

			`# edges.extend(invalidated_edges)`

			`# Future optimization would be using batch operations to save nodes and edges`
			`await episode.save(self.driver)`
			`await asyncio.gather(*[node.save(self.driver) for node in nodes])`
			`await asyncio.gather(*[edge.save(self.driver) for edge in episodic_edges])`
			`await asyncio.gather(*[edge.save(self.driver) for edge in entity_edges])`

			`end = time()`
			`logger.info(f'Completed add_episode in {(end-start) * 1000} ms')`
			`# for node in nodes:`
			`# if isinstance(node, EntityNode):`
			`# await node.update_summary(self.driver)`
			`if success_callback:`
			`await success_callback(episode)`
			`except Exception as e:`
			`if error_callback:`
			`await error_callback(episode, e)`
			`else:`
			`raise e`

			`async def add_episode_bulk(`
			`self,`
			`bulk_episodes: list[BulkEpisode],`
			`):`
			`try:`
			`start = time()`
			`embedder = self.llm_client.client.embeddings`
			`now = datetime.now()`

			`episodes = [`
			`EpisodicNode(`
			`name=episode.name,`
			`labels=[],`
			`source='messages',`
			`content=episode.content,`
			`source_description=episode.source_description,`
			`created_at=now,`
			`valid_at=episode.reference_time,`
			`)`
			`for episode in bulk_episodes`
			`]`

			`# Save all the episodes`
			`await asyncio.gather(*[episode.save(self.driver) for episode in episodes])`

			`# Get previous episode context for each episode`
			`episode_pairs = await retrieve_previous_episodes_bulk(self.driver, episodes)`

			`# Extract all nodes and edges`
			`(`
			`extracted_nodes,`
			`extracted_edges,`
			`episodic_edges,`
			`) = await extract_nodes_and_edges_bulk(self.llm_client, episode_pairs)`

			`# Generate embeddings`
			`await asyncio.gather(`
			`*[node.generate_name_embedding(embedder) for node in extracted_nodes],`
			`*[edge.generate_embedding(embedder) for edge in extracted_edges],`
			`)`

			`# Dedupe extracted nodes`
			`nodes, uuid_map = await dedupe_nodes_bulk(self.driver, self.llm_client, extracted_nodes)`

			`# save nodes to KG`
			`await asyncio.gather(*[node.save(self.driver) for node in nodes])`

			`# re-map edge pointers so that they don't point to discard dupe nodes`
			`extracted_edges: list[EntityEdge] = resolve_edge_pointers(extracted_edges, uuid_map)`
			`episodic_edges: list[EpisodicEdge] = resolve_edge_pointers(episodic_edges, uuid_map)`

			`# save episodic edges to KG`
			`await asyncio.gather(*[edge.save(self.driver) for edge in episodic_edges])`

			`# Dedupe extracted edges`
			`edges = await dedupe_edges_bulk(self.driver, self.llm_client, extracted_edges)`
			`logger.info(f'extracted edge length: {len(edges)}')`

			`# invalidate edges`

			`# save edges to KG`
			`await asyncio.gather(*[edge.save(self.driver) for edge in edges])`

			`end = time()`
			`logger.info(f'Completed add_episode_bulk in {(end-start) * 1000} ms')`

			`except Exception as e:`
			`raise e`

			`async def search(self, query: str, num_results=10):`
			`search_config = SearchConfig(num_episodes=0, num_results=num_results)`
			`edges = (`
			`await hybrid_search(`
			`self.driver,`
			`self.llm_client.client.embeddings,`
			`query,`
			`datetime.now(),`
			`search_config,`
			`)`
			`)['edges']`

			`facts = [edge.fact for edge in edges]`

			`return facts`

			`async def _search(self, query: str, timestamp: datetime, config: SearchConfig):`
			`return await hybrid_search(`
			`self.driver, self.llm_client.client.embeddings, query, timestamp, config`
			`)`