haystack/rest_api/controller/search.py

import json
import logging
import time
from datetime import datetime
from typing import Any, Dict, List, Optional

import elasticapm
from fastapi import APIRouter
from fastapi import HTTPException

from haystack import Finder
from rest_api.config import DB_HOST, DB_PORT, DB_USER, DB_PW, DB_INDEX, DEFAULT_TOP_K_READER, ES_CONN_SCHEME, \
    TEXT_FIELD_NAME, SEARCH_FIELD_NAME, EMBEDDING_DIM, EMBEDDING_FIELD_NAME, EXCLUDE_META_DATA_FIELDS, \
    RETRIEVER_TYPE, EMBEDDING_MODEL_PATH, USE_GPU, READER_MODEL_PATH, BATCHSIZE, CONTEXT_WINDOW_SIZE, \
    TOP_K_PER_CANDIDATE, NO_ANS_BOOST, MAX_PROCESSES, MAX_SEQ_LEN, DOC_STRIDE, CONCURRENT_REQUEST_PER_WORKER, \
    FAQ_QUESTION_FIELD_NAME, EMBEDDING_MODEL_FORMAT, READER_TYPE, READER_TOKENIZER, GPU_NUMBER, NAME_FIELD_NAME, \
    VECTOR_SIMILARITY_METRIC, CREATE_INDEX, LOG_LEVEL

from rest_api.controller.request import Question
from rest_api.controller.response import Answers, AnswersToIndividualQuestion

from rest_api.controller.utils import RequestLimiter
from haystack.document_store.elasticsearch import ElasticsearchDocumentStore
from haystack.reader.base import BaseReader
from haystack.reader.farm import FARMReader
from haystack.reader.transformers import TransformersReader
from haystack.retriever.base import BaseRetriever
from haystack.retriever.sparse import ElasticsearchRetriever, ElasticsearchFilterOnlyRetriever
from haystack.retriever.dense import EmbeddingRetriever

logger = logging.getLogger('haystack')
logger.setLevel(LOG_LEVEL)

router = APIRouter()

# Init global components: DocumentStore, Retriever, Reader, Finder
document_store = ElasticsearchDocumentStore(
    host=DB_HOST,
    port=DB_PORT,
    username=DB_USER,
    password=DB_PW,
    index=DB_INDEX,
    scheme=ES_CONN_SCHEME,
    ca_certs=False,
    verify_certs=False,
    text_field=TEXT_FIELD_NAME,
    name_field=NAME_FIELD_NAME,
    search_fields=SEARCH_FIELD_NAME,
    embedding_dim=EMBEDDING_DIM,
    embedding_field=EMBEDDING_FIELD_NAME,
    excluded_meta_data=EXCLUDE_META_DATA_FIELDS,  # type: ignore
    faq_question_field=FAQ_QUESTION_FIELD_NAME,
    create_index=CREATE_INDEX,
    similarity=VECTOR_SIMILARITY_METRIC
)

if RETRIEVER_TYPE == "EmbeddingRetriever":
    retriever = EmbeddingRetriever(
        document_store=document_store,
        embedding_model=EMBEDDING_MODEL_PATH,
        model_format=EMBEDDING_MODEL_FORMAT,
        use_gpu=USE_GPU
    )  # type: BaseRetriever
elif RETRIEVER_TYPE == "ElasticsearchRetriever":
    retriever = ElasticsearchRetriever(document_store=document_store)
elif RETRIEVER_TYPE is None or RETRIEVER_TYPE == "ElasticsearchFilterOnlyRetriever":
    retriever = ElasticsearchFilterOnlyRetriever(document_store=document_store)
else:
    raise ValueError(f"Could not load Retriever of type '{RETRIEVER_TYPE}'. "
                     f"Please adjust RETRIEVER_TYPE to one of: "
                     f"'EmbeddingRetriever', 'ElasticsearchRetriever', 'ElasticsearchFilterOnlyRetriever', None"
                     f"OR modify rest_api/search.py to support your retriever"
                     )

if READER_MODEL_PATH:  # for extractive doc-qa
    if READER_TYPE == "TransformersReader":
        use_gpu = -1 if not USE_GPU else GPU_NUMBER
        reader = TransformersReader(
            model_name_or_path=str(READER_MODEL_PATH),
            use_gpu=use_gpu,
            context_window_size=CONTEXT_WINDOW_SIZE,
            tokenizer=str(READER_TOKENIZER)
        )  # type: Optional[BaseReader]
    elif READER_TYPE == "FARMReader":
        reader = FARMReader(
            model_name_or_path=str(READER_MODEL_PATH),
            batch_size=BATCHSIZE,
            use_gpu=USE_GPU,
            context_window_size=CONTEXT_WINDOW_SIZE,
            top_k_per_candidate=TOP_K_PER_CANDIDATE,
            no_ans_boost=NO_ANS_BOOST,
            num_processes=MAX_PROCESSES,
            max_seq_len=MAX_SEQ_LEN,
            doc_stride=DOC_STRIDE,
        )  # type: Optional[BaseReader]
    else:
        raise ValueError(f"Could not load Reader of type '{READER_TYPE}'. "
                         f"Please adjust READER_TYPE to one of: "
                         f"'FARMReader', 'TransformersReader', None"
                         )
else:
    reader = None  # don't need one for pure FAQ matching

FINDERS = {1: Finder(reader=reader, retriever=retriever)}


#############################################
# Endpoints
#############################################
doc_qa_limiter = RequestLimiter(CONCURRENT_REQUEST_PER_WORKER)


@router.post("/models/{model_id}/doc-qa", response_model=Answers, response_model_exclude_unset=True)
def doc_qa(model_id: int, question_request: Question):
    with doc_qa_limiter.run():
        start_time = time.time()
        finder = FINDERS.get(model_id, None)
        if not finder:
            raise HTTPException(
                status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"
            )

        results = search_documents(finder, question_request, start_time)

        return {"results": results}


@router.post("/models/{model_id}/faq-qa", response_model=Answers, response_model_exclude_unset=True)
def faq_qa(model_id: int, request: Question):
    finder = FINDERS.get(model_id, None)
    if not finder:
        raise HTTPException(
            status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"
        )

    results = []
    for question in request.questions:
        if request.filters:
            # put filter values into a list and remove filters with null value
            filters = {}
            for key, values in request.filters.items():
                if values is None:
                    continue
                if not isinstance(values, list):
                    values = [values]
                filters[key] = values
            logger.info(f" [{datetime.now()}] Request: {request}")
        else:
            filters = {}

        result = finder.get_answers_via_similar_questions(
            question=question, top_k_retriever=request.top_k_retriever, filters=filters,
        )
        results.append(result)

    elasticapm.set_custom_context({"results": results})
    logger.info(json.dumps({"request": request.dict(), "results": results}))

    return {"results": results}


@router.post("/models/{model_id}/query", response_model=Dict[str, Any], response_model_exclude_unset=True)
def query(model_id: int, query_request: Dict[str, Any], top_k_reader: int = DEFAULT_TOP_K_READER):
    with doc_qa_limiter.run():
        start_time = time.time()
        finder = FINDERS.get(model_id, None)
        if not finder:
            raise HTTPException(
                status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"
            )

        question_request = Question.from_elastic_query_dsl(query_request, top_k_reader)

        answers = search_documents(finder, question_request, start_time)
        response: Dict[str, Any] = {}
        if answers and len(answers) > 0:
            response = AnswersToIndividualQuestion.to_elastic_response_dsl(dict(answers[0]))

        return response


def search_documents(finder, question_request, start_time) -> List[AnswersToIndividualQuestion]:
    results = []
    for question in question_request.questions:
        if question_request.filters:
            # put filter values into a list and remove filters with null value
            filters = {}
            for key, values in question_request.filters.items():
                if values is None:
                    continue
                if not isinstance(values, list):
                    values = [values]
                filters[key] = values
            logger.info(f" [{datetime.now()}] Request: {question_request}")
        else:
            filters = {}

        result = finder.get_answers(
            question=question,
            top_k_retriever=question_request.top_k_retriever,
            top_k_reader=question_request.top_k_reader,
            filters=filters,
        )
        results.append(result)
    elasticapm.set_custom_context({"results": results})
    end_time = time.time()
    logger.info(
        json.dumps({"request": question_request.dict(), "results": results,
                    "time": f"{(end_time - start_time):.2f}"}))
    return results
Cast Search REST API logs to JSON (#290) 2020-08-06 04:36:56 -04:00			`import json`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`import logging`
Add response time in logs (#201) 2020-07-07 12:28:41 +02:00			`import time`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`from datetime import datetime`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`from typing import Any, Dict, List, Optional`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
Log results in APM (#70) 2020-04-22 11:28:23 +02:00			`import elasticapm`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`from fastapi import APIRouter`
			`from fastapi import HTTPException`

			`from haystack import Finder`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`from rest_api.config import DB_HOST, DB_PORT, DB_USER, DB_PW, DB_INDEX, DEFAULT_TOP_K_READER, ES_CONN_SCHEME, \`
			`TEXT_FIELD_NAME, SEARCH_FIELD_NAME, EMBEDDING_DIM, EMBEDDING_FIELD_NAME, EXCLUDE_META_DATA_FIELDS, \`
			`RETRIEVER_TYPE, EMBEDDING_MODEL_PATH, USE_GPU, READER_MODEL_PATH, BATCHSIZE, CONTEXT_WINDOW_SIZE, \`
			`TOP_K_PER_CANDIDATE, NO_ANS_BOOST, MAX_PROCESSES, MAX_SEQ_LEN, DOC_STRIDE, CONCURRENT_REQUEST_PER_WORKER, \`
			`FAQ_QUESTION_FIELD_NAME, EMBEDDING_MODEL_FORMAT, READER_TYPE, READER_TOKENIZER, GPU_NUMBER, NAME_FIELD_NAME, \`
Allow configuration of log level in REST API via ENV (#541) * configure log level via env. adjust debug messages * pin faiss version 2020-11-04 09:54:02 +01:00			`VECTOR_SIMILARITY_METRIC, CREATE_INDEX, LOG_LEVEL`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00
			`from rest_api.controller.request import Question`
			`from rest_api.controller.response import Answers, AnswersToIndividualQuestion`
Add create_index and similarity metric to api config (#493) * make creation of label index optional * add params for rest api * reset tutorial flag 2020-10-15 18:41:36 +02:00
Move out REST API from PyPI package (#160) 2020-06-22 12:07:12 +02:00			`from rest_api.controller.utils import RequestLimiter`
Rename and restructure modules (database, indexing, schemas) (#379) * rename database to documentstore * move document, label, multilabel to haystack/schema.py * rename documentstore -> document_store * split indexing modules -> file_converter + preprocessor * fix order of imports * Update tutorial notebooks * fix torch version in tutorial 4 2020-09-16 18:33:23 +02:00			`from haystack.document_store.elasticsearch import ElasticsearchDocumentStore`
Change arg "model" to "model_name_or_path" in TransformersReader (#510) * Consistent parameter naming for TransformersReader along with removing unused imports as well. * Addressing review comments 2020-10-21 17:15:35 +02:00			`from haystack.reader.base import BaseReader`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`from haystack.reader.farm import FARMReader`
Adjust Docker and REST API to allow TransformsReader Class (#180) 2020-07-07 16:25:36 +02:00			`from haystack.reader.transformers import TransformersReader`
Add type hints and mypy checks (#138) 2020-06-10 17:22:37 +02:00			`from haystack.retriever.base import BaseRetriever`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`from haystack.retriever.sparse import ElasticsearchRetriever, ElasticsearchFilterOnlyRetriever`
Dense Passage Retriever (Inference) (#167) 2020-06-30 19:05:45 +02:00			`from haystack.retriever.dense import EmbeddingRetriever`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
Allow configuration of log level in REST API via ENV (#541) * configure log level via env. adjust debug messages * pin faiss version 2020-11-04 09:54:02 +01:00			`logger = logging.getLogger('haystack')`
			`logger.setLevel(LOG_LEVEL)`

Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`router = APIRouter()`

			`# Init global components: DocumentStore, Retriever, Reader, Finder`
			`document_store = ElasticsearchDocumentStore(`
			`host=DB_HOST,`
Add Elasticsearch PORT and SCHEME in API config (#134) 2020-06-09 04:56:56 -03:00			`port=DB_PORT,`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`username=DB_USER,`
			`password=DB_PW,`
			`index=DB_INDEX,`
			`scheme=ES_CONN_SCHEME,`
			`ca_certs=False,`
			`verify_certs=False,`
			`text_field=TEXT_FIELD_NAME,`
Custom fields for indexing in ElasticsearchDocumentStore (#297) 2020-08-10 05:34:39 -04:00			`name_field=NAME_FIELD_NAME,`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`search_fields=SEARCH_FIELD_NAME,`
			`embedding_dim=EMBEDDING_DIM,`
			`embedding_field=EMBEDDING_FIELD_NAME,`
Add type hints and mypy checks (#138) 2020-06-10 17:22:37 +02:00			`excluded_meta_data=EXCLUDE_META_DATA_FIELDS, # type: ignore`
Make FAQ question field customizable (#146) 2020-06-11 12:36:19 +02:00			`faq_question_field=FAQ_QUESTION_FIELD_NAME,`
Add create_index and similarity metric to api config (#493) * make creation of label index optional * add params for rest api * reset tutorial flag 2020-10-15 18:41:36 +02:00			`create_index=CREATE_INDEX,`
			`similarity=VECTOR_SIMILARITY_METRIC`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`)`

Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`if RETRIEVER_TYPE == "EmbeddingRetriever":`
Add EMBEDDING_MODEL_FORMAT in API config (#152) 2020-06-16 13:58:30 +02:00			`retriever = EmbeddingRetriever(`
			`document_store=document_store,`
			`embedding_model=EMBEDDING_MODEL_PATH,`
Remove Literal type hint (#156) 2020-06-17 16:26:21 +02:00			`model_format=EMBEDDING_MODEL_FORMAT,`
Refactor DPR for latest transformers version & change init arg `gpu` -> `use_gpu` for DPR and EmbeddingRetriever (#239) * fix tokenizer warning in latest transformers * change dpr arg from gpu to use_gpu * change gpu arg for EmbeddingRetriever 2020-07-16 10:45:01 +02:00			`use_gpu=USE_GPU`
Add EMBEDDING_MODEL_FORMAT in API config (#152) 2020-06-16 13:58:30 +02:00			`) # type: BaseRetriever`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`elif RETRIEVER_TYPE == "ElasticsearchRetriever":`
Split Elasticsearch retriever in separate classes (#72) 2020-04-23 16:09:53 +02:00			`retriever = ElasticsearchRetriever(document_store=document_store)`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`elif RETRIEVER_TYPE is None or RETRIEVER_TYPE == "ElasticsearchFilterOnlyRetriever":`
			`retriever = ElasticsearchFilterOnlyRetriever(document_store=document_store)`
			`else:`
			`raise ValueError(f"Could not load Retriever of type '{RETRIEVER_TYPE}'. "`
			`f"Please adjust RETRIEVER_TYPE to one of: "`
			`f"'EmbeddingRetriever', 'ElasticsearchRetriever', 'ElasticsearchFilterOnlyRetriever', None"`
			`f"OR modify rest_api/search.py to support your retriever"`
			`)`

Split Elasticsearch retriever in separate classes (#72) 2020-04-23 16:09:53 +02:00			`if READER_MODEL_PATH: # for extractive doc-qa`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`if READER_TYPE == "TransformersReader":`
Adjust Docker and REST API to allow TransformsReader Class (#180) 2020-07-07 16:25:36 +02:00			`use_gpu = -1 if not USE_GPU else GPU_NUMBER`
			`reader = TransformersReader(`
Change arg "model" to "model_name_or_path" in TransformersReader (#510) * Consistent parameter naming for TransformersReader along with removing unused imports as well. * Addressing review comments 2020-10-21 17:15:35 +02:00			`model_name_or_path=str(READER_MODEL_PATH),`
Adjust Docker and REST API to allow TransformsReader Class (#180) 2020-07-07 16:25:36 +02:00			`use_gpu=use_gpu,`
			`context_window_size=CONTEXT_WINDOW_SIZE,`
			`tokenizer=str(READER_TOKENIZER)`
Change arg "model" to "model_name_or_path" in TransformersReader (#510) * Consistent parameter naming for TransformersReader along with removing unused imports as well. * Addressing review comments 2020-10-21 17:15:35 +02:00			`) # type: Optional[BaseReader]`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`elif READER_TYPE == "FARMReader":`
Adjust Docker and REST API to allow TransformsReader Class (#180) 2020-07-07 16:25:36 +02:00			`reader = FARMReader(`
			`model_name_or_path=str(READER_MODEL_PATH),`
			`batch_size=BATCHSIZE,`
			`use_gpu=USE_GPU,`
			`context_window_size=CONTEXT_WINDOW_SIZE,`
			`top_k_per_candidate=TOP_K_PER_CANDIDATE,`
			`no_ans_boost=NO_ANS_BOOST,`
			`num_processes=MAX_PROCESSES,`
			`max_seq_len=MAX_SEQ_LEN,`
			`doc_stride=DOC_STRIDE,`
Change arg "model" to "model_name_or_path" in TransformersReader (#510) * Consistent parameter naming for TransformersReader along with removing unused imports as well. * Addressing review comments 2020-10-21 17:15:35 +02:00			`) # type: Optional[BaseReader]`
Add dummy retriever for benchmarking / reader-only settings (#235) 2020-07-15 17:22:17 +02:00			`else:`
			`raise ValueError(f"Could not load Reader of type '{READER_TYPE}'. "`
			`f"Please adjust READER_TYPE to one of: "`
			`f"'FARMReader', 'TransformersReader', None"`
			`)`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`else:`
Split Elasticsearch retriever in separate classes (#72) 2020-04-23 16:09:53 +02:00			`reader = None # don't need one for pure FAQ matching`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
			`FINDERS = {1: Finder(reader=reader, retriever=retriever)}`


			`#############################################`
			`# Endpoints`
			`#############################################`
Add limit on concurrent requests for doc-qa (#64) 2020-04-17 15:15:53 +02:00			`doc_qa_limiter = RequestLimiter(CONCURRENT_REQUEST_PER_WORKER)`

Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`@router.post("/models/{model_id}/doc-qa", response_model=Answers, response_model_exclude_unset=True)`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`def doc_qa(model_id: int, question_request: Question):`
Add limit on concurrent requests for doc-qa (#64) 2020-04-17 15:15:53 +02:00			`with doc_qa_limiter.run():`
Add response time in logs (#201) 2020-07-07 12:28:41 +02:00			`start_time = time.time()`
Add limit on concurrent requests for doc-qa (#64) 2020-04-17 15:15:53 +02:00			`finder = FINDERS.get(model_id, None)`
			`if not finder:`
			`raise HTTPException(`
Allow list of filter values in REST API (#568) 2020-11-09 20:41:53 +01:00			`status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"`
Add limit on concurrent requests for doc-qa (#64) 2020-04-17 15:15:53 +02:00			`)`

Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`results = search_documents(finder, question_request, start_time)`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
			`return {"results": results}`


			`@router.post("/models/{model_id}/faq-qa", response_model=Answers, response_model_exclude_unset=True)`
			`def faq_qa(model_id: int, request: Question):`
			`finder = FINDERS.get(model_id, None)`
			`if not finder:`
			`raise HTTPException(`
Allow list of filter values in REST API (#568) 2020-11-09 20:41:53 +01:00			`status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`)`

			`results = []`
			`for question in request.questions:`
			`if request.filters:`
			`# put filter values into a list and remove filters with null value`
Allow list of filter values in REST API (#568) 2020-11-09 20:41:53 +01:00			`filters = {}`
			`for key, values in request.filters.items():`
			`if values is None:`
			`continue`
			`if not isinstance(values, list):`
			`values = [values]`
			`filters[key] = values`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`logger.info(f" [{datetime.now()}] Request: {request}")`
Add type hints and mypy checks (#138) 2020-06-10 17:22:37 +02:00			`else:`
			`filters = {}`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
			`result = finder.get_answers_via_similar_questions(`
Add type hints and mypy checks (#138) 2020-06-10 17:22:37 +02:00			`question=question, top_k_retriever=request.top_k_retriever, filters=filters,`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00			`)`
			`results.append(result)`

Log results in APM (#70) 2020-04-22 11:28:23 +02:00			`elasticapm.set_custom_context({"results": results})`
Cast Search REST API logs to JSON (#290) 2020-08-06 04:36:56 -04:00			`logger.info(json.dumps({"request": request.dict(), "results": results}))`
Modularize API components (#55) This PR makes the REST API module more cohesive and maintainable by splitting into separate modules for controllers, routes, config, and the FastAPI app. 2020-04-15 14:04:30 +02:00
Log results in APM (#70) 2020-04-22 11:28:23 +02:00			`return {"results": results}`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00

			`@router.post("/models/{model_id}/query", response_model=Dict[str, Any], response_model_exclude_unset=True)`
			`def query(model_id: int, query_request: Dict[str, Any], top_k_reader: int = DEFAULT_TOP_K_READER):`
			`with doc_qa_limiter.run():`
			`start_time = time.time()`
			`finder = FINDERS.get(model_id, None)`
			`if not finder:`
			`raise HTTPException(`
Allow list of filter values in REST API (#568) 2020-11-09 20:41:53 +01:00			`status_code=404, detail=f"Could not get Finder with ID {model_id}. Available IDs: {list(FINDERS.keys())}"`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`)`

			`question_request = Question.from_elastic_query_dsl(query_request, top_k_reader)`

			`answers = search_documents(finder, question_request, start_time)`
			`response: Dict[str, Any] = {}`
			`if answers and len(answers) > 0:`
			`response = AnswersToIndividualQuestion.to_elastic_response_dsl(dict(answers[0]))`

			`return response`


			`def search_documents(finder, question_request, start_time) -> List[AnswersToIndividualQuestion]:`
			`results = []`
			`for question in question_request.questions:`
			`if question_request.filters:`
			`# put filter values into a list and remove filters with null value`
Allow list of filter values in REST API (#568) 2020-11-09 20:41:53 +01:00			`filters = {}`
			`for key, values in question_request.filters.items():`
			`if values is None:`
			`continue`
			`if not isinstance(values, list):`
			`values = [values]`
			`filters[key] = values`
Add Elasticsearch Query DSL compliant Query API (#471) 2020-10-16 13:25:31 +02:00			`logger.info(f" [{datetime.now()}] Request: {question_request}")`
			`else:`
			`filters = {}`

			`result = finder.get_answers(`
			`question=question,`
			`top_k_retriever=question_request.top_k_retriever,`
			`top_k_reader=question_request.top_k_reader,`
			`filters=filters,`
			`)`
			`results.append(result)`
			`elasticapm.set_custom_context({"results": results})`
			`end_time = time.time()`
			`logger.info(`
			`json.dumps({"request": question_request.dict(), "results": results,`
			`"time": f"{(end_time - start_time):.2f}"}))`
			`return results`