datahub/metadata-ingestion/examples/library/lineage_dataset_job_dataset.py

from datahub.metadata.urns import DataFlowUrn, DataJobUrn, DatasetUrn
from datahub.sdk import DataHubClient

client = DataHubClient.from_env()

datajob_urn = DataJobUrn(
    flow=DataFlowUrn(orchestrator="airflow", flow_id="flow1", cluster="PROD"),
    job_id="job1",
)
input_dataset_urn = DatasetUrn(platform="mysql", name="librarydb.member", env="PROD")
input_datajob_urn = DataJobUrn(
    flow=DataFlowUrn(orchestrator="airflow", flow_id="data_pipeline", cluster="PROD"),
    job_id="job0",
)
output_dataset_urn = DatasetUrn(
    platform="kafka", name="debezium.topics.librarydb.member_checkout", env="PROD"
)


# add datajob -> datajob lineage
client.lineage.add_lineage(
    upstream=input_datajob_urn,
    downstream=datajob_urn,
)

# add dataset -> datajob lineage
client.lineage.add_lineage(
    upstream=input_dataset_urn,
    downstream=datajob_urn,
)

# add datajob -> dataset lineage
client.lineage.add_lineage(
    upstream=datajob_urn,
    downstream=output_dataset_urn,
)
docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`from datahub.metadata.urns import DataFlowUrn, DataJobUrn, DatasetUrn`
			`from datahub.sdk import DataHubClient`
docs(ingestion): Emitter api examples + Documentation (#3599) 2021-11-18 23:30:25 -08:00
docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`client = DataHubClient.from_env()`
docs(ingestion): Emitter api examples + Documentation (#3599) 2021-11-18 23:30:25 -08:00
docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`datajob_urn = DataJobUrn(`
			`flow=DataFlowUrn(orchestrator="airflow", flow_id="flow1", cluster="PROD"),`
			`job_id="job1",`
			`)`
			`input_dataset_urn = DatasetUrn(platform="mysql", name="librarydb.member", env="PROD")`
			`input_datajob_urn = DataJobUrn(`
			`flow=DataFlowUrn(orchestrator="airflow", flow_id="data_pipeline", cluster="PROD"),`
			`job_id="job0",`
			`)`
			`output_dataset_urn = DatasetUrn(`
			`platform="kafka", name="debezium.topics.librarydb.member_checkout", env="PROD"`
			`)`
docs(ingestion): Emitter api examples + Documentation (#3599) 2021-11-18 23:30:25 -08:00

docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`# add datajob -> datajob lineage`
			`client.lineage.add_lineage(`
			`upstream=input_datajob_urn,`
			`downstream=datajob_urn,`
docs(ingestion): Emitter api examples + Documentation (#3599) 2021-11-18 23:30:25 -08:00			`)`

docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`# add dataset -> datajob lineage`
			`client.lineage.add_lineage(`
			`upstream=input_dataset_urn,`
			`downstream=datajob_urn,`
docs(ingestion): Emitter api examples + Documentation (#3599) 2021-11-18 23:30:25 -08:00			`)`

docs: update the example scripts with the new sdk (#13717) 2025-06-12 14:00:26 +09:00			`# add datajob -> dataset lineage`
			`client.lineage.add_lineage(`
			`upstream=datajob_urn,`
			`downstream=output_dataset_urn,`
			`)`