#!/bin/bash set -e python scripts/pii_rule_comparison.py \ --docs-folder /home/ubuntu/s2pdf_dedupe_minhash_v1_with_no_pii/documents \ --ref-rule "ft_lang_id_en_doc_v2__ft_lang_id_en_doc_v2__en:avg>0.5" \ --hyp-rule "ft_lang_id_en_doc_v2__ft_lang_id_en_doc_v2__en:avg>0.4" \ --output-dir results/pii_detection \ tinyhost results/pii_detection/*