14 Prepare: Region

Region

Description

Summary

encode_chipseq_flagship
encode_chipseq_histone
encode_chipseq_subset
encode_chromatin_states
encode_open_chromatin
encode_e2g_benchmark
encode_e2g_prediction
fcc_enhancer_junke_zscore
fcc_astarr_csaw
fcc_astarr_macs
fcc_wstarr_cradle
fcc_crispri_growth
fcc_crispri_hcrff
fcc_screened
hic_insitu_K562_ENCSR545YBD
hic_intact_K562_ENCSR479XDG
hic_intact_K562_deep

genome_tss
genome_cres
genome_...
ref_tss (what if it is from RAMPAGE?)

(TF_modules)
PROJECT/results/region
├── encode_open_chromatin
│   ├── K562.hg38.ENCSR000EKS.ENCFF274YGF.DNase.bed.gz
│   ├── K562.hg38.ENCSR000EOT.ENCFF185XRG.DNase.bed.gz
│   ├── K562.hg38.ENCSR483RKN.ENCFF558BLC.ATAC.bed.gz
│   ├── K562.hg38.ENCSR483RKN.ENCFF925CYR.ATAC.bed.gz
│   ├── K562.hg38.ENCSR868FGK.ENCFF333TAT.ATAC.bed.gz
│   ├── K562.hg38.ENCSR868FGK.ENCFF948AFM.ATAC.bed.gz
│   └── summary
│       ├── description.tsv
│       ├── metadata.label.tsv
│
├── encode_chromatin_states
│   ├── K562.hg38.cCREs.silencer_rest.bed.gz
│   ├── K562.hg38.cCREs.silencer_starr.bed.gz
│   ├── K562.hg38.ENCSR365YNI.ENCFF106BGJ.ChromHMM.simplified.bed.gz
│   ├── K562.hg38.ENCSR913HQX.ENCFF286VQG.cCREs.simplified.bed.gz
│   └── summary
│       ├── description.tsv
│       ├── K562.hg38.ENCSR913HQX.ENCFF286VQG.cCREs.label2name.bed.gz
│       ├── K562.hg38.ENCSR913HQX.ENCFF286VQG.cCREs.label2name.PLS_ELS.bed.gz
│       └── metadata.label.tsv
│
├── encode_chipseq_flagship
│   └── summary
│
├── encode_chipseq_histone
│   └── summary
│
├── encode_chipseq_subset
│   └── summary
│
├── encode_e2g_benchmark
│   ├── K562.hg38.EPCrisprBenchmark.active.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.active.merge.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.total.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.total.merge.gz
│   └── summary
│
├── encode_e2g_prediction_ENCSR328LMT
│   ├── K562.hg38.ENCSR328LMT.ENCFF202FID.element_gene_links.active.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF202FID.element_gene_links.active.merge.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF122UMY.element_gene_links.total.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF122UMY.element_gene_links.total.merge.bed.gz
│   └── summary
│
├── fcc_astarr_csaw
│   ├── K562.hg38.ASTARR.csaw.KS91.bed.gz
│   ├── K562.hg38.ASTARR.csaw.KSMerge.bed.gz
│   └── summary
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── fcc_astarr_macs
│   ├── ASTARRseq_K562_KS91.hg38.Input.rep_all.max_overlaps.q5.bed.gz
│   ├── ASTARRseq_K562_KS91.hg38.Input.rep_all.union.q5.bed.gz
│   ├── K562.hg38.ASTARR.macs.KS91.input.rep_all.max_overlaps.q5.bed.gz
│   ├── K562.hg38.ASTARR.macs.KS91.input.rep_all.union.q5.bed.gz
│   └── summary
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── fcc_crispri_hcrff
│   ├── K562.hg38.CRISPRi_HCRFF.CASA.bed.gz
│   └── summary
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── fcc_crispri_growth
│   ├── K562.hg38.CRISPRi_Growth.DHS.active.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.active.merge.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.total.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.total.merge.bed.gz
│   └── summary
│
├── fcc_mpra_agarwal2023
│   ├── K562.hg38.LMPRA.lib_design.bed.gz
│   └── summary
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── fcc_screened
│   ├── region_screened.crispri_hcrff.bed.gz
│   ├── region_screened.crispri_hcrff.tsv
│   ├── region_screened.tmpra.bed.gz
│   ├── region_screened.tmpra.tsv
│   └── summary
│
├── genome_tss
│   ├── K562.hg38.TSS.selected_by_highest_Pol2_signal.bed.gz
│   ├── K562.hg38.TSS.selected_by_highest_Pol2_signal.filtered_by_RNAseq_TPM.bed.gz
│   └── summary
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── module_tf_shannon
│   ├── K562.hg38.TF_Module.bed.gz
│   └── summary
│       ├── matrix.Module.tsv
│       ├── matrix.TF.tsv
│       ├── data.TF_Module.tsv
│       ├── description.tsv
│       └── metadata.label.tsv
│
├── hic_insitu_K562_ENCSR545YBD
│   ├── K562.hg38.hic_insitu.Loop_A.bed.gz
│   ├── K562.hg38.hic_insitu.Loop_B.bed.gz
│   ├── K562.hg38.hic_insitu.TAD.bedpe.gz
│   └── summary
│       ├── description.tsv
│       ├── K562.hg38.hic_insitu.Loop.tsv
│       ├── K562.hg38.hic_insitu.TAD.tsv
│       └── metadata.label.tsv
│
├── hic_intact_K562_ENCSR479XDG
│   ├── K562.hg38.hic_intact.Loop_A.bed.gz
│   ├── K562.hg38.hic_intact.Loop_B.bed.gz
│   ├── K562.hg38.hic_intact.TAD.bedpe.gz
│   └── summary
│       ├── description.tsv
│       ├── K562.hg38.hic_intact.Loop.tsv
│       ├── K562.hg38.hic_intact.TAD.tsv
│       └── metadata.label.tsv
│
├── hic_intact_K562_deep
│   ├── K562.hg38.hic_intact.Loop_A.bed.gz
│   ├── K562.hg38.hic_intact.Loop_B.bed.gz
│   └── summary
│       ├── description.tsv
│       ├── K562.hg38.hic_intact.Loop.tsv
│       └── metadata.label.tsv
│
└── summary
    ├── annotation.macs.label.region_A.tsv
    ├── annotation.macs.label.region_B.chipseq_full.tsv
    ├── annotation.macs.label.region_B.chipseq_subset.tsv
    ├── annotation.macs.label.region_B.main.tsv
    ├── metadata.label.astarr_macs.tsv
    ├── metadata.label.chipseq_full.tsv
    ├── metadata.label.main.tsv
    ├── metadata.label.ocr.tsv
PROJECT/results/region
├── encode_open_chromatin
│   ├── K562.hg38.ENCSR000EKS.ENCFF274YGF.DNase.bed.gz
│   ├── K562.hg38.ENCSR000EOT.ENCFF185XRG.DNase.bed.gz
│   ├── K562.hg38.ENCSR483RKN.ENCFF558BLC.ATAC.bed.gz
│   ├── K562.hg38.ENCSR483RKN.ENCFF925CYR.ATAC.bed.gz
│   ├── K562.hg38.ENCSR868FGK.ENCFF333TAT.ATAC.bed.gz
│   ├── K562.hg38.ENCSR868FGK.ENCFF948AFM.ATAC.bed.gz
│   └── summary
|       ├── metadata.label.tsv
|       ├── metadata.size.tsv
|       ├── result.size.concat.csv
|       ├── result.size.<...>.csv
│       └── description.tsv
│
├── encode_chipseq_flagship
│   └── summary
│
├── encode_chipseq_histone
│   └── summary
│
├── encode_chipseq_subset
│   └── summary
│
├── encode_chromatin_states
│   └── summary
│
├── encode_e2g_benchmark
│   ├── K562.hg38.EPCrisprBenchmark.active.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.active.merge.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.total.bed.gz
│   ├── K562.hg38.EPCrisprBenchmark.total.merge.gz
│   └── summary
│
├── encode_e2g_prediction_ENCSR328LMT
│   ├── K562.hg38.ENCSR328LMT.ENCFF202FID.element_gene_links.active.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF202FID.element_gene_links.active.merge.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF122UMY.element_gene_links.total.bed.gz
│   ├── K562.hg38.ENCSR328LMT.ENCFF122UMY.element_gene_links.total.merge.bed.gz
│   └── summary
│
├── fcc_astarr_csaw
│   ├── ASTARRseq_K562_KSMerge.hg38.bed.gz

│   ├── K562.hg38.ASTARR.KSMerge.csaw.bed.gz
│   ├── K562.hg38.ASTARR.KS91.csaw.bed.gz

│   ├── K562.hg38.ASTARR.csaw.KSMerge.bed.gz
│   ├── K562.hg38.ASTARR.csaw.KS91.bed.gz

│   └── summary
|
├── fcc_astarr_macs
│   ├── ASTARRseq_K562_KS91.hg38.Input.rep_all.union.q5.bed.gz
│   ├── ASTARRseq_K562_KS91.hg38.Input.rep_all.max_overlaps.q5.bed.gz

│   ├── K562.hg38.ASTARR.KS91.macs.input.rep_all.union.q5.bed.gz
│   ├── K562.hg38.ASTARR.KS91.macs.input.rep_all.max_overlaps.q5.bed.gz

│   ├── K562.hg38.ASTARR.macs.KS91.input.rep_all.union.q5.bed.gz
│   ├── K562.hg38.ASTARR.macs.KS91.input.rep_all.max_overlaps.q5.bed.gz

│   └── summary
│
├── fcc_crispri_hcrff
│   ├── K562.hg38.CRISPRi_HCRFF.CASA.bed.gz
│   ├── K562.hg38.CRISPRi_HCRFF.CASA.merge.bed.gz
│   └── summary
│
├── fcc_crispri_growth
│   ├── K562.hg38.CRISPRi_Growth.DHS.active.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.active.merge.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.total.bed.gz
│   ├── K562.hg38.CRISPRi_Growth.DHS.total.merge.bed.gz
│   └── summary
│
├── fcc_screened
│   ├── region_screened.crispri_hcrff.bed.gz
│   ├── region_screened.crispri_hcrff.tsv
│   ├── region_screened.tmpra.bed.gz
│   ├── region_screened.tmpra.tsv
│   └── summary
│
├── hic_insitu_K562_ENCSR545YBD
│   ├── K562.hg38.ENCSR545YBD.ENCFF271SAF.hic_insitu.contact_domain.bed.gz
│   ├── K562.hg38.ENCSR545YBD.ENCFF693XIL.hic_insitu.loop.A.bed.gz
│   ├── K562.hg38.ENCSR545YBD.ENCFF693XIL.hic_insitu.loop.B.bed.gz

│   ├── K562.hg38.hic_insitu.contact_domain.bed.gz
│   ├── K562.hg38.hic_insitu.loop.A.bed.gz
│   ├── K562.hg38.hic_insitu.loop.B.bed.gz

│   └── summary
│
├── hic_intact_K562_ENCSR479XDG
│   ├── K562.hg38.ENCSR479XDG.ENCFF126GED.hic_intact.contact_domain.bed.gz
│   ├── K562.hg38.ENCSR479XDG.ENCFF256ZMD.hic_intact.loop.A.bed.gz
│   ├── K562.hg38.ENCSR479XDG.ENCFF256ZMD.hic_intact.loop.B.bed.gz

│   ├── K562.hg38.hic_intact.contact_domain.bed.gz
│   ├── K562.hg38.hic_intact.loop.A.bed.gz
│   ├── K562.hg38.hic_intact.loop.B.bed.gz

│   └── summary
│
├── hic_intact_K562_deep
│   ├── K562.hg38.deep.hic_intact.loop.A.bed.gz
│   ├── K562.hg38.deep.hic_intact.loop.B.bed.gz
│   └── summary
│
└── summary
    ├── metadata.size.tsv
    ├── metadata.label.tsv
    ├── metadata.label.ocr.total.tsv
    ├── metadata.label.ocr.astarr_macs.tsv
    ├── metadata.label.cres.tsv
    ├── metadata.label.chromstates.tsv
    ├── metadata.label.chipseq_subset.tsv
    ├── metadata.label.chipseq.tsv

Region labeling

<Assay>_<File Index>/<Label>

encode_open_chromatin
├── atac_<File Index>
└── dnase_<File Index>

encode_chipseq_subset/histone/flagship
└── chipseq_<File Index>

encode_chromatin_states
├── ccres_<File Index>
└── chromhmm_<File Index>

encode_e2g_benchmark
├── encode_e2g_benchmark_active_merge
└── encode_e2g_benchmark_total_merge

encode_e2g_prediction
├── encode_e2g_prediction_active_merge
└── encode_e2g_prediction_total_merge

fcc_crispri_hcrff
├── crispri_hcrff_active_merge
└── crispri_hcrff_total_merge

fcc_crispri_growth
├── crispri_growth_active_merge
└── crispri_growth_total_merge

fcc_screened
├── ...