The align package

This package uses a pangenome as a reference to compute elements for a given genome, or a given set of proteins. As such, analysis that are usually run on multiple genomes can be run on the single genome or set of proteins that is provided. This subpackage depends on many of the other subpackages to run its analysis. This package depends on the following packages:

formats, to check the pangenome status.
annotate, to read the given input files that can be gff or gbff.
cluster, to write gene sequences from annotations.
RGP, to eventually compute RGP and spot predictions.

It depends on the following modules:

pangenome
utils

Submodules

ppanggolin.align.alignOnPang module

ppanggolin.align.alignOnPang.add_spot_str(a)[source]

ppanggolin.align.alignOnPang.align(pangenome, proteinFile, output, tmpdir, identity=0.8, coverage=0.8, defrag=False, cpu=1, getinfo=False, draw_related=False)[source]

ppanggolin.align.alignOnPang.alignSeqToPang(pangFile, seqFile, output, tmpdir, cpu=1, defrag=False, identity=0.8, coverage=0.8, is_nucl=False, code=11)[source]

ppanggolin.align.alignOnPang.alignSubparser(subparser)[source]

ppanggolin.align.alignOnPang.createdb(fileObj, tmpdir)[source]

ppanggolin.align.alignOnPang.draw_spot_gexf(spots, output, multigenics, set_size=3)[source]

ppanggolin.align.alignOnPang.getFam2RGP(pangenome, multigenics)[source]: associates families to the RGP they belong to, and those they are bordering

ppanggolin.align.alignOnPang.getFam2spot(pangenome, output, multigenics)[source]: reads a pangenome object and returns a dictionnary of family to RGP and family to spot, that indicates where each family is

ppanggolin.align.alignOnPang.getProt(protFile)[source]

ppanggolin.align.alignOnPang.getProtInfo(prot2pang, pangenome, output, cpu, draw_related)[source]

ppanggolin.align.alignOnPang.launch(args)[source]

ppanggolin.align.alignOnPang.linkMultigenicFamilies(pangenome, multigenics)[source]

ppanggolin.align.alignOnPang.linkNewGenomeFamilies(orgPangenome, formerPangenome, blastTab)[source]

ppanggolin.align.alignOnPang.projectPartition(prot2pang, protSet, output)[source]

ppanggolin.align.alignOnPang.projectRGP(pangenome, annotation, output, tmpdir, identity=0.8, coverage=0.8, defrag=False, cpu=1, translation_table=11, pseudo=False)[source]

ppanggolin.align.alignOnPang.readAlignments(outfile, pangenome)[source]

ppanggolin.align.alignOnPang.writeGbffRegions(filename, regions, output)[source]

ppanggolin.align.alignOnPang.writeGeneFamSequences(pangenome, fileObj)[source]

ppanggolin.align.alignOnPang.writeGffRegions(filename, regions, output)[source]

ppanggolin.align.alignOnPang.write_RGPs_cgview(regions, output)[source]: write RGPs in a table that is compatible with cgview server

ppanggolin.align.alignOnPang.write_partitions_cgview(organism, output)[source]: writes the partition of each gene in a table that is compatible with cgview server