LOCUS       VWUI01000234            3297 bp    DNA     linear   BCT 21-SEP-2019
DEFINITION  Pantoea sp. M_5 Scaffold_232, whole genome shotgun sequence.
ACCESSION   VWUI01000234 VWUI01000000
VERSION     VWUI01000234.1
DBLINK      BioProject: PRJNA563888
            BioSample: SAMN12692266
KEYWORDS    WGS.
SOURCE      Pantoea sp. M_5
  ORGANISM  Pantoea sp. M_5
            Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales;
            Erwiniaceae; Pantoea.
REFERENCE   1  (bases 1 to 3297)
  AUTHORS   Tufail,M.R. and Cook,D.R.
  TITLE     Genomic diversity of phyloplane-associated Pantoea species in
            Pakistan cotton crop
  JOURNAL   Unpublished
REFERENCE   2  (bases 1 to 3297)
  AUTHORS   Tufail,M.R. and Cook,D.R.
  TITLE     Direct Submission
  JOURNAL   Submitted (10-SEP-2019) Plant Pathology, Cook Lab - University of
            California at Davis, One Shields Ave, Davis, CA 95616, USA
COMMENT     The annotation was added by the NCBI Prokaryotic Genome Annotation
            Pipeline (PGAP). Information about PGAP can be found here:
            https://www.ncbi.nlm.nih.gov/genome/annotation_prok/
            
            ##Genome-Assembly-Data-START##
            Assembly Date          :: 17-AUG-2018
            Assembly Method        :: SPAdes v. 3.10.1
            Genome Representation  :: Full
            Expected Final Version :: Yes
            Genome Coverage        :: 166.470779x
            Sequencing Technology  :: Illumina
            ##Genome-Assembly-Data-END##
            
            ##Genome-Annotation-Data-START##
            Annotation Provider               :: NCBI
            Annotation Date                   :: 09/16/2019 03:27:43
            Annotation Pipeline               :: NCBI Prokaryotic Genome
                                                 Annotation Pipeline (PGAP)
            Annotation Method                 :: Best-placed reference protein
                                                 set; GeneMarkS-2+
            Annotation Software revision      :: 4.9
            Features Annotated                :: Gene; CDS; rRNA; tRNA; ncRNA;
                                                 repeat_region
            Genes (total)                     :: 5,906
            CDSs (total)                      :: 5,805
            Genes (coding)                    :: 4,582
            CDSs (with protein)               :: 4,582
            Genes (RNA)                       :: 101
            rRNAs                             :: 5, 1, 2 (5S, 16S, 23S)
            complete rRNAs                    :: 3, 1, 1 (5S, 16S, 23S)
            partial rRNAs                     :: 2, 1 (5S, 23S)
            tRNAs                             :: 86
            ncRNAs                            :: 7
            Pseudo Genes (total)              :: 1,223
            CDSs (without protein)            :: 1,223
            Pseudo Genes (ambiguous residues) :: 0 of 1,223
            Pseudo Genes (frameshifted)       :: 80 of 1,223
            Pseudo Genes (incomplete)         :: 1,155 of 1,223
            Pseudo Genes (internal stop)      :: 32 of 1,223
            Pseudo Genes (multiple problems)  :: 40 of 1,223
            ##Genome-Annotation-Data-END##
FEATURES             Location/Qualifiers
     source          1..3297
                     /organism="Pantoea sp. M_5"
                     /mol_type="genomic DNA"
                     /submitter_seqid="Scaffold_232"
                     /strain="M_5"
                     /isolation_source="leaves"
                     /host="Gossypium hirsutum"
                     /db_xref="taxon:2608038"
                     /geo_loc_name="Pakistan: Multan, Punjab"
                     /collection_date="2016-07-19"
                     /collected_by="Muhammad Rizwan Tufail"
     gene            complement(<1..911)
                     /locus_tag="F3I50_28615"
     CDS             complement(<1..911)
                     /locus_tag="F3I50_28615"
                     /EC_number="2.6.1.42"
                     /inference="COORDINATES: similar to AA
                     sequence:RefSeq:NP_312731.1"
                     /note="Derived by automated computational analysis using
                     gene prediction method: Protein Homology."
                     /codon_start=1
                     /transl_table=11
                     /product="branched-chain amino acid transaminase"
                     /protein_id="KAA5983831.1"
                     /translation="MSTKKADFIWFNGEMVKWEEAKVSVMSHALHYGTSVFEGVRCYD
                     SHKGPVVFRHREHMQRLHDSAKIYRFPIKSSVDELMEACREVIRVNKLKSAYIRPLAF
                     VGDVGLGVNPPDGFTTDVIIAAFPWGAYLGAEALENGIDAMVSSWNRVAPNTLPTAAK
                     AGGNYLSSLLVGSEARRHGYQEGIALDTNGLISEGAGENLFEVKDGVLFTPPFTSSAL
                     PGITRDAIITLARDMGIEVREQTLSRESLYLADEVFMSGTAAEITPVRSVDRIQVGEG
                     KCGPVTKRIQQAFFGLFTGETEDKWGW"
     gene            complement(930..1187)
                     /gene="ilvM"
                     /locus_tag="F3I50_28620"
     CDS             complement(930..1187)
                     /gene="ilvM"
                     /locus_tag="F3I50_28620"
                     /EC_number="2.2.1.6"
                     /inference="COORDINATES: similar to AA
                     sequence:RefSeq:WP_017800629.1"
                     /note="Derived by automated computational analysis using
                     gene prediction method: Protein Homology."
                     /codon_start=1
                     /transl_table=11
                     /product="acetolactate synthase 2 small subunit"
                     /protein_id="KAA5983832.1"
                     /translation="MNQHQLSIEARFRPEILERILRVVRHRGFQVCSMNMASVANAEN
                     INIEMTVASQRSVDLLSSQLSKLIDVACVQIQQQTTQQIRA"
     gene            complement(1184..2980)
                     /locus_tag="F3I50_28625"
     CDS             complement(1184..2980)
                     /locus_tag="F3I50_28625"
                     /EC_number="2.2.1.6"
                     /inference="COORDINATES: similar to AA
                     sequence:RefSeq:WP_006328778.1"
                     /note="Derived by automated computational analysis using
                     gene prediction method: Protein Homology."
                     /codon_start=1
                     /transl_table=11
                     /product="acetolactate synthase 2 catalytic subunit"
                     /protein_id="KAA5983833.1"
                     /translation="MTGAQWVVQALRAQGVDTVFGYPGGAIMPVYDALYDGGVEHLLC
                     RHEQGAVMAAIGYARSTGKTGVCIATSGPGATNLITGLADAMMDSVPIVAVTGQVSSA
                     FIGTDAFQEIDVLGLSLACTKHSFLVESLDELAMMDSVPIVAVTGQVSSAFIGTDAFQ
                     EIDVLGLSLACTKHSFLVESLDELPAIMAEAFAMAQSGRPGPVLVDIPKDIQIAQGEP
                     APHLVSVEEEESLPHHAIREARAIMTQARKPMLYVGGGVGMAQAVPALRAFAAETGIP
                     AVATLKGLGSVDAQSEVYLGMLGMHGTKAANYAVQACDLLIAVGARFDDRVTGKLDTF
                     APHASVIHLDIDPAELNKLRRAHVSLQGDLNALLPALSQPLHIDAWRDEVKALKASHA
                     WRYDHPGEAIYAPLLLKQLSERKPDSAVVTTDVGQHQMWTAQHMAFSAPENFITSSGL
                     GTMGFGLPAAIGAQVARPEDTVICVSGDGSIMMNIQELGTIKRGKLPVKIVLLDNQRL
                     GMVRQWQQLFFDGRYSETNLSDNPDFLTLASAFNIPGQRITRKDQVDAALDALLNSEG
                     PYFLHVAIDEHENVWPLVPPGASNANMMEKTV"
     gene            complement(3131..3229)
                     /gene="ilvL"
                     /locus_tag="F3I50_28630"
     CDS             complement(3131..3229)
                     /gene="ilvL"
                     /locus_tag="F3I50_28630"
                     /inference="COORDINATES: similar to AA
                     sequence:RefSeq:NP_312728.1"
                     /note="Derived by automated computational analysis using
                     gene prediction method: Protein Homology."
                     /codon_start=1
                     /transl_table=11
                     /product="ilv operon leader peptide"
                     /protein_id="KAA5983834.1"
                     /translation="MKALLQVISLVVISVVVVINLPCGATLGERKA"
BASE COUNT          734 a          947 c          896 g          719 t
ORIGIN      
        1 aaccagcccc atttgtcttc ggtctcaccc gtgaacagac caaagaaggc ctgctggatg
       61 cgtttggtga ccgggccaca tttgccttcg cccacctgaa tgcggtcaac gctgcgcact
      121 ggtgtgattt ctgccgcggt gccagacata aagacttcat cagccagata gagagattca
      181 cgagacagag tctgctcacg cacttcaatg cccatatcac gcgccagcgt aatgatcgca
      241 tcgcgcgtga tgcccggcag tgccgaagag gtaaatggcg gggtaaagag cacgccatct
      301 ttaacttcaa acaggttttc gcctgcacct tctgaaatca ggccattggt atccagcgca
      361 atgccttcct gatagccatg acgacgggct tcgctgccca ccagcagtga ggagaggtag
      421 ttaccacccg ctttagcagc agttggcaga gtgtttggcg ctacgcggtt ccatgaagag
      481 accatcgcat caataccatt ctccagcgct tcagcgccca gatacgcgcc ccacgggaag
      541 gcggcaatga tcacgtcagt cgtgaagccg tctggcgggt ttacgcccag gcccacatcg
      601 ccgacaaagg ccagtggacg gatataagca cttttcagtt tgttcacgcg gatgacttcg
      661 cggcacgctt ccatcagctc atcaacgctg cttttaatcg ggaaacggta gattttggcg
      721 gagtcgtgca gacgttgcat gtgttcacgg tggcggaaca caaccggtcc tttgtgagag
      781 tcgtagcagc ggacgccttc aaacaccgac gtgccatagt gcaacgcgtg ggacatgacg
      841 ctgaccttcg cctcttccca cttaaccatc tcgccattga accaaataaa gtctgctttc
      901 ttcgtgctca ttgttattcc ctctcgcggc taggcgcgga tttgttgtgt tgtctgttgt
      961 tgaatctgaa cgcatgcaac gtcaatcaat ttacttaact gcgaagacag taaatcgacg
     1021 gagcgctggc tggcaacggt catttcaata ttaatgtttt ccgcgttggc gactgaggcc
     1081 atgttcatag aacagacctg aaaaccgcgg tggcgcacga cgcgtaaaat gcgctccaat
     1141 atttcagggc ggaagcgggc ttcgatagac aattgatgct ggttcatacg gttttctcca
     1201 tcatgtttgc attgctggca cccggcggta ccagtggcca gacgttttca tgctcatcaa
     1261 ttgcaacatg caggaagtaa ggaccttcgc tgttcagcag agcatcaagt gcggcgtcga
     1321 cctgatcttt acgggtaatg cgctggccgg gaatattgaa agcgctggcc agcgtgagga
     1381 agtcgggatt gtcagagaga ttggtttcgc tgtagcgacc atcgaagaag agctgctgcc
     1441 actgacgcac catgcccaga cgctggttat ccagcagcac gattttgacc ggcagctttc
     1501 cgcgcttaat ggtgcccagc tcctgaatat tcatcatgat tgagccgtcg cccgagacgc
     1561 agatcaccgt atcttccggg cgggcgacct gtgcaccgat ggcggcaggc aaaccaaagc
     1621 ccatcgtgcc taagccactg gaggtgatga agttctccgg cgcgctgaag gccatatgct
     1681 gggccgtcca catctggtgc tgtccgacat cggtggtgac caccgcactg tccggtttgc
     1741 gctcggagag ctgcttcagc agcagcggtg catagattgc ctcgcctgga tgatcgtagc
     1801 gccaggcatg actggccttg agtgccttca cctcgtcgcg ccaggcgtcg atgtgcaaag
     1861 gctgactcag cgcgggcagc agcgcgttga gatcgccctg cagtgagacg tgcgcgcgac
     1921 gtaacttatt taactctgcg gggtcgatgt cgagatgaat cacgctggcg tgcggcgcga
     1981 aggtatccag cttgccggtc acccgatcgt caaaacgggc accgaccgca atcagcaggt
     2041 cacacgcctg aacagcatag ttagcggctt tggtgccgtg catccccagc atgcccagat
     2101 aaacctcgct ctgcgcatcg acgctgccca gacctttcag ggtcgcaacg gcagggatgc
     2161 cggtttctgc tgcgaatgca cgcagtgccg gaaccgcctg cgccatgccc acgcctccgc
     2221 caacatagag catcggtttt ctggcctggg tcattattgc ccgcgcctcg cggatagcat
     2281 gatgcggcag cgactcttcc tcctcaaccg aaaccagatg cggtgcgggt tcaccctgcg
     2341 caatctgaat atctttggga atatcaacca gtaccggacc cggacgccct gactgcgcca
     2401 tggcaaaagc ctcagccatg atagcgggca gctcatccag cgactcaacc aggaagctat
     2461 gtttggtgca ggccagggac agccccagca cgtcgatctc ctggaaagcg tcagtaccga
     2521 taaacgcaga cgagacctga ccggttaccg caacgatcgg cacggagtcc atcatggcna
     2581 gctcatccag cgactcaacc aggaagctat gtttggtgca ggccagggac agccccagca
     2641 cgtcgatctc ctggaaagcg tcagtaccga taaacgcaga cgagacctga ccggttaccg
     2701 caacgatcgg cacggagtcc atcatggcat cagccagacc ggtgatcagg ttggtagcgc
     2761 cagggccgga ggtggcaata cagacaccgg ttttgccggt ggagcgcgca tagccaatcg
     2821 cggccataac cgcaccctgc tcatgacggc acagtaggtg ttccacgccg ccatcgtata
     2881 gcgcgtcgta aaccggcatg atggcgccgc cagggtaacc aaatacggta tcaacaccct
     2941 gcgcacgtaa agcctgaact acccactgag cacctgtcat cgctattctc ctgtgtcctg
     3001 acgggaacaa cagaatttta tgctactgtt cattgtttgt tccttgcaga tttactgata
     3061 tttccccggg tcgaaaaaaa acccccggac ctttcggtgc gggggttttt tcggattcga
     3121 ggcttgattt ttaagccttt ctttctccaa gcgttgcccc gcacggtagg ttaataacca
     3181 ccaccacgct aatcacgacc aggctaatca cttgtagaag ggctttcatg tgttgttcaa
     3241 ttcttttacg tgttcgaagt aatgcctaca gagttatcat agtcaggggc cataaca
//