ISCbt2
- Family IS200/IS605
- Group IS605
Isoform Synonym(s)
Accession number | Transposition | Origin | Host |
---|---|---|---|
NC_007581 | ND | Clostridium botulinum | Clostridium botulinum type C C-Stockholm Bacteriophage c-st |
DNA section
IS Length : 2223 bp
Ends
Left end : ATAGAAAATGGCAAGGTAACTGCCAAGCTTTAGCTTGTGCAGAGGAATTGCCCAATATAAGGAAGTGACTAATGAAACACTATAGAAAAAATAATAAATA II struct. : Yes
Right end : AGTTTGAATGTTGTAACTTAATTTTATAATTAAGCGAGAGTTAAAAAGAGAATTGATAGAAGTAGAACCTGCCAAGCTTTAGCTTGTGCAGAGTATTCAG II struct. : Yes
Insertion site
Left flank | LE cleavage site | Right flank | RE cleavage site |
---|---|---|---|
TTGTGATGAAGAAAATGTAT | ACAT | GGTTACCAAAGATAAACTTGTT | TCAG |
CAGTGAAAATATTGTATAATCAAAAT | ACAT | NNNN | |
TGATAAATCAAATTTATAT | ACAT | ATGAAAGTTTAAAGATGGAAGTATT | TCAG |
DNA sequence
ATAGAAAATGGCAAGGTAACTGCCAAGCTTTAGCTTGTGCAGAGGAATTGCCCAATATAAGGAAGTGACTAATGAAACACTATAGAAAAAATAATAAATA
TTATTCTTCATCGCATTTAGTTTATAGATGCTGTTATCATGTGGTATTTTGTCCAAAATATCGTCGTTCAATTTTATTAGGTAATGTAACTAATAGGTTA
AAAGAAATATGTTATGAAATTGCAAAAACACATGATTTTTTAATTGAAGAAATTGAAACTGATAAAGATCATGTCCATATGATTATAAATTGTAATCCAA
GATATGGGGTAATAAAATGCGTGCAATTAATTAAAGGGATTAGTGGTTATAAATTGTTTGAAGAATTTCCTTTTATAAAGAAGAGATATTTATGGGGAGG
AAAGTTTTGGAGTAGATCTACTTTTGTAGCAACTGTAGGTAGTGTAAGTTTAGATATTGTTAAAAGATATATTGAAAACCAAGGAAAATAAATTAAAAAA
ATACTTGAAAAATTGTAATAAATATGATAATATATGTATATGATATAAATTCATTGAAAGAGAGGTGAATACTGTGGCTAAATCAAAAACTCCTAGTTAT
GTTTTAACTTTGAGATTAGGGGCTACTAAATCTGATATAAGTGCGTTAAATACATACTTTGAATTATCAAGAAAGTTGTATAATGCTTTATTAGGTGAAG
GATTAAAAAGATTTAGATTAATGAGAGAATCTAAAATGTATCAACAAGCAAGAAAAGAAACTAAGAAGATTAATAAAAATAAACTATTCAAAGAAGTACA
ATTAAAATATAAATTTAGTAATTTTGATTTAAACAAATATTCCACCTCATTAAGGGTAAATGAATTTAAAAATATAGATGCTAATACAGTACAAGCATTA
TCGGCAAGAGCGATTAAATCTATTGATCGAATGAGATTTGGTGAAGCTAAAAGAGTTAATTTTATTAAATATAATGAAATGTATTCTATGGAAGGACTTA
ATAATAGACAAGGAATAAGATATAGAGATGGATTTATATACTTTAATAAATTAAAATTGCCTGTAATTATAAGAAAAAATGATACTTATGCTCAAAAATG
CATTCAAGATAGAGTTAAATTTTGTAGAATAATTAAAAAATACAAAGGTAATTCAATTAGATATTATGTTCAACTAATATTAGAAGGGATACCACCTATA
AAACATACATTAGGAACAGGTGAGGTAGGTTTGGATATAGGTACAAGAACTATTGCAGTATCTAGTGAAAATGATGTTAAGTTATTAGAGTTAGCACCTG
AGATTGATAATATAGAAAATCAAAAAAGAATATTAAATAGGAAATTAGATAGACAAAGACGTGCTAATAATCCTAATAAGTATAATGAAGATGGAACTAT
TAAAAAGGGAAATAGAGATAGATGGATTAATAGTAATAATTATTTAAAAACCAAAGCAAAGTTAAGAGATATACAAAGTAGATTAGCCAGTATAAGAAAG
CAAGACCATGAAAAAATGGCTAATTATATATTATCATTAGGTAGCATCATTAAAGTAGAAACTATGAATTATAAGGGGTTACAAGCTAGAGCAAAAGAAA
CTACTATAAATGAGAAAACAGGTAGATTCAATAAAAAGAAAAGATTTGGTAAGAGTCTAGCAAACAAAGCACCTAGTATGTTGCTTGATATAATTAATAG
GAAACTCAAATATCATAATTTAGGGTTGTTTAAAATAGATACTTATAAAATAAAGGCAAGTCAATATAATCCCTTTACAAATGAATATATTAAGAAGTCT
TTAAGTGAAAGATGGAATAGGTTTAAAATTAATGAGCAAGAAATTCAAATACAAAGAGATTTAATGAGTGCTTTAATTATTAAAAATGTTATTATAGATA
AAAAACTTAAATTAGATAAAGTAAATAAAGAAAAATTATTAGATGAATTTGATAGTTTTAAAAAATTGCATGATATAGAAATATTAAGATTGAAAAATTG
TAAAAATAGATTATTAAATAGTATGGGAATATAAATATAAAATAAGGTATTAGAATCGTGCCTTTGTCGTTAATTAGTTGGTTGCAACTATTGGCAAAAA
AGTCTATAGATAATCAATTCAATAGTTTGAATGTTGTAACTTAATTTTATAATTAAGCGAGAGTTAAAAAGAGAATTGATAGAAGTAGAACCTGCCAAGC
TTTAGCTTGTGCAGAGTATTCAG
TTATTCTTCATCGCATTTAGTTTATAGATGCTGTTATCATGTGGTATTTTGTCCAAAATATCGTCGTTCAATTTTATTAGGTAATGTAACTAATAGGTTA
AAAGAAATATGTTATGAAATTGCAAAAACACATGATTTTTTAATTGAAGAAATTGAAACTGATAAAGATCATGTCCATATGATTATAAATTGTAATCCAA
GATATGGGGTAATAAAATGCGTGCAATTAATTAAAGGGATTAGTGGTTATAAATTGTTTGAAGAATTTCCTTTTATAAAGAAGAGATATTTATGGGGAGG
AAAGTTTTGGAGTAGATCTACTTTTGTAGCAACTGTAGGTAGTGTAAGTTTAGATATTGTTAAAAGATATATTGAAAACCAAGGAAAATAAATTAAAAAA
ATACTTGAAAAATTGTAATAAATATGATAATATATGTATATGATATAAATTCATTGAAAGAGAGGTGAATACTGTGGCTAAATCAAAAACTCCTAGTTAT
GTTTTAACTTTGAGATTAGGGGCTACTAAATCTGATATAAGTGCGTTAAATACATACTTTGAATTATCAAGAAAGTTGTATAATGCTTTATTAGGTGAAG
GATTAAAAAGATTTAGATTAATGAGAGAATCTAAAATGTATCAACAAGCAAGAAAAGAAACTAAGAAGATTAATAAAAATAAACTATTCAAAGAAGTACA
ATTAAAATATAAATTTAGTAATTTTGATTTAAACAAATATTCCACCTCATTAAGGGTAAATGAATTTAAAAATATAGATGCTAATACAGTACAAGCATTA
TCGGCAAGAGCGATTAAATCTATTGATCGAATGAGATTTGGTGAAGCTAAAAGAGTTAATTTTATTAAATATAATGAAATGTATTCTATGGAAGGACTTA
ATAATAGACAAGGAATAAGATATAGAGATGGATTTATATACTTTAATAAATTAAAATTGCCTGTAATTATAAGAAAAAATGATACTTATGCTCAAAAATG
CATTCAAGATAGAGTTAAATTTTGTAGAATAATTAAAAAATACAAAGGTAATTCAATTAGATATTATGTTCAACTAATATTAGAAGGGATACCACCTATA
AAACATACATTAGGAACAGGTGAGGTAGGTTTGGATATAGGTACAAGAACTATTGCAGTATCTAGTGAAAATGATGTTAAGTTATTAGAGTTAGCACCTG
AGATTGATAATATAGAAAATCAAAAAAGAATATTAAATAGGAAATTAGATAGACAAAGACGTGCTAATAATCCTAATAAGTATAATGAAGATGGAACTAT
TAAAAAGGGAAATAGAGATAGATGGATTAATAGTAATAATTATTTAAAAACCAAAGCAAAGTTAAGAGATATACAAAGTAGATTAGCCAGTATAAGAAAG
CAAGACCATGAAAAAATGGCTAATTATATATTATCATTAGGTAGCATCATTAAAGTAGAAACTATGAATTATAAGGGGTTACAAGCTAGAGCAAAAGAAA
CTACTATAAATGAGAAAACAGGTAGATTCAATAAAAAGAAAAGATTTGGTAAGAGTCTAGCAAACAAAGCACCTAGTATGTTGCTTGATATAATTAATAG
GAAACTCAAATATCATAATTTAGGGTTGTTTAAAATAGATACTTATAAAATAAAGGCAAGTCAATATAATCCCTTTACAAATGAATATATTAAGAAGTCT
TTAAGTGAAAGATGGAATAGGTTTAAAATTAATGAGCAAGAAATTCAAATACAAAGAGATTTAATGAGTGCTTTAATTATTAAAAATGTTATTATAGATA
AAAAACTTAAATTAGATAAAGTAAATAAAGAAAAATTATTAGATGAATTTGATAGTTTTAAAAAATTGCATGATATAGAAATATTAAGATTGAAAAATTG
TAAAAATAGATTATTAAATAGTATGGGAATATAAATATAAAATAAGGTATTAGAATCGTGCCTTTGTCGTTAATTAGTTGGTTGCAACTATTGGCAAAAA
AGTCTATAGATAATCAATTCAATAGTTTGAATGTTGTAACTTAATTTTATAATTAAGCGAGAGTTAAAAAGAGAATTGATAGAAGTAGAACCTGCCAAGC
TTTAGCTTGTGCAGAGTATTCAG
Protein section
ORF number : 2
ORF 1
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
420 bp | 139 aa | 72 | 491 | + | No |
Chemistry : Y1
ORF sequence :
MKHYRKNNKYYSSSHLVYRCCYHVVFCPKYRRSILLGNVTNRLKEICYEIAKTHDFLIEEIETDKDHVHMIINCNPRYGVIKCVQLIKGISGYKLFEEFP
FIKKRYLWGGKFWSRSTFVATVGSVSLDIVKRYIENQGK
FIKKRYLWGGKFWSRSTFVATVGSVSLDIVKRYIENQGK
Blast result :ORF 2
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
1470 bp | 489 aa | 565 | 2034 | + | No |
AG : TnpB
ORF sequence :
MNTVAKSKTPSYVLTLRLGATKSDISALNTYFELSRKLYNALLGEGLKRFRLMRESKMYQQARKETKKINKNKLFKEVQLKYKFSNFDLNKYSTSLRVNE
FKNIDANTVQALSARAIKSIDRMRFGEAKRVNFIKYNEMYSMEGLNNRQGIRYRDGFIYFNKLKLPVIIRKNDTYAQKCIQDRVKFCRIIKKYKGNSIRY
YVQLILEGIPPIKHTLGTGEVGLDIGTRTIAVSSENDVKLLELAPEIDNIENQKRILNRKLDRQRRANNPNKYNEDGTIKKGNRDRWINSNNYLKTKAKL
RDIQSRLASIRKQDHEKMANYILSLGSIIKVETMNYKGLQARAKETTINEKTGRFNKKKRFGKSLANKAPSMLLDIINRKLKYHNLGLFKIDTYKIKASQ
YNPFTNEYIKKSLSERWNRFKINEQEIQIQRDLMSALIIKNVIIDKKLKLDKVNKEKLLDEFDSFKKLHDIEILRLKNCKNRLLNSMGI
FKNIDANTVQALSARAIKSIDRMRFGEAKRVNFIKYNEMYSMEGLNNRQGIRYRDGFIYFNKLKLPVIIRKNDTYAQKCIQDRVKFCRIIKKYKGNSIRY
YVQLILEGIPPIKHTLGTGEVGLDIGTRTIAVSSENDVKLLELAPEIDNIENQKRILNRKLDRQRRANNPNKYNEDGTIKKGNRDRWINSNNYLKTKAKL
RDIQSRLASIRKQDHEKMANYILSLGSIIKVETMNYKGLQARAKETTINEKTGRFNKKKRFGKSLANKAPSMLLDIINRKLKYHNLGLFKIDTYKIKASQ
YNPFTNEYIKKSLSERWNRFKINEQEIQIQRDLMSALIIKNVIIDKKLKLDKVNKEKLLDEFDSFKKLHDIEILRLKNCKNRLLNSMGI
Blast result :
Comments
ISCbt2 is 65% (ORF A) aa similar to ISTac1 and 38% (ORF B) aa similar to IS608.
There are 1 complete copy and one partial copy in Bacteriophage c-st.The ends of this IS are defined by comparing the sequences of IS-inserted regions in c-st with those of analogous unoccupied regions in other BoNTX phages ( Sakaguchi,Y. et al, 2005). ISCbt2 are inserted site-specifically into ATACAT sequence.
There are 1 complete copy and one partial copy in Bacteriophage c-st.The ends of this IS are defined by comparing the sequences of IS-inserted regions in c-st with those of analogous unoccupied regions in other BoNTX phages ( Sakaguchi,Y. et al, 2005). ISCbt2 are inserted site-specifically into ATACAT sequence.
References
1] Sakaguchi,Y., Hayashi,T., Kurokawa,K., Nakayama,K., Oshima,K., Fujinaga,Y., Ohnishi,M., Ohtsubo,E., Hattori,M. and Oguma,K.(2005) Proc. Natl. Acad. Sci. U.S.A. 102 (48), 17472-17477