ISCbt1
- Family IS200/IS605
- Group IS605
Isoform Synonym(s)
Accession number | Transposition | Origin | Host |
---|---|---|---|
NC_007581 | ND | Clostridium botulinum | Clostridium botulinum type C C-Stockholm Bacteriophage c-st |
DNA section
IS Length : 2209 bp
Ends
Left end : AACAAATCGCAAAAGAAAGCCAACTCCTTTAGGGGTTGGATGAATTTTGTGCAAGAGATTGTTTTTAAAAAGTGTATAAATATATTGACAACATACACAA II struct. : Yes
Right end : GTATTTATATGTTGTAATTTATTTGAAGTTTAAATAAATGAGAGTATAAAAGAAGTTAATGTATCTAAGAACCCCAAGGCTTTAGTCTTGGGAGTGTCAG II struct. : Yes
Insertion site
Left flank | LE cleavage site | Right flank | RE cleavage site |
---|---|---|---|
TAATATGAAAAGTA | TTAC | TGAAACTATTAAAAAGATTGTA | TCAG |
TGTTAAAATGATGAATA | TTAC | CAATAGATCAAAAGGGGG | TCAG |
ATAAGCCTGCAATTAT | TTAC | AAAAAGCTGTTAACTAAAA | TCAG |
TAAGTTAAGAAAATACT | TTAC | TCAAAATAAAAGAAAGAGGTC | TCAg |
DNA sequence
AACAAATCGCAAAAGAAAGCCAACTCCTTTAGGGGTTGGATGAATTTTGTGCAAGAGATTGTTTTTAAAAAGTGTATAAATATATTGACAACATACACAA
TGATATGGTAATATATACACATGGAAAACAAATATAGAAAAACATCAACAACAATAAGTTTAATAAATTATCATTTTATTTTCTGTCCTAGATATAGAAG
AAAAATATTTGATATATCTAATGTAGAAAATAGATTTAAAGAATTAGTTAAAGATATATGTGAAGAACTAGATATTAAAATAATAGCTATGGAATGTGAC
AGAGACCACACACATATGTTTTTAAATTGTCTACCTACTTTATCACCTAGAGATATCATGCAAAAAATAAAAGGTGTAACAAGTAGAGAATTAAGAAAGG
AATTTGTAGAACTATCAAAAATGCCTAGTCTATGGACTAGAAGTTATTTTGTTTCAACAGCAGGTAATATATCAAGTGAAACGGTAAAACAATATGTAGA
AAATCAAAAAAAGAGGTATTAATAAAGGAGGTGAATACTATGGCTAAATCAAAAACATCAAGTTATATATTAACTTTAAAATTAAAAACAGAAAAGTATC
AAGAAGATATATTAAATAAAAGACTAGAAATCAGCAGAAATATATATAACTCTTGTTTAGGTGAAATATTAAAAAGATATAAACATACAAGAGAATTGAA
AGACTATAGGAAAGAATATAAAAATATAATTAAAATGAGTAAAGACAAAGAACGTAGTAAAAAATTTAATGAATTAAATAAAAAATATGATTTAACTGAG
TATTCACTTCATACATATGTTAAACCAATTCAAAAGCATTTTAAAGATAATGTAGATAGTTTTACAGCTCAAAAGATAGCAACAAGAGTTTTTAATTCAT
TTCAGAAACTAATGTTTCATCAAGCTAAAAGAGTATATTTTAAAAGATATGGTGAATTAAATAGTGTTGAGGGTAAATCTAATAAAACTGGCATTAGATT
TCAAGATAATTCGTTAATATGGAATGGGTTAAAAATACCTGTAATAATAAAAACTAATGATATATATGTTCAAATGTCATTAGAAAATAGAGTTAAGTAC
TGTAGAATCATCAGAAGGATTGTAAAAGGTAAAATCAAATTTTATGTTCAATTAATTCTTGAAGGAATACCTCCTATGAAGATTAATAAGACTACAGGCG
AGATAAAAAATAAGATAGGTAAAGGTAATGTGGGGATAGATATAGGTACAAGAACTATTGCAGTATCTAGTGAAAATGATGTTAAGTTATTAGAGTTAGC
ACCTGAGATTGATAATATAGAAAATCAAAAAAGAATATTAAATAGGAAATTAGATAGACAAAGACGTGCTAATAATCCTAATAAGTATAATGAAGATGGA
ACTATTAATAGGAATAATAAAGATAAATGGATCAAATCTAATAGATATATTAAAACTCAAAATAAACTTAAAGAAATTCAAAGGAAACAAGCTGAAATCA
GAAAACAAAGTCATTATAGACTAATAAATAGATTGTTACTATTGGGTAATAGATTTTTAGTAGAAACCATGAATTATAAGGGACTACAGGCTAGAGTAAA
AGAAACTACTATAAATGAGAAAACAGGTAGATTCAATAAAAAGAAAAGATTTGGTAAGAGTCTAGCGAATAAAGCACCTAGTATGTTTTTAACTATGTTA
GATAATAAGCTAAAATGGAATAATACTCAACTATTCAAAATAGATACTAAGAAATGCAAAGCAAGTCAATATAATCATTTTACAAATGAATATTGTAAGA
AAGAGTTAAAAGACAGATGGAATGAAGATATTCAAATTCAAAGAGATATGTATTCTGCATTTTTAATAATGAATGTTGTAGGTAAAACATTAGATAAAAT
AGATAGAGATTTATGTATTGAAACTTATGATAATTTTAGGAGATTACACGACAAAGAGATAGAAAGATTAAAAGAATTAAAGAAAAATGGATATAAATTA
ATATCCAGTATGGGGATATAAAATCTATATAGGTTTAGACATGAGCCTTATACTAATGTTAATCATTTATTAAAATGATAATTAGTGAAAGTCTTAGAGA
AACTAACTAGTATTTATATGTTGTAATTTATTTGAAGTTTAAATAAATGAGAGTATAAAAGAAGTTAATGTATCTAAGAACCCCAAGGCTTTAGTCTTGG
GAGTGTCAG
TGATATGGTAATATATACACATGGAAAACAAATATAGAAAAACATCAACAACAATAAGTTTAATAAATTATCATTTTATTTTCTGTCCTAGATATAGAAG
AAAAATATTTGATATATCTAATGTAGAAAATAGATTTAAAGAATTAGTTAAAGATATATGTGAAGAACTAGATATTAAAATAATAGCTATGGAATGTGAC
AGAGACCACACACATATGTTTTTAAATTGTCTACCTACTTTATCACCTAGAGATATCATGCAAAAAATAAAAGGTGTAACAAGTAGAGAATTAAGAAAGG
AATTTGTAGAACTATCAAAAATGCCTAGTCTATGGACTAGAAGTTATTTTGTTTCAACAGCAGGTAATATATCAAGTGAAACGGTAAAACAATATGTAGA
AAATCAAAAAAAGAGGTATTAATAAAGGAGGTGAATACTATGGCTAAATCAAAAACATCAAGTTATATATTAACTTTAAAATTAAAAACAGAAAAGTATC
AAGAAGATATATTAAATAAAAGACTAGAAATCAGCAGAAATATATATAACTCTTGTTTAGGTGAAATATTAAAAAGATATAAACATACAAGAGAATTGAA
AGACTATAGGAAAGAATATAAAAATATAATTAAAATGAGTAAAGACAAAGAACGTAGTAAAAAATTTAATGAATTAAATAAAAAATATGATTTAACTGAG
TATTCACTTCATACATATGTTAAACCAATTCAAAAGCATTTTAAAGATAATGTAGATAGTTTTACAGCTCAAAAGATAGCAACAAGAGTTTTTAATTCAT
TTCAGAAACTAATGTTTCATCAAGCTAAAAGAGTATATTTTAAAAGATATGGTGAATTAAATAGTGTTGAGGGTAAATCTAATAAAACTGGCATTAGATT
TCAAGATAATTCGTTAATATGGAATGGGTTAAAAATACCTGTAATAATAAAAACTAATGATATATATGTTCAAATGTCATTAGAAAATAGAGTTAAGTAC
TGTAGAATCATCAGAAGGATTGTAAAAGGTAAAATCAAATTTTATGTTCAATTAATTCTTGAAGGAATACCTCCTATGAAGATTAATAAGACTACAGGCG
AGATAAAAAATAAGATAGGTAAAGGTAATGTGGGGATAGATATAGGTACAAGAACTATTGCAGTATCTAGTGAAAATGATGTTAAGTTATTAGAGTTAGC
ACCTGAGATTGATAATATAGAAAATCAAAAAAGAATATTAAATAGGAAATTAGATAGACAAAGACGTGCTAATAATCCTAATAAGTATAATGAAGATGGA
ACTATTAATAGGAATAATAAAGATAAATGGATCAAATCTAATAGATATATTAAAACTCAAAATAAACTTAAAGAAATTCAAAGGAAACAAGCTGAAATCA
GAAAACAAAGTCATTATAGACTAATAAATAGATTGTTACTATTGGGTAATAGATTTTTAGTAGAAACCATGAATTATAAGGGACTACAGGCTAGAGTAAA
AGAAACTACTATAAATGAGAAAACAGGTAGATTCAATAAAAAGAAAAGATTTGGTAAGAGTCTAGCGAATAAAGCACCTAGTATGTTTTTAACTATGTTA
GATAATAAGCTAAAATGGAATAATACTCAACTATTCAAAATAGATACTAAGAAATGCAAAGCAAGTCAATATAATCATTTTACAAATGAATATTGTAAGA
AAGAGTTAAAAGACAGATGGAATGAAGATATTCAAATTCAAAGAGATATGTATTCTGCATTTTTAATAATGAATGTTGTAGGTAAAACATTAGATAAAAT
AGATAGAGATTTATGTATTGAAACTTATGATAATTTTAGGAGATTACACGACAAAGAGATAGAAAGATTAAAAGAATTAAAGAAAAATGGATATAAATTA
ATATCCAGTATGGGGATATAAAATCTATATAGGTTTAGACATGAGCCTTATACTAATGTTAATCATTTATTAAAATGATAATTAGTGAAAGTCTTAGAGA
AACTAACTAGTATTTATATGTTGTAATTTATTTGAAGTTTAAATAAATGAGAGTATAAAAGAAGTTAATGTATCTAAGAACCCCAAGGCTTTAGTCTTGG
GAGTGTCAG
Protein section
ORF number : 2
ORF 1
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
402 bp | 133 aa | 121 | 522 | + | No |
Chemistry : Y1
ORF sequence :
MENKYRKTSTTISLINYHFIFCPRYRRKIFDISNVENRFKELVKDICEELDIKIIAMECDRDHTHMFLNCLPTLSPRDIMQKIKGVTSRELRKEFVELSK
MPSLWTRSYFVSTAGNISSETVKQYVENQKKRY
MPSLWTRSYFVSTAGNISSETVKQYVENQKKRY
Blast result :ORF 2
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
1482 bp | 493 aa | 540 | 2021 | + | No |
AG : TnpB
ORF sequence :
MAKSKTSSYILTLKLKTEKYQEDILNKRLEISRNIYNSCLGEILKRYKHTRELKDYRKEYKNIIKMSKDKERSKKFNELNKKYDLTEYSLHTYVKPIQKH
FKDNVDSFTAQKIATRVFNSFQKLMFHQAKRVYFKRYGELNSVEGKSNKTGIRFQDNSLIWNGLKIPVIIKTNDIYVQMSLENRVKYCRIIRRIVKGKIK
FYVQLILEGIPPMKINKTTGEIKNKIGKGNVGIDIGTRTIAVSSENDVKLLELAPEIDNIENQKRILNRKLDRQRRANNPNKYNEDGTINRNNKDKWIKS
NRYIKTQNKLKEIQRKQAEIRKQSHYRLINRLLLLGNRFLVETMNYKGLQARVKETTINEKTGRFNKKKRFGKSLANKAPSMFLTMLDNKLKWNNTQLFK
IDTKKCKASQYNHFTNEYCKKELKDRWNEDIQIQRDMYSAFLIMNVVGKTLDKIDRDLCIETYDNFRRLHDKEIERLKELKKNGYKLISSMGI
FKDNVDSFTAQKIATRVFNSFQKLMFHQAKRVYFKRYGELNSVEGKSNKTGIRFQDNSLIWNGLKIPVIIKTNDIYVQMSLENRVKYCRIIRRIVKGKIK
FYVQLILEGIPPMKINKTTGEIKNKIGKGNVGIDIGTRTIAVSSENDVKLLELAPEIDNIENQKRILNRKLDRQRRANNPNKYNEDGTINRNNKDKWIKS
NRYIKTQNKLKEIQRKQAEIRKQSHYRLINRLLLLGNRFLVETMNYKGLQARVKETTINEKTGRFNKKKRFGKSLANKAPSMFLTMLDNKLKWNNTQLFK
IDTKKCKASQYNHFTNEYCKKELKDRWNEDIQIQRDMYSAFLIMNVVGKTLDKIDRDLCIETYDNFRRLHDKEIERLKELKKNGYKLISSMGI
Blast result :
Comments
ISCbt1 is 84% (ORF A) aa similar to ISBce3 and 38% (ORF B) aa similar to IS608.
There are 3 complete copies and one partial copy in Bacteriophage c-st.The ends of this IS are defined by comparing the sequences of IS-inserted regions in c-st with those of analogous unoccupied regions in other BoNTX phages ( Sakaguchi,Y. et al, 2005). ISCbt1 are inserted site-specifically into TTAC sequence.
There are 3 complete copies and one partial copy in Bacteriophage c-st.The ends of this IS are defined by comparing the sequences of IS-inserted regions in c-st with those of analogous unoccupied regions in other BoNTX phages ( Sakaguchi,Y. et al, 2005). ISCbt1 are inserted site-specifically into TTAC sequence.
References
1] Sakaguchi,Y., Hayashi,T., Kurokawa,K., Nakayama,K., Oshima,K., Fujinaga,Y., Ohnishi,M., Ohtsubo,E., Hattori,M. and Oguma,K.(2005) Proc. Natl. Acad. Sci. U.S.A. 102 (48), 17472-17477