ISCba1
- Family IS1595
- Group ISPna2
Isoform Synonym(s)
Accession number | Transposition | Origin | Host |
---|---|---|---|
NZ_ABEZ02000022 | ND | Clostridium bartlettii | Clostridium bartlettii DSM 16795 |
DNA section
IS Length : 2623 bp
Ends
IR Length : 25/28
IRL : GGCTATGTTAGCTAACTTTGTGATTAATTATATCTAAAATAGGCTATAAT
IRR : GGCTATGTTAGCTATCTTCGTGATAAATATGACATAAAAACAACCACACC
Insertion site
Left flank | Direct repeat | Right flank | DR Length |
---|---|---|---|
GCTAGAAGAGTTTTAA | TAAATTAA | TAATTGAATATATT | 8 |
DNA sequence
GGCTATGTTAGCTAACTTTGTGATTAATTATATCTAAAATAGGCTATAATATAGGTATAGACTATATTTCAACTAATTTACAGAAAGGATACCTAATATT
ATGTCAAAAATAGATATAAAAGCTATGATAAAAGATTTAAAAAAGAATGAACTTACAGAGTTAATTTCAGTAGCACAAGAAGTATTAAGTACTTTATTTA
ATTCTTCTGAAATTAGAGATAATGTTAAAGAAAGTAGATTTTCTAAAGGATACGAGTGCCCAAAATGTCAATGTAAAGATGTAAATAAAAATGGGAAATC
TAATGGAAGACAAAGATATATATGTAAACGTTGTCGTACAAGTTTTGATGAGTTTACTATGTCCCCATTCTCTAATACAAAATTAGGGTTAGATAAATGG
CTAAAATACTGCGAATTAATGATATTAGGACTTTCTATAAGAAAATGTGCTGAAGAAGTAGGAGTAGGTGTTAAAACGTCTTTTTACATGCGTCATAGGA
TACTTGATGTAATCAATTTATCATTAAAAAATGATAAAGTTGAAGGTATAGTTGAAGTAGATGAATGCTTTATTAAGGAGTCTTTTAAAGGGAATCATTC
TAAAAGTACTACATTTGTAATGCCTAGAAATCCTAGAAAAAGAGGTAAAGGTAAAAATGATAAGAAGAAAAGAGGAATATCAAAAGAGCAGATTTGTATA
GAGACAGCAATTGATAGAAAAGGAAATATCCTTATGGGTGCTGTTTGTAATGGTAGAATTACAACAAATCAAATAGTTAACTTCTTTGACAATAAAATAT
GTGAAGATGCTACTTTTTGTGTAGATTCACATAAATCATATATGGGAATAAAGGATAAGTTGAACATAGAGTTAAAGCAAGTTCCTAGAGGAAAATCAAT
GATAGATAGTGTTTATCATTTACAGCATATAAATGCTCTTCACAGTAGCTTTAAGAGATGGTTAATGACTTTTAATGGTGTATCCACAAAATATATCAAT
AATTATTTGGCTTGGTTTAAATTTCTACAACTAAGTAAGAAGAATAAAAAGAATGACCGAATTAAAGATATGCTAGTGAATGTAGCTACTAAGGATACAT
ATGTAACTAGAGCCACTATTAGAAATAGATTCATTGAATTAACATAAAGTAAGGAACTTTACTTCAAATTAATGAAACCATTTTATAATTGGAAAACAAT
TGAATACTTTATATAATATAATTAAGTTCGTAATTATTATATATTGAGAATTAATTATAAATAAAAAGGGGAAATTTTATATGGTAAAAGTAATTAGGTT
AAGTTTATTTTTAATTGCTATATCATTATTTTTAACAGGGTGCAGTAATTCAAAAGAAGATATAACTTTGGATATTAATAAAAATGAGAATTTAATTGAT
ACTAATAATATTAATCAAATTATTTCTAATGATATTTATTCAAAAGAAAGCGAAGAACAAGAATTGATAAATATAATAGAATCAGTAGAAAAAAATAAAC
CTACTATGTCAGATGAAGAACGATATGATTTAAGAACTGATATATTCTTTAACTTAAATCAAGAGCAAGTTCTTAAATTTGGAGACTGTTATACTGCATT
GAACCAAGTTATTTTTGATGATAGATATAAAGAATTATTCGATAAGGCAAATAATCGATGGGATGCTTATGATAATAATGATTTATATGGAATTGTAAAT
ACTATAAGATATATATCTAATTCAGTAAAAAATCAAGCGTTTAAAAATGATTTAAATAGAATTGAAGAATTGTGTTCATATGGATTAGAATATAGAGATA
TAATCGCACTTATTGATGCAAGAAGAATAATGAGAGATATTCAATATCACATATTTGAAGTTCCATATTTTAAAGAGGGAGATGCTATAGTTGAAATAAA
TGAAGAAGATTATAGCATATATTATGGAGCTAGTGAAGTATTAGAAGGAGATAGATATAAAACTATAGGTATATATAGATATAAATAGTTTAACATAGCC
TTTTATAAAATTAGGCTATGTTTTAAATAAGTGTTGAAAATGATATAATATAAACTAAATCGCAATTGTCATATATTGTGACTTATAAGTAAAACACTAT
AATAGTGTTGATTATGAAGAAAGGTGATGCGATGAAACAAGAAAAAAGGATATATATACGAAAGTATGTTTCAGCAATTATATTTTCTAACATAATAGTA
TGGTTTAGCTGGGCATTGCCATTAATACTACTAGATGGTATAAAACTTAATGATGAATATCTTTTACAATTGGGATTTCTGTTAAGAATAGTGCTAAGTA
CAATACCTTTCATAGTGCTATTTGATTATACTAAGAGGAAGTATAAAGAAAATAAATTTACGAAAATGTGCTATATTTGTAGTATTATAAGTATGTTGTT
ATTACCAACTTTGTTTTTCATATTACATCTTGAAATAGGATATGGAGGTTGGTTTTGGTAAAAGTTATAATTTATAGAAGTAGCTTAATAGACAATATTA
ATATATTACGAACAATTTATAGTAAGTTATATAATCAACCACATATTAGAATTCAATATATTGAAAATTCTAAGGTGTGGTTGTTTTTATGTCATATTTA
TCACGAAGATAGCTAACATAGCC
ATGTCAAAAATAGATATAAAAGCTATGATAAAAGATTTAAAAAAGAATGAACTTACAGAGTTAATTTCAGTAGCACAAGAAGTATTAAGTACTTTATTTA
ATTCTTCTGAAATTAGAGATAATGTTAAAGAAAGTAGATTTTCTAAAGGATACGAGTGCCCAAAATGTCAATGTAAAGATGTAAATAAAAATGGGAAATC
TAATGGAAGACAAAGATATATATGTAAACGTTGTCGTACAAGTTTTGATGAGTTTACTATGTCCCCATTCTCTAATACAAAATTAGGGTTAGATAAATGG
CTAAAATACTGCGAATTAATGATATTAGGACTTTCTATAAGAAAATGTGCTGAAGAAGTAGGAGTAGGTGTTAAAACGTCTTTTTACATGCGTCATAGGA
TACTTGATGTAATCAATTTATCATTAAAAAATGATAAAGTTGAAGGTATAGTTGAAGTAGATGAATGCTTTATTAAGGAGTCTTTTAAAGGGAATCATTC
TAAAAGTACTACATTTGTAATGCCTAGAAATCCTAGAAAAAGAGGTAAAGGTAAAAATGATAAGAAGAAAAGAGGAATATCAAAAGAGCAGATTTGTATA
GAGACAGCAATTGATAGAAAAGGAAATATCCTTATGGGTGCTGTTTGTAATGGTAGAATTACAACAAATCAAATAGTTAACTTCTTTGACAATAAAATAT
GTGAAGATGCTACTTTTTGTGTAGATTCACATAAATCATATATGGGAATAAAGGATAAGTTGAACATAGAGTTAAAGCAAGTTCCTAGAGGAAAATCAAT
GATAGATAGTGTTTATCATTTACAGCATATAAATGCTCTTCACAGTAGCTTTAAGAGATGGTTAATGACTTTTAATGGTGTATCCACAAAATATATCAAT
AATTATTTGGCTTGGTTTAAATTTCTACAACTAAGTAAGAAGAATAAAAAGAATGACCGAATTAAAGATATGCTAGTGAATGTAGCTACTAAGGATACAT
ATGTAACTAGAGCCACTATTAGAAATAGATTCATTGAATTAACATAAAGTAAGGAACTTTACTTCAAATTAATGAAACCATTTTATAATTGGAAAACAAT
TGAATACTTTATATAATATAATTAAGTTCGTAATTATTATATATTGAGAATTAATTATAAATAAAAAGGGGAAATTTTATATGGTAAAAGTAATTAGGTT
AAGTTTATTTTTAATTGCTATATCATTATTTTTAACAGGGTGCAGTAATTCAAAAGAAGATATAACTTTGGATATTAATAAAAATGAGAATTTAATTGAT
ACTAATAATATTAATCAAATTATTTCTAATGATATTTATTCAAAAGAAAGCGAAGAACAAGAATTGATAAATATAATAGAATCAGTAGAAAAAAATAAAC
CTACTATGTCAGATGAAGAACGATATGATTTAAGAACTGATATATTCTTTAACTTAAATCAAGAGCAAGTTCTTAAATTTGGAGACTGTTATACTGCATT
GAACCAAGTTATTTTTGATGATAGATATAAAGAATTATTCGATAAGGCAAATAATCGATGGGATGCTTATGATAATAATGATTTATATGGAATTGTAAAT
ACTATAAGATATATATCTAATTCAGTAAAAAATCAAGCGTTTAAAAATGATTTAAATAGAATTGAAGAATTGTGTTCATATGGATTAGAATATAGAGATA
TAATCGCACTTATTGATGCAAGAAGAATAATGAGAGATATTCAATATCACATATTTGAAGTTCCATATTTTAAAGAGGGAGATGCTATAGTTGAAATAAA
TGAAGAAGATTATAGCATATATTATGGAGCTAGTGAAGTATTAGAAGGAGATAGATATAAAACTATAGGTATATATAGATATAAATAGTTTAACATAGCC
TTTTATAAAATTAGGCTATGTTTTAAATAAGTGTTGAAAATGATATAATATAAACTAAATCGCAATTGTCATATATTGTGACTTATAAGTAAAACACTAT
AATAGTGTTGATTATGAAGAAAGGTGATGCGATGAAACAAGAAAAAAGGATATATATACGAAAGTATGTTTCAGCAATTATATTTTCTAACATAATAGTA
TGGTTTAGCTGGGCATTGCCATTAATACTACTAGATGGTATAAAACTTAATGATGAATATCTTTTACAATTGGGATTTCTGTTAAGAATAGTGCTAAGTA
CAATACCTTTCATAGTGCTATTTGATTATACTAAGAGGAAGTATAAAGAAAATAAATTTACGAAAATGTGCTATATTTGTAGTATTATAAGTATGTTGTT
ATTACCAACTTTGTTTTTCATATTACATCTTGAAATAGGATATGGAGGTTGGTTTTGGTAAAAGTTATAATTTATAGAAGTAGCTTAATAGACAATATTA
ATATATTACGAACAATTTATAGTAAGTTATATAATCAACCACATATTAGAATTCAATATATTGAAAATTCTAAGGTGTGGTTGTTTTTATGTCATATTTA
TCACGAAGATAGCTAACATAGCC
Protein section
ORF number : 3
ORF 1
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
1047 bp | 348 aa | 101 | 1147 | + | No |
Chemistry : DDE
ORF sequence :
MSKIDIKAMIKDLKKNELTELISVAQEVLSTLFNSSEIRDNVKESRFSKGYECPKCQCKDVNKNGKSNGRQRYICKRCRTSFDEFTMSPFSNTKLGLDKW
LKYCELMILGLSIRKCAEEVGVGVKTSFYMRHRILDVINLSLKNDKVEGIVEVDECFIKESFKGNHSKSTTFVMPRNPRKRGKGKNDKKKRGISKEQICI
ETAIDRKGNILMGAVCNGRITTNQIVNFFDNKICEDATFCVDSHKSYMGIKDKLNIELKQVPRGKSMIDSVYHLQHINALHSSFKRWLMTFNGVSTKYIN
NYLAWFKFLQLSKKNKKNDRIKDMLVNVATKDTYVTRATIRNRFIELT
LKYCELMILGLSIRKCAEEVGVGVKTSFYMRHRILDVINLSLKNDKVEGIVEVDECFIKESFKGNHSKSTTFVMPRNPRKRGKGKNDKKKRGISKEQICI
ETAIDRKGNILMGAVCNGRITTNQIVNFFDNKICEDATFCVDSHKSYMGIKDKLNIELKQVPRGKSMIDSVYHLQHINALHSSFKRWLMTFNGVSTKYIN
NYLAWFKFLQLSKKNKKNDRIKDMLVNVATKDTYVTRATIRNRFIELT
Blast result :ORF 2
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
708 bp | 235 aa | 1281 | 1988 | + | No |
Annotation : Hypothetical proteinDescription :
ORF sequence :
MVKVIRLSLFLIAISLFLTGCSNSKEDITLDINKNENLIDTNNINQIISNDIYSKESEEQELINIIESVEKNKPTMSDEERYDLRTDIFFNLNQEQVLKF
GDCYTALNQVIFDDRYKELFDKANNRWDAYDNNDLYGIVNTIRYISNSVKNQAFKNDLNRIEELCSYGLEYRDIIALIDARRIMRDIQYHIFEVPYFKEG
DAIVEINEEDYSIYYGASEVLEGDRYKTIGIYRYK
GDCYTALNQVIFDDRYKELFDKANNRWDAYDNNDLYGIVNTIRYISNSVKNQAFKNDLNRIEELCSYGLEYRDIIALIDARRIMRDIQYHIFEVPYFKEG
DAIVEINEEDYSIYYGASEVLEGDRYKTIGIYRYK
Blast result :ORF 3
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
348 bp | 115 aa | 2114 | 2461 | + | No |
Annotation : Hypothetical proteinDescription :
ORF sequence :
MKKGDAMKQEKRIYIRKYVSAIIFSNIIVWFSWALPLILLDGIKLNDEYLLQLGFLLRIVLSTIPFIVLFDYTKRKYKENKFTKMCYICSIISMLLLPTL
FFILHLEIGYGGWFW
FFILHLEIGYGGWFW
Blast result :
Comments
ISCba1 is 62% aa similar to ISCac2.
The transposase is the first ORF. There are two others passengers ORFs in this sequence.
The transposase is the first ORF. There are two others passengers ORFs in this sequence.
References
1] Fulton,L., Clifton,S., Fulton,B., Xu,J., Minx,P., Pepin,K.H., Johnson,M., Thiruvilangam,P., Bhonagiri,V., Nash,W.E., Mardis,E.R. and Wilson,R.K.(2007) Direct submission GenBank.