LOCUS AEE82053.1 359 aa PRT PLN 23-MAR-2023 DEFINITION Arabidopsis thaliana Cysteine proteinases superfamily protein protein. ACCESSION CP002687-339 PROTEIN_ID AEE82053.1 SOURCE Arabidopsis thaliana (thale cress) ORGANISM Arabidopsis thaliana Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliopsida; eudicotyledons; Gunneridae; Pentapetalae; rosids; malvids; Brassicales; Brassicaceae; Camelineae; Arabidopsis. REFERENCE 1 (bases 1 to 18585056) AUTHORS Mayer,K., Schuller,C., Wambutt,R., Murphy,G., Volckaert,G., Pohl,T., Dusterhoft,A., Stiekema,W., Entian,K.D., Terryn,N., Harris,B., Ansorge,W., Brandt,P., Grivell,L., Rieger,M., Weichselgartner,M., de Simone,V., Obermaier,B., Mache,R., Muller,M., Kreis,M., Delseny,M., Puigdomenech,P., Watson,M., Schmidtheini,T., Reichert,B., Portatelle,D., Perez-Alonso,M., Boutry,M., Bancroft,I., Vos,P., Hoheisel,J., Zimmermann,W., Wedler,H., Ridley,P., Langham,S.A., McCullagh,B., Bilham,L., Robben,J., Van der Schueren,J., Grymonprez,B., Chuang,Y.J., Vandenbussche,F., Braeken,M., Weltjens,I., Voet,M., Bastiaens,I., Aert,R., Defoor,E., Weitzenegger,T., Bothe,G., Ramsperger,U., Hilbert,H., Braun,M., Holzer,E., Brandt,A., Peters,S., van Staveren,M., Dirske,W., Mooijman,P., Klein Lankhorst,R., Rose,M., Hauf,J., Kotter,P., Berneiser,S., Hempel,S., Feldpausch,M., Lamberth,S., Van den Daele,H., De Keyser,A., Buysshaert,C., Gielen,J., Villarroel,R., De Clercq,R., Van Montagu,M., Rogers,J., Cronin,A., Quail,M., Bray-Allen,S., Clark,L., Doggett,J., Hall,S., Kay,M., Lennard,N., McLay,K., Mayes,R., Pettett,A., Rajandream,M.A., Lyne,M., Benes,V., Rechmann,S., Borkova,D., Blocker,H., Scharfe,M., Grimm,M., Lohnert,T.H., Dose,S., de Haan,M., Maarse,A., Schafer,M., Muller-Auer,S., Gabel,C., Fuchs,M., Fartmann,B., Granderath,K., Dauner,D., Herzl,A., Neumann,S., Argiriou,A., Vitale,D., Liguori,R., Piravandi,E., Massenet,O., Quigley,F., Clabauld,G., Mundlein,A., Felber,R., Schnabl,S., Hiller,R., Schmidt,W., Lecharny,A., Aubourg,S., Chefdor,F., Cooke,R., Berger,C., Montfort,A., Casacuberta,E., Gibbons,T., Weber,N., Vandenbol,M., Bargues,M., Terol,J., Torres,A., Perez-Perez,A., Purnelle,B., Bent,E., Johnson,S., Tacon,D., Jesse,T., Heijnen,L., Schwarz,S., Scholler,P., Heber,S., Francs,P., Bielke,C., Frishman,D., Haase,D., Lemcke,K., Mewes,H.W., Stocker,S., Zaccaria,P., Bevan,M., Wilson,R.K., de la Bastide,M., Habermann,K., Parnell,L., Dedhia,N., Gnoj,L., Schutz,K., Huang,E., Spiegel,L., Sehkon,M., Murray,J., Sheet,P., Cordes,M., Abu-Threideh,J., Stoneking,T., Kalicki,J., Graves,T., Harmon,G., Edwards,J., Latreille,P., Courtney,L., Cloud,J., Abbott,A., Scott,K., Johnson,D., Minx,P., Bentley,D., Fulton,B., Miller,N., Greco,T., Kemp,K., Kramer,J., Fulton,L., Mardis,E., Dante,M., Pepin,K., Hillier,L., Nelson,J., Spieth,J., Ryan,E., Andrews,S., Geisel,C., Layman,D., Du,H., Ali,J., Berghoff,A., Jones,K., Drone,K., Cotton,M., Joshu,C., Antonoiu,B., Zidanic,M., Strong,C., Sun,H., Lamar,B., Yordan,C., Ma,P., Zhong,J., Preston,R., Vil,D., Shekher,M., Matero,A., Shah,R., Swaby,I.K., O'Shaughnessy,A., Rodriguez,M., Hoffmann,J., Till,S., Granat,S., Shohdy,N., Hasegawa,A., Hameed,A., Lodhi,M., Johnson,A., Chen,E., Marra,M., Martienssen,R. and McCombie,W.R. TITLE Sequence and analysis of chromosome 4 of the plant Arabidopsis thaliana JOURNAL Nature 402 (6763), 769-777 (1999) PUBMED 10617198 REFERENCE 2 (bases 1 to 18585056) AUTHORS Swarbreck,D., Lamesch,P., Wilks,C. and Huala,E. CONSRTM TAIR TITLE Direct Submission JOURNAL Submitted (18-FEB-2011) Department of Plant Biology, Carnegie Institution, 260 Panama Street, Stanford, CA, USA REFERENCE 3 (bases 1 to 18585056) AUTHORS Krishnakumar,V., Cheng,C.-Y., Chan,A.P., Schobel,S., Kim,M., Ferlanti,E.S., Belyaeva,I., Rosen,B.D., Micklem,G., Miller,J.R., Vaughn,M. and Town,C.D. TITLE Direct Submission JOURNAL Submitted (17-MAY-2016) Plant Genomics, J. Craig Venter Institute, 9704 Medical Center Dr, Rockville, MD 20850, USA REMARK Protein update by submitter FEATURES Qualifiers source /organism="Arabidopsis thaliana" /mol_type="genomic DNA" /db_xref="taxon:3702" /chromosome="4" /ecotype="Columbia" protein /locus_tag="AT4G01610" /gene_synonym="T15B16.17" /gene_synonym="T15B16_17" /inference="Similar to RNA sequence, EST:INSD:AV564487.1,INSD:ES176689.1,INSD:EH923944.1, INSD:EL123721.1,INSD:ES010431.1,INSD:ES008908.1, INSD:BP621206.1,INSD:AV559482.1,INSD:BP564481.1, INSD:DR269721.1,INSD:ES134936.1,INSD:BP585692.1, INSD:EL079000.1,INSD:BP804035.1,INSD:DR269756.1, INSD:ES106099.1,INSD:Z46822.1,INSD:ES216027.1, INSD:EL039993.1,INSD:CD534748.1,INSD:DR269701.1, INSD:ES069415.1,INSD:CD533892.1,INSD:AA728706.1, INSD:BP632906.1,INSD:AV785528.1,INSD:BP617262.1, INSD:EH799631.1,INSD:EL034210.1,INSD:AV545720.1, INSD:EL158721.1,INSD:EL307781.1,INSD:EL074819.1, INSD:CD532922.1,INSD:CB254624.1,INSD:DR269696.1, INSD:DR269749.1,INSD:EL127097.1,INSD:EL210254.1, INSD:DR269705.1,INSD:DR269734.1,INSD:EH873249.1, INSD:BP608211.1,INSD:CB262068.1,INSD:BP613829.1, INSD:AV538502.1,INSD:AV566112.1,INSD:EL046993.1, INSD:EL306790.1,INSD:BE038124.1,INSD:ES202993.1, INSD:EL340182.1,INSD:DR269724.1,INSD:ES000292.1, INSD:T22201.1,INSD:CD528941.1,INSD:BP590481.1, INSD:DR269739.1,INSD:R30360.1,INSD:BP564797.1, INSD:EH836476.1,INSD:EH870786.1,INSD:CD532466.1, INSD:T76488.1,INSD:DR373241.1,INSD:ES206533.1, INSD:EH846385.1,INSD:BP796994.1,INSD:EH917066.1, INSD:EH838216.1,INSD:EL330028.1,INSD:EL169107.1, INSD:EL104533.1,INSD:ES205387.1,INSD:EL240508.1, INSD:AV814645.1,INSD:DR354995.1,INSD:AV537332.1, INSD:AV541257.1,INSD:CD530042.1,INSD:EL176558.1, INSD:AV562180.1,INSD:AV784828.1,INSD:BP588637.1, INSD:EH902307.1,INSD:EL194579.1,INSD:BP569292.1, INSD:BP618353.1,INSD:AV550808.1,INSD:DR269750.1, INSD:EL183282.1,INSD:EL231738.1,INSD:Z47590.1, INSD:BP566429.1,INSD:EH974804.1,INSD:BP801737.1, INSD:T45907.1,INSD:DR269751.1,INSD:BP562229.1, INSD:EL215668.1,INSD:EL165545.1,INSD:BP800059.1, INSD:CD533856.1,INSD:EL014316.1,INSD:DR269755.1, INSD:DR269709.1,INSD:EG433429.1,INSD:BP620619.1, INSD:T46545.1,INSD:EH978055.1,INSD:AV814991.1, INSD:DR269712.1,INSD:EL283106.1,INSD:DR269718.1, INSD:AV562646.1,INSD:EH977898.1,INSD:EL246438.1, INSD:ES007255.1,INSD:EH953327.1,INSD:DR269728.1, INSD:BP582883.1,INSD:BP588287.1,INSD:DR269700.1, INSD:BP808564.1,INSD:BP574069.1,INSD:DR354994.1, INSD:ES095487.1,INSD:DR269754.1,INSD:EH841735.1, INSD:DR269748.1,INSD:EH944533.1,INSD:EL250863.1, INSD:ES001546.1,INSD:EL256991.1,INSD:BP807638.1, INSD:EL335166.1,INSD:EL282139.1,INSD:AV794552.1, INSD:EL261870.1,INSD:DR269708.1,INSD:DR269707.1, INSD:DR269731.1,INSD:EL259584.1,INSD:CB256512.1, INSD:EH805272.1,INSD:EL339804.1,INSD:BP864811.1, INSD:BP606674.1,INSD:CD533290.1,INSD:EL329298.1, INSD:EH874244.1,INSD:ES051674.1,INSD:AV559825.1, INSD:EL226433.1,INSD:T45648.1,INSD:DR269740.1, INSD:DR269738.1,INSD:DR269732.1,INSD:T13638.1, INSD:BP600710.1,INSD:EH919372.1,INSD:BP582091.1, INSD:DR269720.1,INSD:H76897.1,INSD:EL107676.1, INSD:DR269759.1,INSD:Z29751.1,INSD:DR269699.1, INSD:EH813838.1,INSD:EL065407.1,INSD:AV558950.1, INSD:ES002027.1,INSD:EL265291.1,INSD:DR269713.1, INSD:BE520912.1,INSD:ES111754.1,INSD:DR269715.1, INSD:EH966147.1,INSD:CD531772.1,INSD:DR269742.1, INSD:EL125192.1,INSD:EL014204.1,INSD:CD530455.1, INSD:BP621791.1,INSD:DR269737.1,INSD:ES112007.1, INSD:EL055315.1,INSD:AV521514.1,INSD:ES018831.1, INSD:EL323106.1,INSD:ES106676.1,INSD:BE520201.1, INSD:ES157775.1,INSD:EH968761.1,INSD:EL036444.1, INSD:BP585842.1,INSD:ES178312.1,INSD:EL210464.1, INSD:BP578257.1,INSD:EH841917.1,INSD:AV538467.1, INSD:EL119961.1,INSD:BP581366.1,INSD:DR269706.1, INSD:EH821938.1,INSD:ES177155.1,INSD:EL184733.1, INSD:BP611816.1,INSD:AV550753.1,INSD:CB263371.1, INSD:ES035425.1,INSD:EH804989.1,INSD:BP572600.1, INSD:BP608200.1,INSD:ES084987.1,INSD:EG525772.1, INSD:EL017750.1,INSD:BE523226.1,INSD:AV526649.1, INSD:EL207565.1,INSD:BP614495.1,INSD:CD534740.1, INSD:ES093871.1,INSD:EH868124.1,INSD:ES010126.1, INSD:EL130296.1,INSD:EL996169.1,INSD:CD531817.1, INSD:BP785521.1,INSD:BP595725.1,INSD:ES047534.1, INSD:BP591677.1,INSD:EH821543.1,INSD:DR269714.1, INSD:AV798963.1,INSD:EL311598.1,INSD:EH912872.1, INSD:ES095402.1,INSD:BP612662.1,INSD:BP617340.1, INSD:DR269725.1,INSD:EL218518.1,INSD:DR269726.1, INSD:ES107324.1,INSD:AA728599.1,INSD:EL020671.1, INSD:BE038285.1,INSD:DR269747.1,INSD:EL116128.1, INSD:EH944930.1,INSD:EL183553.1,INSD:EH969774.1, INSD:DR269757.1,INSD:DR269697.1,INSD:AV783453.1, INSD:DR269719.1,INSD:EL090043.1,INSD:ES044209.1, INSD:EH857245.1,INSD:BP597434.1,INSD:EL327004.1, INSD:EL104465.1,INSD:EL061587.1,INSD:EL339968.1, INSD:DR269698.1,INSD:EL022669.1,INSD:BP613085.1, INSD:AV558532.1,INSD:ES135229.1,INSD:AV822641.1, INSD:EH902153.1,INSD:EL256437.1,INSD:EL004815.1, INSD:ES088348.1,INSD:DR269704.1,INSD:EL225795.1, INSD:EL261441.1,INSD:EH976383.1,INSD:EL051790.1, INSD:AV554585.1,INSD:R30168.1,INSD:DR269735.1, INSD:BE520911.1,INSD:DR269716.1,INSD:DR269758.1, INSD:BP612656.1,INSD:DR269753.1,INSD:ES117614.1, INSD:EH900337.1,INSD:EH980607.1,INSD:EH964509.1, INSD:ES214225.1,INSD:N65113.1,INSD:T76486.1, INSD:DR269729.1,INSD:BP566207.1,INSD:ES022268.1, INSD:BP665217.1,INSD:DR269736.1,INSD:EL203883.1, INSD:BP671240.1,INSD:EL062534.1,INSD:AV806396.1, INSD:EL209140.1,INSD:N65712.1,INSD:EH877182.1, INSD:EH905749.1,INSD:EH909692.1,INSD:DR269717.1, INSD:EL206285.1,INSD:EL180297.1,INSD:DR269745.1, INSD:EL300428.1,INSD:AV823778.1,INSD:BP608220.1, INSD:BP586091.1,INSD:EH835889.1,INSD:BP589509.1, INSD:BP633815.1,INSD:DR269723.1,INSD:EL247975.1, INSD:Z46821.1,INSD:EL313009.1,INSD:BP811328.1, INSD:EL064256.1,INSD:DR269733.1,INSD:BP564382.1, INSD:ES093468.1,INSD:EH892474.1,INSD:ES174454.1, INSD:T43055.1,INSD:CD528993.1,INSD:BP578500.1, INSD:AV541002.1,INSD:EL979311.1,INSD:AV550506.1, INSD:ES103099.1,INSD:BP844758.1,INSD:ES178395.1, INSD:EL263833.1,INSD:DR269743.1,INSD:CD533190.1, INSD:CB256980.1,INSD:EL126343.1,INSD:ES064886.1, INSD:EL051979.1,INSD:EH952301.1,INSD:DR269752.1, INSD:BE520202.1,INSD:BP861107.1,INSD:ES070309.1, INSD:ES022823.1,INSD:R84118.1,INSD:EL092039.1, INSD:EH974376.1,INSD:BP598829.1,INSD:EH958478.1, INSD:EL224872.1,INSD:EL147211.1,INSD:CD534721.1, INSD:EH989254.1,INSD:EL337669.1,INSD:EL038091.1, INSD:EH826346.1,INSD:DR269711.1,INSD:DR269722.1, INSD:ES198197.1,INSD:EG523982.1,INSD:DR269710.1, INSD:BP846162.1,INSD:DR269703.1,INSD:ES030947.1, INSD:EL047243.1,INSD:Z29752.1,INSD:BP587542.1, INSD:EH888455.1,INSD:EH982396.1,INSD:BP621384.1, INSD:ES190936.1,INSD:DR269730.1,INSD:AV786492.1, INSD:EG525771.1,INSD:EH904817.1,INSD:EH879790.1, INSD:EG433418.1" /inference="Similar to RNA sequence, mRNA:INSD:AY065167.1,INSD:AK221398.1,INSD:AK176281.1, INSD:AK176433.1,INSD:AK176416.1,INSD:AF083797.1, INSD:AK176165.1,INSD:AK176487.1,INSD:AK175539.1, INSD:AK176244.1,INSD:AK176330.1,INSD:AK175481.1, INSD:AF370193.1,INSD:AK230235.1,INSD:AK175280.1, INSD:AY086034.1,INSD:AY114015.1,INSD:BT001190.1" /note="Cysteine proteinases superfamily protein; FUNCTIONS IN: cysteine-type endopeptidase activity, cysteine-type peptidase activity; INVOLVED IN: proteolysis, regulation of catalytic activity; LOCATED IN: vacuole; EXPRESSED IN: 22 plant structures; EXPRESSED DURING: 13 growth stages; CONTAINS InterPro DOMAIN/s: Peptidase C1A, papain (InterPro:IPR013128), Peptidase C1A, cathepsin B (InterPro:IPR015643), Peptidase C1A, papain C-terminal (InterPro:IPR000668), Peptidase, cysteine peptidase active site (InterPro:IPR000169), Peptidase C1A, propeptide (InterPro:IPR012599); BEST Arabidopsis thaliana protein match is: Cysteine proteinases superfamily protein (TAIR:AT1G02305.1); Has 7406 Blast hits to 7364 proteins in 687 species: Archae - 57; Bacteria - 153; Metazoa - 3244; Fungi - 4; Plants - 1710; Viruses - 146; Other Eukaryotes - 2092 (source: NCBI BLink)." /db_xref="TAIR:AT4G01610" /db_xref="Araport:AT4G01610" intron_pos 27:0 (1/9) intron_pos 45:0 (2/9) intron_pos 72:0 (3/9) intron_pos 126:0 (4/9) intron_pos 151:0 (5/9) intron_pos 193:0 (6/9) intron_pos 266:0 (7/9) intron_pos 304:0 (8/9) intron_pos 316:0 (9/9) BEGIN 1 MAVYNTKLCL ASVFLLLGLL LAFDLKGIEA ESLTKQKLDS KILQDEIVKK VNENPNAGWK 61 AAINDRFSNA TVAEFKRLLG VKPTPKKHFL GVPIVSHDPS LKLPKAFDAR TAWPQCTSIG 121 NILGLGHCGS CWAFGAVESL SDRFCIQFGM NISLSVNDLL ACCGFRCGDG CDGGYPIAAW 181 QYFSYSGVVT EECDPYFDNT GCSHPGCEPA YPTPKCSRKC VSDNKLWSES KHYSVSTYTV 241 KSNPQDIMAE VYKNGPVEVS FTVYEDFAHY KSGVYKHITG SNIGGHAVKL IGWGTSSEGE 301 DYWLMANQWN RGWGDDGYFM IRRGTNECGI EDEPVAGLPS SKNVFRVDTG SNDLPVASV //