BC042168

LOCUS       BC042168                1500 bp    mRNA    linear   HUM 15-JUL-2006
DEFINITION  Homo sapiens cathepsin Z, mRNA (cDNA clone MGC:52255
            IMAGE:5018854), complete cds.
ACCESSION   BC042168
VERSION     BC042168.1
KEYWORDS    MGC.
SOURCE      Homo sapiens (human)
  ORGANISM  Homo sapiens
            Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
            Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
            Catarrhini; Hominidae; Homo.
REFERENCE   1  (bases 1 to 1500)
  AUTHORS   Strausberg,R.L., Feingold,E.A., Grouse,L.H., Derge,J.G.,
            Klausner,R.D., Collins,F.S., Wagner,L., Shenmen,C.M., Schuler,G.D.,
            Altschul,S.F., Zeeberg,B., Buetow,K.H., Schaefer,C.F., Bhat,N.K.,
            Hopkins,R.F., Jordan,H., Moore,T., Max,S.I., Wang,J., Hsieh,F.,
            Diatchenko,L., Marusina,K., Farmer,A.A., Rubin,G.M., Hong,L.,
            Stapleton,M., Soares,M.B., Bonaldo,M.F., Casavant,T.L.,
            Scheetz,T.E., Brownstein,M.J., Usdin,T.B., Toshiyuki,S.,
            Carninci,P., Prange,C., Raha,S.S., Loquellano,N.A., Peters,G.J.,
            Abramson,R.D., Mullahy,S.J., Bosak,S.A., McEwan,P.J.,
            McKernan,K.J., Malek,J.A., Gunaratne,P.H., Richards,S.,
            Worley,K.C., Hale,S., Garcia,A.M., Gay,L.J., Hulyk,S.W.,
            Villalon,D.K., Muzny,D.M., Sodergren,E.J., Lu,X., Gibbs,R.A.,
            Fahey,J., Helton,E., Ketteman,M., Madan,A., Rodrigues,S.,
            Sanchez,A., Whiting,M., Madan,A., Young,A.C., Shevchenko,Y.,
            Bouffard,G.G., Blakesley,R.W., Touchman,J.W., Green,E.D.,
            Dickson,M.C., Rodriguez,A.C., Grimwood,J., Schmutz,J., Myers,R.M.,
            Butterfield,Y.S., Krzywinski,M.I., Skalska,U., Smailus,D.E.,
            Schnerch,A., Schein,J.E., Jones,S.J. and Marra,M.A.
  CONSRTM   Mammalian Gene Collection Program Team
  TITLE     Generation and initial analysis of more than 15,000 full-length
            human and mouse cDNA sequences
  JOURNAL   Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002)
   PUBMED   12477932
REFERENCE   2  (bases 1 to 1500)
  CONSRTM   NIH MGC Project
  TITLE     Direct Submission
  JOURNAL   Submitted (02-JAN-2003) National Institutes of Health, Mammalian
            Gene Collection (MGC), Bethesda, MD 20892-2590, USA
  REMARK    NIH-MGC Project URL: http://mgc.nci.nih.gov
COMMENT     Contact: MGC help desk
            Email: cgapbs-r@mail.nih.gov
            Tissue Procurement: ATCC
            cDNA Library Preparation: Rubin Laboratory
            cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL)
            DNA Sequencing by: National Institutes of Health Intramural
            Sequencing Center (NISC),
            Gaithersburg, Maryland;
            Web site: http://www.nisc.nih.gov/
            Contact: nisc_mgc@nhgri.nih.gov
            Akhter,N., Ayele,K., Beckstrom-Sternberg,S.M., Benjamin,B.,
            Blakesley,R.W., Bouffard,G.G., Breen,K., Brinkley,C., Brooks,S.,
            Dietrich,N.L., Granite,S., Guan,X., Gupta,J., Haghighi,P.,
            Hansen,N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R.,
            Maduro,Q.L., Masiello,C., Maskeri,B., Mastrian,S.D.,McCloskey,J.C.,
            McDowell,J., Pearson,R., Stantripop,S., Thomas,P.J., Touchman,J.W.,
            Tsurgeon,C., Vogt,J.L., Walker,M.A., Wetherby,K.D., Wiggins,L.,
            Young,A., Zhang,L.-H. and Green,E.D.
            
            Clone distribution: MGC clone distribution information can be found
            through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov
            Series: IRAL Plate: 44 Row: h Column: 20
            This clone was selected for full length sequencing because it
            passed the following selection criteria: matched mRNA gi: 22538441.
FEATURES             Location/Qualifiers
     source          1..1500
                     /db_xref="H-InvDB:HIT000052666"
                     /organism="Homo sapiens"
                     /mol_type="mRNA"
                     /db_xref="taxon:9606"
                     /clone="MGC:52255 IMAGE:5018854"
                     /tissue_type="Pancreas, epithelioid carcinoma"
                     /clone_lib="NIH_MGC_42"
                     /lab_host="DH10B-R"
                     /note="Vector: pOTB7"
     gene            1..1500
                     /gene="CTSZ"
                     /gene_synonym="CTSX"
                     /db_xref="GeneID:1522"
                     /db_xref="HGNC:HGNC:2547"
                     /db_xref="MIM:603169"
     CDS             110..1021
                     /gene="CTSZ"
                     /gene_synonym="CTSX"
                     /codon_start=1
                     /product="cathepsin Z"
                     /protein_id="AAH42168.1"
                     /db_xref="GeneID:1522"
                     /db_xref="HGNC:HGNC:2547"
                     /db_xref="MIM:603169"
                     /translation="MARRGPGWRPLLLLVLLAGAAQGGLYFRRGQTCYRPLRGDGLAP
                     LGRSTYPRPHEYLSPADLPKSWDWRNVDGVNYASITRNQHIPQYCGSCWAHASTSAMA
                     DRINIKRKGAWPSTLLSVQNVIDCGNAGSCEGGNDLSVWDYAHQHGIPDETCNNYQAK
                     DQECDKFNQCGTCNEFKECHAIRNYTLWRVGDYGSLSGREKMMAEIYANGPISCGIMA
                     TERLANYTGGIYAEYQDTTYINHVVSVAGWGISDGTEYWIVRNSWGEPWGERGWLRIV
                     TSTYKDGKGARYNLAIEEHCTFGDPIV"
BASE COUNT          359 a          377 c          485 g          279 t
ORIGIN      
        1 gggtgctggg ccgaggccga ggccggggcg ggatccagag cgggagccgg cgcgggatct
       61 gggactcgga gcgggatccg gagcgggacc caggagccgg cgcggggcca tggcgaggcg
      121 cgggccaggg tggcggccgc ttctgctgct cgtgctgctg gcgggcgcgg cgcagggcgg
      181 cctctacttc cgccggggac agacctgcta ccggcctctg cggggggacg ggctggctcc
      241 gctggggcgc agcacatacc cccggcctca tgagtacctg tccccagcgg atctgcccaa
      301 gagctgggac tggcgcaatg tggatggtgt caactatgcc agcatcaccc ggaaccagca
      361 catcccccaa tactgcggct cctgctgggc ccacgccagc accagcgcta tggcggatcg
      421 gatcaacatc aagaggaagg gagcgtggcc ctccaccctc ctgtccgtgc agaacgtcat
      481 cgactgcggt aacgctggct cctgtgaagg gggtaatgac ctgtccgtgt gggactacgc
      541 ccaccagcac ggcatccctg acgagacctg caacaactac caggccaagg accaggagtg
      601 tgacaagttt aaccaatgtg ggacatgcaa tgaattcaaa gagtgccacg ccatccggaa
      661 ctacaccctc tggagggtgg gagactacgg ctccctctct gggagggaga agatgatggc
      721 agaaatctac gcaaatggtc ccatcagctg tggaataatg gcaacagaaa gactggctaa
      781 ctacaccgga ggcatctatg ccgaatacca ggacaccaca tatataaacc atgtcgtttc
      841 tgtggctggg tggggcatca gtgatgggac tgagtactgg attgtccgga attcatgggg
      901 tgaaccatgg ggcgagagag gctggctgag gatcgtgacc agcacctata aggatgggaa
      961 gggcgccaga tacaaccttg ccatcgagga gcactgtaca tttggggacc ccatcgttta
     1021 aggccatgtc actagaagcg cagtttaaga aaaggcatgg tgacccatga ccagagggga
     1081 tcctatggtt atgtgtgcca ggctggctgg caggaactgg ggtggctatc aatattggat
     1141 ggcgaggaca gcgtggcact ggctgcgagt gttcctgaga gttgaaagtg ggatgactta
     1201 tgacacttgc acagcatggc tctgcctcac aatgatgcag tcagccacct ggtgaagaag
     1261 tgacctgcga cacaggaaac gatgggacct cagtcttctt cagcagagga cttgatattt
     1321 tgtatttggc aactgtgggc aataatatgg catttaagag gtgaaagagt tcagacttat
     1381 caccattctt atgtcacttt agaatcaagg gtgggggagg gagggaggga gttggcagtt
     1441 tcaaatcgcc caagtgatga ataaagtatc tggctctgca cgaaaaaaaa aaaaaaaaaa
//