BC000102

LOCUS       BC000102                2274 bp    mRNA    linear   HUM 01-SEP-2006
DEFINITION  Homo sapiens collagen, type IV, alpha 3 (Goodpasture antigen)
            binding protein, mRNA (cDNA clone MGC:1410 IMAGE:3505746), complete
            cds.
ACCESSION   BC000102
VERSION     BC000102.2
KEYWORDS    MGC.
SOURCE      Homo sapiens (human)
  ORGANISM  Homo sapiens
            Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
            Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
            Catarrhini; Hominidae; Homo.
REFERENCE   1  (bases 1 to 2274)
  AUTHORS   Strausberg,R.L., Feingold,E.A., Grouse,L.H., Derge,J.G.,
            Klausner,R.D., Collins,F.S., Wagner,L., Shenmen,C.M., Schuler,G.D.,
            Altschul,S.F., Zeeberg,B., Buetow,K.H., Schaefer,C.F., Bhat,N.K.,
            Hopkins,R.F., Jordan,H., Moore,T., Max,S.I., Wang,J., Hsieh,F.,
            Diatchenko,L., Marusina,K., Farmer,A.A., Rubin,G.M., Hong,L.,
            Stapleton,M., Soares,M.B., Bonaldo,M.F., Casavant,T.L.,
            Scheetz,T.E., Brownstein,M.J., Usdin,T.B., Toshiyuki,S.,
            Carninci,P., Prange,C., Raha,S.S., Loquellano,N.A., Peters,G.J.,
            Abramson,R.D., Mullahy,S.J., Bosak,S.A., McEwan,P.J.,
            McKernan,K.J., Malek,J.A., Gunaratne,P.H., Richards,S.,
            Worley,K.C., Hale,S., Garcia,A.M., Gay,L.J., Hulyk,S.W.,
            Villalon,D.K., Muzny,D.M., Sodergren,E.J., Lu,X., Gibbs,R.A.,
            Fahey,J., Helton,E., Ketteman,M., Madan,A., Rodrigues,S.,
            Sanchez,A., Whiting,M., Madan,A., Young,A.C., Shevchenko,Y.,
            Bouffard,G.G., Blakesley,R.W., Touchman,J.W., Green,E.D.,
            Dickson,M.C., Rodriguez,A.C., Grimwood,J., Schmutz,J., Myers,R.M.,
            Butterfield,Y.S., Krzywinski,M.I., Skalska,U., Smailus,D.E.,
            Schnerch,A., Schein,J.E., Jones,S.J. and Marra,M.A.
  CONSRTM   Mammalian Gene Collection Program Team
  TITLE     Generation and initial analysis of more than 15,000 full-length
            human and mouse cDNA sequences
  JOURNAL   Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002)
   PUBMED   12477932
REFERENCE   2  (bases 1 to 2274)
  CONSRTM   NIH MGC Project
  TITLE     Direct Submission
  JOURNAL   Submitted (03-NOV-2000) National Institutes of Health, Mammalian
            Gene Collection (MGC), Bethesda, MD 20892-2590, USA
  REMARK    NIH-MGC Project URL: http://mgc.nci.nih.gov
COMMENT     On Aug 20, 2003 this sequence version replaced BC000102.1.
            Contact: MGC help desk
            Email: cgapbs-r@mail.nih.gov
            Tissue Procurement: ATCC
            cDNA Library Preparation: Rubin Laboratory
            cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL)
            DNA Sequencing by: Institute for Systems Biology
            http://www.systemsbiology.org
            contact: amadan@systemsbiology.org
            Anup Madan, Jessica Fahey, Erin Helton, Mark Ketteman, Anuradha
            Madan, Stephanie Rodrigues, Amy Sanchez and Michelle Whiting
            
            Clone distribution: MGC clone distribution information can be found
            through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov
            Series: IRAL Plate: 7 Row: p Column: 9
            This clone was selected for full length sequencing because it
            passed the following selection criteria: matched mRNA gi: 5031716.
FEATURES             Location/Qualifiers
     source          1..2274
                     /db_xref="H-InvDB:HIT000029346"
                     /organism="Homo sapiens"
                     /mol_type="mRNA"
                     /db_xref="taxon:9606"
                     /clone="MGC:1410 IMAGE:3505746"
                     /tissue_type="Placenta, choriocarcinoma"
                     /clone_lib="NIH_MGC_21"
                     /lab_host="DH10B-R"
                     /note="Vector: pOTB7"
     gene            1..2274
                     /gene="COL4A3BP"
                     /gene_synonym="CERT"
                     /gene_synonym="CERTL"
                     /gene_synonym="GPBP"
                     /gene_synonym="STARD11"
                     /db_xref="GeneID:10087"
                     /db_xref="HGNC:HGNC:2205"
                     /db_xref="MIM:604677"
     CDS             407..2203
                     /gene="COL4A3BP"
                     /gene_synonym="CERT"
                     /gene_synonym="CERTL"
                     /gene_synonym="GPBP"
                     /gene_synonym="STARD11"
                     /codon_start=1
                     /product="COL4A3BP protein"
                     /protein_id="AAH00102.1"
                     /db_xref="GeneID:10087"
                     /db_xref="HGNC:HGNC:2205"
                     /db_xref="MIM:604677"
                     /translation="MSDNQSWNSSGSEEDPETESGPPVERCGVLSKWTNYIHGWQDRW
                     VVLKNNALSYYKSEDETEYGCRGSICLSKAVITPHDFDECRFDISVNDSVWYLRAQDP
                     DHRQQWIDAIEQHKTESGYGSESSLRRHGSMVSLVSGASGYSATSTSSFKKGHSLREK
                     LAEMETFRDILCRQVDTLQKYFDACADAVSKDELQRDKVVEDDEDDFPTTRSDGDFLH
                     STNGNKEKLFPHVTPKGINGIDFKGEAITFKATTAGILATLSHCIELMVKREDSWQKR
                     LDKETEKKRRTEEAYKNAMTELKKKSHFGGPDYEEGPNSLINEEEFFDAVEAALDRQD
                     KIEEQSQSEKVRLHWPTSLPSGDAFSSVGTHRFVQKVEEMVQNHMTYSLQDVGGDANW
                     QLVVEEGEMKVYRREVEENGIVLDPLKATHAVKGVTGHEVCNYFWNVDVRNDWETTIE
                     NFHVVETLADNAIIIYQTHKRVWPASQRDVLYLSVIRKIPALTENDPETWIVCNFSVD
                     HDSAPLNNRCVRAKINVAMICQTLVSPPEGNQEISRDNILCKITYVANVNPGGWAPAS
                     VLRAVAKREYPKFLKRFTSYVQEKTAGKPILF"
BASE COUNT          659 a          470 c          589 g          556 t
ORIGIN      
        1 aggaagatgg cggcggtagc ggaggtgtga gtggacgcgg gactcagcgg ccggattttc
       61 tcttcccttc ttttcccttt tccttcccta tttgaaattg gcatcgaggg ggctaagttc
      121 gggtggcagc gccgggcgca acgcaggggt cacggcgacg gcggcggcgg ctgacggctg
      181 gaagggtagg cttccttcac cgctcgtcct ccttcctcgc tccgctcggt gtcaggcgcg
      241 gcggcggcgc ggcgggcgga cttcgtccct cctcctgctc ccccccacac cggagcgggc
      301 actcttcgct tcgccatccc ccgacccttc accccgagga ctgggcgcct cctccggcgc
      361 agctgaggga gcgggggccg gtctcctgct cggttgtcga gcctccatgt cggataatca
      421 gagctggaac tcgtcgggct cggaggagga tccagagacg gagtctgggc cgcctgtgga
      481 gcgctgcggg gtcctcagta agtggacaaa ctacattcat gggtggcagg atcgttgggt
      541 agttttgaaa aataatgctc tgagttacta caaatctgaa gatgaaacag agtatggctg
      601 cagaggatcc atctgtctta gcaaggctgt catcacacct cacgattttg atgaatgtcg
      661 atttgatatt agtgtaaatg atagtgtttg gtatcttcgt gctcaggatc cagatcatag
      721 acagcaatgg atagatgcca ttgaacagca caagactgaa tctggatatg gatctgaatc
      781 cagcttgcgt cgacatggct caatggtgtc cctggtgtct ggagcaagtg gctactctgc
      841 aacatccacc tcttcattca agaaaggcca cagtttacgt gagaagttgg ctgaaatgga
      901 aacatttaga gacatcttat gtagacaagt tgacacgcta cagaagtact ttgatgcctg
      961 tgctgatgct gtctctaagg atgaacttca aagggataaa gtggtagaag atgatgaaga
     1021 tgactttcct acaacgcgtt ctgatggtga cttcttgcat agtaccaacg gcaataaaga
     1081 aaagttattt ccacatgtga caccaaaagg aattaatggt atagacttta aaggggaagc
     1141 gataactttt aaagcaacta ctgctggaat ccttgcaaca ctttctcatt gtattgaact
     1201 aatggttaaa cgtgaggaca gctggcagaa gagactggat aaggaaactg agaagaaaag
     1261 aagaacagag gaagcatata aaaatgcaat gacagaactt aagaaaaaat cccactttgg
     1321 aggaccagat tatgaagaag gccctaacag tctgattaat gaagaagagt tctttgatgc
     1381 tgttgaagct gctcttgaca gacaagataa aatagaagaa cagtcacaga gtgaaaaggt
     1441 gagattacat tggcctacat ccttgccctc tggagatgcc ttttcttctg tggggacaca
     1501 tagatttgtc caaaaggttg aagagatggt gcagaaccac atgacttact cattacagga
     1561 tgtaggcgga gatgccaatt ggcagttggt tgtagaagaa ggagaaatga aggtatacag
     1621 aagagaagta gaagaaaatg ggattgttct ggatccttta aaagctaccc atgcagttaa
     1681 aggcgtcaca ggacatgaag tctgcaatta tttctggaat gttgacgttc gcaatgactg
     1741 ggaaacaact atagaaaact ttcatgtggt ggaaacatta gctgataatg caatcatcat
     1801 ttatcaaaca cacaagaggg tgtggcctgc ttctcagcga gacgtattat atctttctgt
     1861 cattcgaaag ataccagcct tgactgaaaa tgaccctgaa acttggatag tttgtaattt
     1921 ttctgtggat catgacagtg ctcctctaaa caaccgatgt gtccgtgcca aaataaatgt
     1981 tgctatgatt tgtcaaacct tggtaagccc accagaggga aaccaggaaa ttagcaggga
     2041 caacattcta tgcaagatta catatgtagc taatgtgaac cctggaggat gggcaccagc
     2101 ctcagtgtta agggcagtgg caaagcgaga gtatcctaaa tttctaaaac gttttacttc
     2161 ttacgtccaa gaaaaaactg caggaaagcc tattttgttc tagtattaac agtgactgaa
     2221 gcaaggctgt gtgacattcc atgttgaaaa aaaaaaaaaa aaaaaaaaaa aaaa
//