BC142626

LOCUS       BC142626                2575 bp    mRNA    linear   HUM 25-JUL-2007
DEFINITION  Homo sapiens collagen, type IV, alpha 1, mRNA (cDNA clone
            IMAGE:40147488), complete cds.
ACCESSION   BC142626
VERSION     BC142626.1
KEYWORDS    .
SOURCE      Homo sapiens (human)
  ORGANISM  Homo sapiens
            Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
            Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
            Catarrhini; Hominidae; Homo.
REFERENCE   1  (bases 1 to 2575)
  AUTHORS   Strausberg,R.L., Feingold,E.A., Grouse,L.H., Derge,J.G.,
            Klausner,R.D., Collins,F.S., Wagner,L., Shenmen,C.M., Schuler,G.D.,
            Altschul,S.F., Zeeberg,B., Buetow,K.H., Schaefer,C.F., Bhat,N.K.,
            Hopkins,R.F., Jordan,H., Moore,T., Max,S.I., Wang,J., Hsieh,F.,
            Diatchenko,L., Marusina,K., Farmer,A.A., Rubin,G.M., Hong,L.,
            Stapleton,M., Soares,M.B., Bonaldo,M.F., Casavant,T.L.,
            Scheetz,T.E., Brownstein,M.J., Usdin,T.B., Toshiyuki,S.,
            Carninci,P., Prange,C., Raha,S.S., Loquellano,N.A., Peters,G.J.,
            Abramson,R.D., Mullahy,S.J., Bosak,S.A., McEwan,P.J.,
            McKernan,K.J., Malek,J.A., Gunaratne,P.H., Richards,S.,
            Worley,K.C., Hale,S., Garcia,A.M., Gay,L.J., Hulyk,S.W.,
            Villalon,D.K., Muzny,D.M., Sodergren,E.J., Lu,X., Gibbs,R.A.,
            Fahey,J., Helton,E., Ketteman,M., Madan,A., Rodrigues,S.,
            Sanchez,A., Whiting,M., Madan,A., Young,A.C., Shevchenko,Y.,
            Bouffard,G.G., Blakesley,R.W., Touchman,J.W., Green,E.D.,
            Dickson,M.C., Rodriguez,A.C., Grimwood,J., Schmutz,J., Myers,R.M.,
            Butterfield,Y.S., Krzywinski,M.I., Skalska,U., Smailus,D.E.,
            Schnerch,A., Schein,J.E., Jones,S.J. and Marra,M.A.
  CONSRTM   Mammalian Gene Collection Program Team
  TITLE     Generation and initial analysis of more than 15,000 full-length
            human and mouse cDNA sequences
  JOURNAL   Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002)
   PUBMED   12477932
REFERENCE   2  (bases 1 to 2575)
  CONSRTM   NIH MGC Project
  TITLE     Direct Submission
  JOURNAL   Submitted (07-JUN-2007) National Institutes of Health, Mammalian
            Gene Collection (MGC), Bethesda, MD 20892-2590, USA
  REMARK    NIH-MGC Project URL: http://mgc.nci.nih.gov
COMMENT     Contact: MGC help desk
            Email: cgapbs-r@mail.nih.gov
            Tissue Procurement: Novartis Institute for Biomedical Research
            cDNA Library Preparation: Novartis Institute for Biomedical
            Research
            cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL)
            DNA Sequencing by: Sequencing Group at the Stanford Human Genome
            Center, Stanford University School of Medicine, Stanford, CA  94305
            Web site:       http://www-shgc.stanford.edu
            Contact:  (Dickson, Mark) mcd@paxil.stanford.edu
            Dickson, M., Schmutz, J., Grimwood, J., Rodriquez, A., and Myers,
            R. M.
            
            Clone distribution: MGC clone distribution information can be found
            through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov
            Series: IRAK Plate: 306 Row: c Column: 18
            This clone has the following problem: The cds is short compared to
            the longest cds in the locus.
FEATURES             Location/Qualifiers
     source          1..2575
                     /db_xref="H-InvDB:HIT000435329"
                     /organism="Homo sapiens"
                     /mol_type="mRNA"
                     /db_xref="taxon:9606"
                     /clone="IMAGE:40147488"
                     /tissue_type="Donated clones,Novartis FGA collection"
                     /clone_lib="NIH_MGC_417"
                     /lab_host="DH5a"
                     /note="Vector: pCMV-SPORT6"
     gene            1..2575
                     /gene="COL4A1"
                     /gene_synonym="arresten"
                     /db_xref="GeneID:1282"
                     /db_xref="HGNC:HGNC:2202"
                     /db_xref="MIM:120130"
     CDS             105..1664
                     /gene="COL4A1"
                     /gene_synonym="arresten"
                     /codon_start=1
                     /product="COL4A1 protein"
                     /protein_id="AAI42627.1"
                     /db_xref="GeneID:1282"
                     /db_xref="HGNC:HGNC:2202"
                     /db_xref="MIM:120130"
                     /translation="MGPRLSLWLLLLPAALLLHEEHSRAAAKGGCAGSGCGKCDCHGV
                     KGQKGERGLPGLQGVIGFPGMQGPEGPQGPPGQKGDTGEPGLPGTKGTRGPPGASGYP
                     GNPGLPGIPGQDGPPGPPGIPGCNGTKGERGPLGPPGLPGFAGNPGPPGLPGMKGDPG
                     EILGHVPGMLLKGERGFPGIPGTPGPPGLPGLQGPVGPPGFTGPPGPPGPPGPPGEKG
                     QMGLSFQGPKGDKGDQGVSGPPGVPGQAQVQEKGDFATKGEKGQKAEPGFQGMPGVGE
                     KGEPGKPGPRGKPGKDGDKGEKGSPGFPGEPGYPGLIGRQGPQGEKGEAGPPGPPGIV
                     IGTGPLGEKGERGYPGTPGPRGEPGPKGFPGLPGQPGPPGLPVPGQAGAPGFPGERGE
                     KGDRGFPGTSLPGPSGRDGLPGPPGSPGPPGQPGYTNGIVECQPGPPGDQGPPGIPGQ
                     PGFIGEIGEKGQKGESCLICDIDGYRGPPGPQGPPGEIGFPGQPGAKGDRGLPGRDGV
                     AGVPLLFQIHK"
BASE COUNT          707 a          609 c          712 g          547 t
ORIGIN      
        1 cgggacggtg cgtagcgctg gaagtccggc cttccgagag ctagctgtcc gccgcggccc
       61 ccgcacgccg ggcagccgtc cctcgccgcc tcgggcgcgc caccatgggg ccccggctca
      121 gcctctggct gctgctgctg cccgccgccc ttctgctcca cgaggagcac agccgggccg
      181 ctgcgaaggg tggctgtgct ggctctggct gtggcaaatg tgactgccat ggagtgaagg
      241 gacaaaaggg tgaaagaggc ctcccggggt tacaaggtgt cattgggttt cctggaatgc
      301 aaggacctga ggggccacag ggaccaccag gacaaaaggg tgatactgga gaaccaggac
      361 tacctggaac aaaagggaca agaggacctc cgggagcatc tggctaccct ggaaacccag
      421 gacttcccgg aattcctggc caagacggcc cgccaggccc cccaggtatt ccaggatgca
      481 atggcacaaa gggggagaga gggccgctcg ggcctcctgg cttgcctggt ttcgctggaa
      541 atcccggacc accaggctta ccagggatga agggtgatcc aggtgagata cttggccatg
      601 tgcccgggat gctgttgaaa ggtgaaagag gatttcccgg aatcccaggg actccaggcc
      661 caccaggact gccagggctt caaggtcctg ttgggcctcc aggatttacc ggaccaccag
      721 gtcccccagg ccctcccggc cctccaggtg aaaagggaca aatgggctta agttttcaag
      781 gaccaaaagg tgacaagggt gaccaagggg tcagtgggcc tccaggagta ccaggacaag
      841 ctcaagttca agaaaaagga gacttcgcca ccaagggaga aaagggccaa aaagctgaac
      901 ctggatttca ggggatgcca ggggtcggag agaaaggtga acccggaaaa ccaggaccca
      961 gaggcaaacc cggaaaagat ggtgacaaag gggaaaaagg gagtcccggt tttcctggtg
     1021 aacccgggta cccaggactc ataggccgcc agggcccgca gggagaaaag ggtgaagcag
     1081 gtcctcctgg cccacctgga attgttatag gcacaggacc tttgggagaa aaaggagaga
     1141 ggggctaccc tggaactccg gggccaagag gagagccagg cccaaaaggt ttcccaggac
     1201 taccaggcca acccggacct ccaggcctcc ctgtacctgg gcaggctggt gcccctggct
     1261 tccctggtga aagaggagaa aaaggtgacc gaggatttcc tggtacatct ctgccaggac
     1321 caagtggaag agatgggctc ccgggtcctc ctggttcccc tgggccccct gggcagcctg
     1381 gctacacaaa tggaattgtg gaatgtcagc ccggacctcc aggtgaccag ggtcctcctg
     1441 gaattccagg gcagccagga tttataggcg aaattggaga gaaaggtcaa aaaggagaga
     1501 gttgcctcat ctgtgatata gacggatatc gggggcctcc cgggccacag ggacccccgg
     1561 gagaaatagg tttcccaggg cagccagggg ccaagggcga cagaggtttg cctggcagag
     1621 atggtgttgc aggagtgcca ttgctttttc agatccataa atgaaatatc cggatcacat
     1681 tgacatgaaa cctttcaatg gaacaaaata ccagcttctt agcttttgta gtttgtttta
     1741 aaagaatcca ctaaatagaa gagcataata ataatcttga attttgaagg acattatttt
     1801 cttgcatata atgacttctg tttctgaagt tttgaaatct caaggcattg ttcctctcgt
     1861 attttctttg ttcttctgag ctttgcgagc atggactggt ttccacaatt cctttcattc
     1921 ctttttttct ttttgtaaga tattgaaagt caaatttcag aattattcat ttctgatgta
     1981 gcccttcaaa ttttttaatt tttaaagata ttgctggaag cttctacaaa agaaaaccag
     2041 ggcaaaagcg agttgaaata gcaatgaccc agctggaatt cagcaatcat tttctgcttt
     2101 tgaagttaga tcttgggctt ttgctctcca gaacttccct ggtgcctggg gagctgagtt
     2161 agaagttgca attgtttaag atatatctaa ataaattaga agttcaaata actgggtagc
     2221 cctgactgta gtggggatca aagacagaag aactttgaag gaagcagaaa aggacgtttt
     2281 taacctctat gcaccgcttc atctcctggg ctttcctggt ggacttcctg cctcaactct
     2341 ggctgaaact cagtctagac atatctaata aaagacggaa aaagaggaaa gaggtgagaa
     2401 agaaggaata ttgaggaaag atcataatat agaagaaaag aaagaaaaca tacaacccca
     2461 attctactcc ttatgccttc atcaggagct cctttctttc cggagttgga aaaagtctct
     2521 aaaaataaat ttatgggtaa ataattcaaa aaaaaaaaaa aaaaaaaaaa aaaaa
//