VTW47580.1

LOCUS       VTW47580.1              2111 aa    PRT              CON 06-FEB-2024
DEFINITION  Caenorhabditis elegans EGF-like domain-containing protein protein.
ACCESSION   BX284606-1750
PROTEIN_ID  VTW47580.1
SOURCE      Caenorhabditis elegans
  ORGANISM  Caenorhabditis elegans
            Eukaryota; Metazoa; Ecdysozoa; Nematoda; Chromadorea; Rhabditida;
            Rhabditina; Rhabditomorpha; Rhabditoidea; Rhabditidae; Peloderinae;
            Caenorhabditis.
REFERENCE   1  (bases 1 to 17718942)
  AUTHORS   WormBase.
  CONSRTM   WormBase Consortium
  JOURNAL   Submitted (04-FEB-2024) to the INSDC. WormBase Group, European
            Bioinformatics Institute, Cambridge, CB10 1SA, UK. Email:
            help@wormbase.org
REFERENCE   2  (bases 1 to 17718942)
  AUTHORS   Sulson J.E., Waterston R.
  JOURNAL   Submitted (03-MAR-2003) to the INSDC. Nematode Sequencing Project:
            Sanger Institute, Hinxton, Cambridge CB10 1SA, UK and The Genome
            Institute at Washington University, St. Louis, MO 63110, USA.
REFERENCE   3  (bases 1 to 17718942)
  AUTHORS   Sulson J.E., Waterston R.
  CONSRTM   Caenorhabditis elegans Sequencing Consortium
  TITLE     Genome sequence of the nematode C. elegans: a platform for
            investigating biology
  JOURNAL   Science 282(5396), 2012-2018(1998).
COMMENT     Annotated features correspond to WormBase release WS292.
            Protein-coding gene structures below are the result of integration
            and manual review of the following types of data: ab initio
            predictions by Genefinder (P. Green and L. Hillier, pers. comm.);
            alignments to published proteins and cDNAs; genome sequence
            conservation with other nematodes (e.g. to C. briggsae using WABA:
            Genome Res. 2000. 10:1115-1125); sequence features (such as
            trans-splice and polyA sites).
            Sources of data: large-scale EST projects of Yuji Kohara
            (http://www.ddbj.nig.ac.jp/c-elegans/html/CE_INDEX.html); ORFeome
            cloning project (http://worfdb.dfci.harvard.edu); RST large-scale
            sequencing project (Genome Res. 2009. 19:2334-2342); IST library
            (Science. 2004. 303:540-3); RT-PCR EST set (Ewing B. Green P. 2010
            Unpublished); UTRome EST data submission (UTRome v1 Mangone M.
            Piano F. 2009); TEC-RED data (PNAS 2004. 101:1650-1655); RNA Deep
            sequencing data (454 read clusters - Makedonka Mitreva,
            unpublished; Illumina sequence data, Genome Res. 2009. 19:657-66);
            Numerous data sets from the modENCODE project (Science. 2010.
            330:1775-87); Individual C. elegans Nucleotide Database
            submissions; Personal communications with C. elegans researchers;
            Non-Coding gene structures below are derived using the following
            methods and data: ab initio prediction of tRNAs by tRNAscan-SE
            (Nucl. Acids. Res., 25, 955-964); integration and appraisal of
            miRNAs from miRBase (http://www.mirbase.org); integration and
            appraisal of RFAM predictions (rfam.sanger.ac.uk); 21U-RNAs (Cell.
            2006. 127:1193-1207); modENCODE data (Science. 2010. 330:1775-87);
            manual curation of novel published ncRNAs from the literature.
FEATURES             Qualifiers
     source          /organism="Caenorhabditis elegans"
                     /chromosome="X"
                     /strain="Bristol N2"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:6239"
     protein         /transl_table=1
                     /gene="chts-1"
                     /locus_tag="CELE_F48E3.8"
                     /standard_name="F48E3.8f"
                     /note="Partially confirmed by transcript evidence"
                     /db_xref="UniProtKB/TrEMBL:A0A4V0INH8"
                     /db_xref="WormBase:WBGene00018607"
     intron_pos      12:1 (1/34)
     intron_pos      91:1 (2/34)
     intron_pos      114:1 (3/34)
     intron_pos      140:2 (4/34)
     intron_pos      178:1 (5/34)
     intron_pos      240:1 (6/34)
     intron_pos      299:1 (7/34)
     intron_pos      354:1 (8/34)
     intron_pos      398:1 (9/34)
     intron_pos      439:1 (10/34)
     intron_pos      482:1 (11/34)
     intron_pos      606:0 (12/34)
     intron_pos      656:1 (13/34)
     intron_pos      740:1 (14/34)
     intron_pos      823:1 (15/34)
     intron_pos      878:1 (16/34)
     intron_pos      981:1 (17/34)
     intron_pos      1113:1 (18/34)
     intron_pos      1156:1 (19/34)
     intron_pos      1196:1 (20/34)
     intron_pos      1238:1 (21/34)
     intron_pos      1300:1 (22/34)
     intron_pos      1408:1 (23/34)
     intron_pos      1436:1 (24/34)
     intron_pos      1546:0 (25/34)
     intron_pos      1638:0 (26/34)
     intron_pos      1684:0 (27/34)
     intron_pos      1727:1 (28/34)
     intron_pos      1790:1 (29/34)
     intron_pos      1836:1 (30/34)
     intron_pos      1927:2 (31/34)
     intron_pos      1985:0 (32/34)
     intron_pos      2033:1 (33/34)
     intron_pos      2077:1 (34/34)
BEGIN
        1 MRLLFLVFIL AEIMLQNEIM ADHRTINQSF RGNFFRRRNY DGPRAYQIAP DLTCSYDNQC
       61 AGYPLAICHS VCQCVKGALN TGTTCIASST AIQTSVACPA GQTYIREAGV CMTVQQPGEP
      121 CQYSQQCSAL EPGAYCLKMR CECVYGMKKS SNGCTFVNND CKERGHIFIS EIGECREVFP
      181 PGGKGCSHNL QCSGAYPDAT CFMQTCTCPP NLPVAADGTC GRSCPNNQVY SGVTGECLPE
      241 KQPGQDCIYS SQCQASFGGL VCDKNTCRCP NGLVFDGLKC SHGCPPHKRV IDKEICVEGC
      301 PSGIVEVAGR CVKQVSIGQP CVANAQCNFG SFCQSGTCQC PPGFYVQDEQ CQAIESEPNE
      361 SCQNNEKCTK GSVCYNGKCS CPRNHELING HCQQNRAAAH AYNTALENIR KIRLRFASQS
      421 KSRNSSPQLT DVENDNDTVP IGSACVRIGV TCDGGSVCVA GICVCPLGKT PRNGVCIEHV
      481 AARPGTSCQN EEECVDHSYC SPETNKCECM KASQMVIGGE CRERLKAHPG YGCTMGEMCV
      541 GNSVCVNGKC ACVDGKVEIN KICIDQVSAK PGDTCGKGII CEGGSYCNTD SGKCACRRGE
      601 NSINGICKGF TFVYPGDLCT DITSRCTGGS YCARGRCECP PRMSAIDKKC VHQQTAAPGE
      661 PCSEKVACSP FSVCENNVCK CVNNMMIRDK MCVQRRKVNI GNSCNNEDQC LGNSTCMDNN
      721 CQCGIGFVAS MDVCVLRKTV TPGYLCNPED ICTGQSVCIK GVCQCQPDYK QMHNICVKKN
      781 IGIEGSPCSS RDDCGEGLMC GASGKCSCPE GLFSVNGKCR SYVQLGQTCT SDDRCAERNA
      841 QCQENYCTCR TGYTNINGQC AANIVTPAEP ETLSQVKSGL LGHICTSNDH CKIAHSQCRR
      901 NVCQCIDGYR IFGSTQCIPR PGKPKERKTE KESKLVELGD KCDKLSLCSK GAICEKGVCS
      961 CPETFFESDG ACVKNVAKIK VVVPPLSSCL GGEECSGNSE CVHGICFCKE EFTLFEGKCQ
     1021 RLRIIEKLTV LESKKLIKPI KAHTTPTAAS NTTPIPVKTT TTLQTTTATT LPENYVSSST
     1081 NRPLTPIIIS MKLGSTSSPS PQITSNPEYK WRLSKPGHMC DNKTHCTNCS VCVNGFCRCP
     1141 EGLVHYGDKC VSEIDATKCL ASNQCPSGAQ CVKGECRCKP GLGITRYGFC VPITFAEPGT
     1201 SCAYGEHCQK DSHCEDGLCT CNEPLVLKEN KCVVSPREKR FISDVHRKLL RFTPKKLAKL
     1261 GEYCFRNSHC ESQRQCLKNV CKCASNFVQS SFSCVPRMSV ISSLALPGES CRKGFCVGGS
     1321 TCENFMCKCP DDYFKKGDSC VRYESRIGAA CGTASGCSGG ATCTSSFCQC QDQYDADVDE
     1381 CYPYEPSVRS RNVKAISGRR KVNRVVSAST INCPIGYDLV NGMCVNSETL SVIQLAAPGG
     1441 ACEDGTILCT GNSVCANNVC ICPGGETVQN GTCVSINTYS SPGDPCDLTN TICTGNSQCI
     1501 DGICKCPNNQ GAINGRCSNM GNANCGNIQC GTNQICIQDS CQCRPGYYQQ PGSCLQDRCN
     1561 CIQEVESDSC LNRQCGMNQV CIQDQCQCRS GYLVLQETCI SDRCNCVQPS VDAISGGCMN
     1621 QCGNNQVCIQ DQCLCRNGYY AQPETCTGDR CNCVQHVVPD MGNCQRQCGN NQVCIQDQCQ
     1681 CRNGYYAQTE TCVADKCNCV QRAVAIPSPC VGNGCAPSAQ SQSYLQFIGL PGKMCDLRPN
     1741 AIPCRNDAQC VNNYCICPSN RVISGSNCVF YLGDALPGQS CQNNGMICRG GSSCNQNICQ
     1801 CAVGFSVDNG RCTPTIEVRF TMLPVTTAIP VFIIELNPGQ TCDPSCAYQP CMQRCSGGSS
     1861 CSNSICSCPQ GSGVLNNVCS PSFPQNDNYN LTRTARPGDS CDNTIVCIGG SSCLIGTCLC
     1921 DSGYEPSSDR SSCVLNDRYN VRSRSYPKTF CTFDSECTGG SICIDKRCAC RNDHEMINGV
     1981 CQLANLPGSR CHTSFCSKGA ECRNGYCVCA KTNYSDSTLD CVSSINANQG SMAYPGSKCN
     2041 ATTSCQQNSS CFFGYCVTPQ DEIDREANIK IRHIEKKKCG SYKDCGKSQT CSSDRLCECT
     2101 FNTNLVNGEC V
//