Ensembl
Enghraifft o'r canlynol | cronfa ddata ar-lein, biological database |
---|---|
Rhan o | GENCODE, ELIXIR EMBL-EBI Node |
Gwladwriaeth | y Deyrnas Unedig |
Gwefan | http://www.ensembl.org/ |
Ffeiliau perthnasol ar Gomin Wicimedia |
Prosiect gwyddonol yw Ensembl sydd yn cael ei redeg ar y cyd gan y Sefydliad Biowybodeg Ewropeaidd a Sefydliad Sanger yr Ymddiriedolaeth Wellcome. Cafodd ei lansio yn 1999 fel yr oedd Prosiect y Genom Dynol yn dirwyn i ben.[1] Nod y prosiect yw i ddarparu adnodd canolog ar gyfer genetegwyr, biolegwyr moleciwlaidd ac ymchwilwyr eraill sy'n astudio genomau dynol, fertebrau eraill ac organebau model.[2] Mae Ensembl yn un o lawer o borwyr genom a ddefnyddir gan wyddonwyr ar gyfer adalw gwybodaeth genomig.
Cefndir
[golygu | golygu cod]Mae'r genom dynol yn cynnwys tri biliwn pâr o fasau, sy'n codio am tua 20,000–25,000 genyn. Ond does dim llawer i'w ganfod o wybod dilyniant y genom ar ben ei hun heb wybod hefyd am leoliadau genynau a'r cysylltiadau rhyngddynt. Mae modd anodi'r lleoliadau yma â llaw, gan ddefnyddio data o arbrofion wedi eu cyhoeddi mewn cyfnodolion gwyddonol. Fodd bynnag, mae hyn yn waith araf a dyfal. Opsiwn arall yw anodiad awtomatig – defnyddio pŵer cyfrifiadurol i gymharu dilyniannau protein a DNA.
Yn y prosiect Ensembl, mae data dilyniant genom yn cael ei fwydo i mewn i system anodi gyfrifiadurol (cyfres o sgriptiau yn yr iaith gyfrifiadurol Perl), gan greu casgliad o leoliadau genynau rhagweledig a'u harbed mewn cronfa ddata ar gyfer eu hymdrin ymhellach. Mae Ensembl yn rhyddhau'r holl wybodaeth i'w defnyddio gan y gymuned ymchwil fyd-eang. Gall unrhyw un lawrlwytho data a chôd y prosiect,[3] ac mae gweinydd cronfa ddata agored ar gael er mwyn cysylltu o bell. Mae gwefan Ensembl hefyd yn cynnwys dadansoddiadau gweledol o lawer o'r data.
Dros amser, mae'r prosiect wedi ei ehangu i gynnwys organebau ychwanegol (gan gynnwys organebau model pwysig megis llygod, pryfed ffrwythau a physgod rhesog), yn ogystal ag ystod ehangach o wybodaeth genomig, gan gynnwys amrywiadau genetig a nodweddion rheoli. Ers mis Ebrill 2009, mae chwaer-brosiect i Ensembl wedi estyn ffiniau'r prosiect i gynnwys anifeiliaid heb asgwrn cefn, planhigion, ffyngau, bacteria, a protistiaid, tra bo'r prosiect gwreiddiol yn dal i ganolbwyntio ar fertebratau.
Dangos data genomig
[golygu | golygu cod]Rhan bwysig o brosiect Ensembl yw'r gallu i greu deleweddau awtomatig o enynau a data genetig eraill wedi alino at enom cyfeirio. Mae data fel hyn yn cael ei ddangos fel traciau data, a gall defnyddwyr droi'r traciau ymlaen neu i ffwrdd er mwyn gallu edrych ar nodweddion sydd o ddiddordeb iddynt. Mae rhyngwyneb Ensembl hefyd yn galluogi defnyddwyr i chwyddo mannau penodol o'r genom neu symud ar hyd y genom yn hawdd.
Gall y porwr hefyd ddangos data ar gydraniadau gwahanol, o ddangos caryoteipiau cyfan i ddangos dilyniannau DNA ac asidau amino yn fanwl. Mae hefyd modd o edrych ar ddilyniannau tebyg trwy ddiagramau coeden a chymharu genynau cyfatebol mewn ystod o rywogaethau. Gall Ensembl hefyd roi'r un wybodaeth mewn fformatiau eraill, ee FASTA, er mwyn defnyddio'r data mewn rhaglenni eraill.
Gellir agor data o raglenni eraill yn Ensembl hefyd, un ai drwy ddefnyddio gweinydd arlein neu drwy uwchlwytho ffeil mewn fformat cydweddol, megis BAM, BED neu PSL.
Rhywogaethau
[golygu | golygu cod]Mae'r genomau sydd wedi eu hanodi yn cynnwys y rhan fwyaf o'r genomau fertebrat sydd wedi eu dilyniannu. Maen nhw'n cynnwys:
- Ffylwm Chordata (anifeiliaid ag asgwrn cefn)
- Mamaliaid
- Euarchontoglires
- Primatiaid: galago, tsimpansî, bod dynol, macaque, lemwr, orangwtang, tarsier;
- Scandentia: llyg y coed;
- Glires (= cnofilod a cheinachffurfiaid): mochyn cwta, llygoden fawr godog, llygoden, llygoden fawr, gwiwer ddaear, pica, cwningen;
- Laurasiatheria: buwch, dolffin, alpaca, mochyn, cath, ci, ceffyl, ystlum, draenog, chwistlen;
- Afrotheria: eliffant, hyracs, tenrec;
- Xenarthra: armellog, diogyn;
- Marsupialia: oposwm, walabi;
- Monotremes: hwyatbig;
- Euarchontoglires
- Adar: iâr, pila gwellt rhesog;
- Lepidosauria: madfall anole;
- Lissamphibia: llyffant Xenopus tropicalis;
- Pysgod teleost: Takifugu rubripes (fugu), Tetraodon nigroviridis (chwyddbysgodyn gwyrdd), Danio rerio (pysgodyn rhesog), Oryzias latipes (medaka), Gasterosteus aculeatus (crothell);
- Cyclostomata: Petromyzon marinus (llysywen bendoll y môr);
- Tunicates: Ciona intestinalis, Ciona savignyi;
- Mamaliaid
- Anifeiliaid di-asgwrn cefn
- Burum: Saccharomyces cerevisiae (burum pobi)
Cyfeiriadau
[golygu | golygu cod]- ↑ "Ensembl 2011". Nucleic Acids Res 39 (Database issue): D800–D806. November 2010. doi:10.1093/nar/gkq1064. PMC 3013672. PMID 21045057. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3013672.
- ↑ "Ensembl's 10th year". Nucleic Acids Res. 38 (Database issue): D557–62. January 2010. doi:10.1093/nar/gkp972. PMC 2808936. PMID 19906699. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2808936.
- ↑ Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proctor, Glenn; Searle, Steve et al. (January 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database 2017 (1). doi:10.1093/database/bax020.