Informations

Existe-t-il une base de données contenant des séquences de lignées cellulaires humaines ?

Existe-t-il une base de données contenant des séquences de lignées cellulaires humaines ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je recherche les séquences complètes du génome de plusieurs lignées cellulaires humaines, par exemple A549 ou Ea.hy.926. Existe-t-il une base de données spécifiquement dédiée aux lignées cellulaires humaines ?


Comme l'a souligné @kmm (http://cancer.sanger.ac.uk/cancergenome/projects/cell_lines/) est une excellente base de données. Vous pouvez également consulter la page de l'institut général (http://www.broadinstitute.org/software/cprg/?q=data-resource) dans la section encyclopédie des lignées cellulaires cancéreuses, puis accéder à l'onglet Parcourir et sélectionner la lignée cellulaire. pour une liste très complète de lignées cellulaires.


Existe-t-il une base de données contenant des séquences de lignées cellulaires humaines ? - La biologie

Variation de la séquence génomique

http://www.1000genomes.org/
Collecte de données et catalogue des variations humaines

dbVar et base de données des variantes génomiques

L'héritage mendélien en ligne chez l'homme

http://www.omim.org/about
OMIM est un recueil complet et faisant autorité des gènes humains et des phénotypes génétiques, disponible gratuitement et mis à jour quotidiennement. Les aperçus référencés en texte intégral dans OMIM contiennent des informations sur tous les troubles mendéliens connus et plus de 12 000 gènes. L'OMIM se concentre sur la relation entre le phénotype et le génotype. Il est mis à jour quotidiennement et les entrées contiennent de nombreux liens vers d'autres ressources génétiques.

Le Consortium d'agrégation Exome (ExAC)

http://exac.broadinstitute.org/
ExAC est une coalition de chercheurs cherchant à agréger et à harmoniser les données de séquençage de l'exome à partir d'une variété de projets de séquençage à grande échelle, et à rendre les données récapitulatives disponibles pour la communauté scientifique au sens large. L'ensemble de données fourni sur ce site Web couvre 61 486 individus non apparentés séquencés dans le cadre de diverses études génétiques spécifiques à la maladie et de la population. Nous avons supprimé les individus affectés par une maladie pédiatrique grave, donc cet ensemble de données devrait servir d'ensemble de référence utile de fréquences alléliques pour les études sur les maladies graves. Toutes les données brutes de ces projets ont été retraitées via le même pipeline et appelées conjointement pour augmenter la cohérence entre les projets.

Projet d'Encyclopédie des éléments d'ADN (ENCODE)

http://encodeproject.org/
Liens vers les données de marques d'histone traitées uniformément par ENCODE2 : https://sites.google.com/site/anshulkundaje/projects/encodehistonemods
Liens vers d'autres données ENCODE2 traitées uniformément : http://genome.ucsc.edu/ENCODE/downloads.html
Collecte de données, analyse intégrative et catalogue complet de
tous les éléments fonctionnels basés sur la séquence

Projet d'épigénomique de la feuille de route (Fonds commun des NIH)

Consortium international sur l'épigénome humain (IHEC)

http://www.ihec-epigenomes.org/
Collecte de données et cartes de référence des épigénomes humains pour
états cellulaires pertinents pour la santé et les maladies

###Human BodyMap visualisable avec Ensemble (http://www.ensembl.org/index.html) ou le
Visionneuse de génomique intégrée (http://www.broadinstitute.org/igv/)
Base de données d'expression génique d'Illumina, à partir de données RNA-seq

###Cancer CellLine Encyclopedia (CCLE) http://www.broadinstitute.org/ccle/home
Données d'expression basées sur des matrices, CNV, mutations, perturbations sur une énorme collection de lignées cellulaires

###Projet FANTOM5 http://fantom.gsc.riken.jp/
http://fantom.gsc.riken.jp/5/sstar/Data_source
Grande collection de données d'expression basées sur CAGE sur plusieurs espèces (séries temporelles et perturbations)

http://www.ebi.ac.uk/gxa/
Base de données prenant en charge les requêtes d'expression génique spécifique à une condition sur
un sous-ensemble organisé de l'Array Express Archive.

Atlas d'expression des gènes du GNF

Visible sur BioGPS (http://biogps.org/#goto=welcome)
Données GNF (Institut de génomique de la Fondation de recherche Novartis) sur l'expression des gènes humains et souris.

http://www.proteinatlas.org/
Profils d'expression de protéines basés sur l'immunohistochimie pour un grand nombre de tissus humains, de cancers et de lignées cellulaires, localisation subcellulaire, niveaux d'expression des transcrits

http://www.uniprot.org/
Une base de données complète et librement accessible de séquences protéiques et
informations fonctionnelles

http://www.ebi.ac.uk/interpro/
Une base de données intégrée de classification des protéines, domaines fonctionnels,
et annotation (y compris les termes GO).

Initiative sur les réactifs de capture de protéines

http://commonfund.nih.gov/proteincapture/
Génération de ressources : anticorps monoclonaux renouvelables et autres réactifs ciblant toute la gamme des protéines

Programme Knockout Mouse (KOMP)

La carte de connectivité (CMAP)

http://www.broadinstitute.org/cmap/
La carte de connectivité (également connue sous le nom de cmap) est une collection de données d'expression transcriptionnelle à l'échelle du génome à partir de cellules humaines cultivées traitées avec de petites molécules bioactives et des algorithmes simples de correspondance de motifs qui, ensemble, permettent la découverte de connexions fonctionnelles entre les médicaments, les gènes et les maladies à travers le caractéristique transitoire des modifications courantes de l'expression des gènes. Vous pouvez en savoir plus sur le cmap dans nos articles dans Science and Nature Reviews Cancer.

Bibliothèque de signatures cellulaires intégrées basées sur le réseau (LINCS)

https://commonfund.nih.gov/LINCS/
Collecte de données et analyse des signatures moléculaires qui décrivent comment
différents types de cellules répondent à une variété d'agents perturbateurs

Génomique de la sensibilité aux médicaments dans le cancer

http://www.cancerrxgene.org/
Mutation, CNV, expression d'Affy et sensibilité aux médicaments dans

La base de données Drug Gene Interaction (DGIdb)

Programme de bibliothèques moléculaires (MLP)

https://commonfund.nih.gov/molecularlibraries/index.aspx
Accès à la capacité de criblage à grande échelle nécessaire pour identifier de petites molécules qui peuvent être optimisées en tant que sondes chimiques pour étudier les fonctions des gènes, des cellules et des voies biochimiques dans la santé et la maladie

http://www.brain-map.org/
Collecte de données et ressources publiques en ligne intégrant une expression génique étendue et des données neuroanatomiques pour l'homme et la souris, y compris la variation de l'expression génique de la souris par souche.

http://braincloud.jhmi.edu/
BrainCloud est une application autonome, disponible gratuitement et conviviale pour les biologistes, permettant d'explorer la dynamique temporelle et le contrôle génétique de la transcription dans le cortex préfrontal humain tout au long de la vie. BrainCloud a été développé grâce à la collaboration entre le Lieber Institute et le NIMH

Le Projet Connectome Humain

http://www.humanconnectomeproject.org/
Collecte et intégration de données pour créer une carte complète des connexions neuronales structurelles et fonctionnelles, au sein et entre les individus

Projet de séquençage d'ARN Geuvadis de 1000 échantillons de génomes

http://www.geuvadis.org/web/geuvadis
Séquençage d'ARNm et de petits ARN sur 465 échantillons de lignées cellulaires lymphoblastoïdes (LCL) de 5 populations du 1000 Genomes Project : le CEPH (CEU), les Finlandais (FIN), les Britanniques (GBR), les Toscani (TSI) et les Yoruba (YRI).

http://www.broadinstitute.org/achilles Le projet Achilles est un effort systématique visant à identifier et à cataloguer les vulnérabilités génétiques dans des centaines de lignées cellulaires cancéreuses caractérisées génomiquement. Le projet utilise une bibliothèque d'ARNsh à l'échelle du génome pour faire taire les gènes individuels et identifier les gènes qui affectent la survie des cellules. Le criblage fonctionnel à grande échelle de lignées cellulaires cancéreuses offre une approche complémentaire aux études qui visent à caractériser les altérations moléculaires (mutations, altérations du nombre de copies, etc.) des tumeurs primaires, telles que The Cancer Genome Atlas. L'objectif global du projet est de lier les dépendances génétiques du cancer à leurs caractéristiques moléculaires afin d'identifier des cibles moléculaires et de guider le développement thérapeutique.

Ressources génomiques sur le vieillissement humain

L'Atlas du génome du cancer (TCGA)

http://cancergenome.nih.gov/
Collecte de données et référentiel de données, y compris les données de séquence du génome du cancer

Consortium international du génome du cancer (ICGC)

http://www.icgc.org/
Collecte de données et référentiel de données pour une description complète des changements génomiques, transcriptomiques et épigénomiques du cancer

Projet d'expression du génotype-tissu (GTEx)

https://commonfund.nih.gov/GTEx/
Collecte de données, référentiel de données et banque d'échantillons pour l'expression et la régulation des gènes humains dans plusieurs tissus, par rapport à la variation génétique

Programme de phénotypage de souris Knockout (KOMP2)

https://commonfund.nih.gov/KOMP2/
Collecte de données pour le phénotypage standardisé d'une collection à l'échelle du génome de souris knock-out

Base de données des génotypes et phénotypes (dbGaP)

http://www.ncbi.nlm.nih.gov/gap
Référentiel de données pour les résultats d'études portant sur l'interaction du génotype et du phénotype

Catalogue NHGRI des GWAS publiés

http://www.genome.gov/gwastudies/
Catalogue public des études publiées sur les associations pangénomiques

Base de données génomique clinique

http://research.nhgri.nih.gov/CGD/
Une base de données organisée manuellement des conditions avec des causes génétiques connues, en se concentrant sur les données génétiques médicalement importantes avec les interventions disponibles.

Noyau d'information du NHGRI sur le cancer du sein

http://www.ncbi.nlm.nih.gov/clinvar/
ClinVar est conçu pour fournir des archives publiques et librement accessibles de rapports sur les relations entre les variations et les phénotypes humains, avec des preuves à l'appui. ClinVar recueille des rapports sur les variantes trouvées dans les échantillons de patients, les affirmations concernant leur importance clinique, les informations sur le demandeur et d'autres données à l'appui. Les allèles décrits dans les soumissions sont mappés sur des séquences de référence et rapportés conformément à la norme HGVS. ClinVar présente ensuite les données pour les utilisateurs interactifs ainsi que pour ceux qui souhaitent utiliser ClinVar dans les flux de travail quotidiens et autres applications locales. ClinVar travaille en collaboration avec les organisations intéressées pour répondre aux besoins de la communauté de la génétique médicale aussi efficacement que possible.

Base de données sur les mutations génétiques humaines (HGMD)

http://www.hgmd.cf.ac.uk/ac/
La base de données sur les mutations génétiques humaines (HGMD®) représente une tentative de rassembler les lésions génétiques connues (publiées) responsables de maladies héréditaires humaines

NHLBI Exome Sequencing Project (ESP) Exome Variant Server

http://evs.gs.washington.edu/EVS/
L'objectif du NHLBI GO Exome Sequencing Project (ESP) est de découvrir de nouveaux gènes et mécanismes contribuant aux troubles cardiaques, pulmonaires et sanguins en pionnier de l'application du séquençage de nouvelle génération des régions codant pour les protéines du génome humain à travers diverses, riches- populations phénotypées et de partager ces ensembles de données et découvertes avec la communauté scientifique pour étendre et enrichir le diagnostic, la gestion et le traitement des troubles cardiaques, pulmonaires et sanguins.

http://ghr.nlm.nih.gov/
Genetics Home Reference est le site Web de la National Library of Medicine pour l'information des consommateurs sur les maladies génétiques et les gènes ou les chromosomes liés à ces maladies.

http://www.ncbi.nlm.nih.gov/books/NBK1116/
Les GeneReviews sont des descriptions de maladies rédigées par des experts et évaluées par des pairs, présentées dans un format standardisé et axées sur des informations cliniquement pertinentes et médicalement exploitables sur le diagnostic, la gestion et le conseil génétique des patients et des familles atteints de maladies héréditaires spécifiques.

Réseau interactif mondial de l'Association Alzheimer (GAAIN)

http://www.gaain.org/
Le Global Alzheimer’s Association Interactive Network (GAAIN) est un projet collaboratif qui fournira aux chercheurs du monde entier un accès à un vaste référentiel de données de recherche sur la maladie d’Alzheimer, ainsi qu’aux outils analytiques sophistiqués et à la puissance de calcul nécessaires pour travailler avec ces données. Notre objectif est de transformer la façon dont les scientifiques travaillent ensemble pour répondre aux questions clés liées à la compréhension des causes, au diagnostic, au traitement et à la prévention de la maladie d'Alzheimer et d'autres maladies neurodégénératives.
En 2013, obtenu des données WGS pour la plus grande cohorte de 800 patients atteints de la maladie d'Alzheimer

Consortium Cohorts for Heart and Aging Research in Genomic Epidemiology (CHARGE)

http://web.chargeconsortium.com/
Le consortium Cohorts for Heart and Aging Research in Genomic Epidemiology (CHARGE) a été formé pour faciliter les méta-analyses d'études d'association à l'échelle du génome et les opportunités de réplication parmi plusieurs grandes études de cohorte longitudinales bien phénotypées. Ils disposent également de données sur la méthylation de l'ADN aux côtés de WGS et Exome Seq.

Le NIMH Center for Collaborative Genomic Studies on Mental Disorders


Possibilités d'accès

Obtenez un accès complet au journal pendant 1 an

Tous les prix sont des prix NET.
La TVA sera ajoutée plus tard dans la caisse.
Le calcul des taxes sera finalisé lors du paiement.

Obtenez un accès limité ou complet aux articles sur ReadCube.

Tous les prix sont des prix NET.


Résultats

ERVmap : Un outil bioinformatique pour cartographier les lectures de séquençage d'ARN aux ERV proviraux humains.

Pour obtenir un compendium ERV humain à haute résolution complet, ou ERVome, nous avons compilé une liste organisée de 3 220 loci proviraux ERV (ensemble de données S1). Ces VRE ont été soit transcrites dans divers contextes pathologiques, soit identifiées comme des VRE sur la base d'une analyse de séquence in silico (14, 38 ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ –46). Nous avons inclus des loci ERV avec des localisations chromosomiques uniques qui avaient été décrites comme des ERV autonomes/proviraux et n'avons intentionnellement exclu aucun loci. Pour les loci qui se chevauchaient entre les études, nous avons sélectionné celui avec une couverture de séquence plus longue. Contrairement à l'annotation RepeatMasker dans laquelle les ERV sont principalement des éléments LTR non autonomes non contigus d'une longueur moyenne de 368 pb, la base de données ERVmap contient des ERV qui sont pour la plupart des éléments LTR autonomes d'une longueur moyenne de 7,5 ko (37). L'annotation RepeatMasker a 885 loci au-dessus de 5 ko, tandis qu'ERVmap a 2 722 loci au-dessus de 5 ko. La longueur moyenne du reste des VRE inférieures à 5 ko pour ERVmap est de 3,6 ko, alors que pour RepeatMasker elle est de 360 ​​bp. ERVmap capture toutes les séquences ERV provirales connues à ce jour et est idéal pour l'analyse de loci génomiques ERV autonomes spécifiques dans tout le génome de l'hôte.

À l'aide de cette base de données, nous avons aligné les lectures de séquençage d'ARN traitées sur le génome humain (hg38) à l'aide de Burrows-Wheeler Aligner (BWA), des scripts spécialement conçus pour ERVmap pour filtrer les lectures mappées selon nos critères stricts, des lectures filtrées quantifiées qui correspondent au Les coordonnées ERV de notre base de données et ont normalisé les dénombrements aux facteurs de taille obtenus par l'analyse standard de l'expression des gènes cellulaires (Annexe SI, fig. S1). Le pipeline génère des valeurs normalisées basées sur des nombres de lectures filtrés mappés par locus. Pour obtenir un mappage haute fidélité des lectures de séquences vers ces loci ERV répétitifs, nous avons utilisé des critères de filtrage très stricts pour les lectures mappées, de sorte que chaque lecture mappée : (je) ne pouvait avoir qu'une seule meilleure correspondance, (je) la deuxième meilleure correspondance doit avoir au moins une autre discordance, et (iii) exclu s'il présente plus de trois discordances (14). Ce critère concerne les lectures de paires de 150 pb et est ajusté proportionnellement en fonction de la longueur de lecture des données de séquençage. Dans cet algorithme, que nous appelons ERVmap, nous avons intentionnellement exclu les lectures mappées sur des régions conservées dans la séquence provirale et les lectures mappées sur des loci polymorphes, qui tomberaient toutes deux sous le troisième critère d'avoir plus de trois mésappariements par lecture séquencée pour favoriser spécificité du locus sur l'abondance globale. Notre code est disponible via GitHub (https://mtokuyama.github.io/ERVmap/) (Annexe SI, fig. S2). Enfin, nous avons développé un outil Web qui permet aux utilisateurs d'obtenir l'ERVome humain dans toutes les données de séquençage d'ARN en téléchargeant simplement des fichiers de séquençage d'ARN bruts (www.ervmap.com).

Modèles d'expression ERV dans les lignées cellulaires humaines.

Nous avons obtenu des données de séquençage d'ARN d'ENCODE pour plusieurs lignées cellulaires communes (Fig. 1UNE) pour analyser l'ERVome dans ces cellules. Nous avons sélectionné des lignées cellulaires accompagnées de données de séquençage ChIP. Dans toutes les cellules analysées, nous avons observé ∼ 40 % des VRE à des niveaux détectables (Fig. 1B). Les cellules K562 ont exprimé le niveau le plus élevé d'ERV, non pas parce qu'elles ont exprimé plus de loci d'ERV, mais parce que les ERV exprimés sont transcrits à des niveaux plus élevés (Fig. 1 B et C). En revanche, les cellules A549 ont exprimé le niveau le plus bas de VRE, environ un tiers de la quantité exprimée par les cellules K562. La comparaison des ERV entre les lignées cellulaires a révélé des grappes d'ERV qui sont exprimées de manière unique dans chaque lignée cellulaire (Fig. 1). Ces VRE se sont regroupés distinctement à l'aide d'un algorithme d'intégration de voisins stochastiques à distribution t (t-SNE), ce qui implique que des ensembles uniques de VRE sont exprimés dans chaque lignée cellulaire (Fig. 1E). De plus, l'expression de l'ERV à elle seule était suffisante pour séparer les types de cellules sur la base de l'analyse en composantes principales (ACP), suggérant que l'expression de l'ERV est suffisamment unique pour permettre la discrimination entre les types de cellules (Fig. 1F). Nous avons confirmé l'expression d'un ensemble d'ERV en utilisant qRT-PCR (Annexe SI, fig. S3). Enfin, nous avons analysé les données de séquençage ChIP disponibles pour ces lignées cellulaires et observé les marques d'histone H3K4me3 et H3K27Ac aux loci ERV activement transcrits, et avons également observé une corrélation positive entre les marques d'histone actives et une expression plus élevée de l'ERV (Annexe SI, illustration S4 UNE et B). En revanche, très peu de marques d'histone répressives H3K9me3 et H3K27me3 étaient présentes au niveau des loci transcrits de l'ERV, suggérant que l'absence de modifications des histones silencieuses et la présence de modifications actives des histones accompagnent l'expression de l'ERV dans ces cellules (Annexe SI, illustration S4 C et ).

Expression ERV spécifique au type cellulaire dans les lignées cellulaires. (UNE) Description des lignées cellulaires utilisées dans l'analyse ERV. (B) Histogramme du nombre de lectures attribuées à chacun des 3 220 loci d'ERV triés par ordre d'ERV exprimé le plus élevé au plus faible pour chaque lignée cellulaire. (C) Somme de toutes les lectures ERV par lignée cellulaire comparées entre les types de cellules. () Carte thermique des VRE exprimées à travers les types de cellules indiqués. Les VRE avec zéro lecture sur toutes les lignées cellulaires ont été exclues. Au total, 1 704 VRE sont affichés. Analyse t-SNE bidimensionnelle (E) et PCA (F) des VRE exprimées par les types cellulaires indiqués en utilisant le même ensemble de 1 704 VRE que dans . L'analyse t-SNE a été réalisée en utilisant une perplexité de 30 et une itération maximale de 1 000. N/A, l'attribution des cellules n'est pas possible en raison de plusieurs lignées cellulaires exprimant la même quantité exacte de l'ERV particulier.

Contrairement à ERVmap, une résolution moindre a été observée lorsque l'annotation RepeatMasker a été utilisée pour analyser l'expression de l'ERV à l'aide d'une méthode publiée appelée RepEnrich (47). RepEnrich quantifie les éléments LTR au niveau des sous-familles, dont chacune contient des centaines de copies dans le génome (Annexe SI, tableau S1) et ne donne pas de quantification des lectures à des loci ERV spécifiques. L'analyse RepEnrich n'a pas révélé de grappes d'éléments ERV spécifiques au type de cellule (Annexe SI, illustration S5UNE), mais il y avait suffisamment de différences dans l'expression des familles ERV entre les types cellulaires pour séparer les cellules en fonction du regroupement hiérarchique et de l'analyse PCA (Annexe SI, illustration S5B). Ainsi, ERVmap fournit un profilage spécifique au locus de l'ERVome à l'aide d'ensembles de données de séquençage d'ARN (RNA-seq) qui devraient faciliter les études mécanistiques en aval.

Expression ERV différentielle dans les types de cellules primaires.

Nous avons ensuite utilisé les données ARN-seq des cellules primaires dans ENCODE pour analyser l'ERVome dans sept types de cellules différents, à la fois immunitaires et non immunitaires, afin d'obtenir l'expression de l'ERV dans une gamme de types cellulaires (Fig. 2UNE). Semblable aux lignées cellulaires, environ 50% des loci ERV ont été exprimés par un type de cellule donné (Fig. 2B). Toutes les cellules ont exprimé des niveaux totaux similaires de transcrits ERV, mais des ensembles distincts d'ERV ont été transcrits dans un type cellulaire donné (Fig. 2 C et ). Les embryons de la neurosphère et les cellules B en particulier ont exprimé des grappes d'ERV hautement spécifiques à un type cellulaire. En utilisant l'algorithme t-SNE, nous avons observé des grappes uniques d'ERV exprimées dans chaque type de cellule, cependant, nous avons observé des grappes ERV similaires entre les cellules T CD4 + et CD8 +, suggérant que les ERV exprimées par ces types de cellules sont similaires par rapport à d'autres types de cellules ( 2E). Cela reflète probablement la similitude biologique au sein des deux populations de cellules T. Les types cellulaires ont été séparés uniquement sur la base des profils d'expression de l'ERV et ont révélé que l'ERVome est largement distinct entre les lymphocytes, les kératinocytes et les embryons de neurosphère (Fig. 2F). Enfin, en comparaison avec les lignées cellulaires, les cellules primaires ont exprimé des niveaux plus faibles d'ERV dans l'ensemble, suggérant que le processus de transformation ou de culture cellulaire pourrait conduire à une expression élevée d'ERV (Annexe SI, fig. S6).

Expression ERV spécifique au type cellulaire dans les cellules primaires. (UNE) Types de cellules et informations associées pour chaque échantillon utilisé dans l'analyse ERV. (B) Histogramme du nombre de lectures attribuées à chacun des 3 220 loci de VRE triés par ordre de VRE exprimée la plus élevée à la plus faible pour chaque type de cellule. Pour les types de cellules avec plusieurs échantillons, le nombre moyen de lectures par locus a été tracé. (C) Somme de toutes les lectures ERV par échantillon comparées entre les types de cellules. Pour les types de cellules avec plusieurs ensembles de données, la moyenne et le SEM sont représentés graphiquement. () Carte thermique des VRE exprimées à travers les types de cellules indiqués. Les 500 VRE les plus divers ont été utilisés pour l'analyse afin de réduire le bruit. Analyse t-SNE bidimensionnelle (E) et PCA (F) des VRE exprimées par les types cellulaires indiqués en utilisant le même ensemble de 500 VRE que dans . L'analyse t-SNE a été réalisée en utilisant une perplexité de 30 et une itération maximale de 1 000.

L'ERVome est élevé chez les patients atteints de LED.

Les VRE ont été impliqués dans diverses maladies, notamment le cancer et l'auto-immunité. Le LED est une maladie auto-immune multigénique avec des manifestations cliniques diverses et encore incurable. De nombreux médicaments ciblant divers effecteurs immunitaires ont été testés, mais ils ont eu des niveaux de succès variables (48). L'un des plus grands obstacles à la conception de médicaments efficaces est la mauvaise compréhension de la cause sous-jacente de la diversité des symptômes associés à la maladie. Alors que des études ont observé une expression élevée des séquences ERV chez les patients SLE (49 ⇓ ⇓ ⇓ –53), ces études se sont concentrées sur un ou deux ERV et le domaine pourrait bénéficier d'une analyse à l'échelle du génome de l'ERVome chez les patients SLE pour révéler la pertinence des VRE dans la maladie. Ainsi, nous avons obtenu des cellules mononucléées du sang périphérique (PBMC) de femmes atteintes de LED et de femmes en bonne santé (Annexe SI, Tableau S2), car le LED est une maladie à prédominance féminine, et a effectué un séquençage d'ARN suivi d'une analyse ERVmap. Dans cette cohorte, nous avons identifié 124 VRE significativement élevées dans les PBMC des patients atteints de LED par rapport aux témoins sains, mais aucune n'a été réprimée (Fig. 3UNE). Les patients LED ont exprimé des niveaux significativement plus élevés de transcrits ERV dans leur ensemble ainsi qu'au niveau du locus individuel, et l'expression de l'ERV a largement séparé les patients LED des témoins sains (Fig. 3 B et C). Enfin, nous avons observé que l'expression de l'ERV n'est pas un corrélat direct de la signature de l'interféron (IFN) pour de nombreux patients, comme illustré par la comparaison entre l'expression totale de l'ERV et l'expression totale du gène stimulé par l'IFN (ISG) par patient (Fig. 3). L'expression de l'ISG a été calculée à l'aide d'une liste publiée précédemment de signatures d'ISG observées chez les patients atteints de LED (54). Ensemble, ERVmap a révélé une élévation globale de l'ERVome et a identifié des loci ERV spécifiques qui sont élevés chez les patients atteints de LED qui, ensemble, peuvent refléter une signature indépendante de l'ISG du LED.

Les patients atteints de LED ont une expression ERV élevée. (UNE) Un tracé volcanique illustrant l'expression différentielle des 3 220 VRE. Les VRE rouges sont significativement élevées chez les patients atteints de LED par rapport aux témoins sains (padj < 0.05, log2 fold-change > 1.0). Les 30 meilleurs VRE significativement élevés sont indiqués par leur nom. (B) Comparaison de la somme de toutes les lectures de VRE significativement différentes entre les donneurs sains et les donneurs de LED (LED, m = 20 en bonne santé, m = 6). Les barres d'erreur représentent SEM et Mann-Whitney non paramétrique U test a été effectué pour calculer la significativité. ***P < 0,001. (C) Carte thermique des 124 VRE significativement élevées chez les patients atteints de LED par rapport aux témoins sains, telle que déterminée en utilisant un seuil de padj < 0,05. () Carte thermique de la somme des lectures pour les VRE significativement élevées et de la somme des lectures pour les ISG par échantillon de patient.

Identification de VRE supplémentaires qui sont élevées et en corrélation avec l'activité cytolytique dans les tissus du cancer du sein.

Les cellules T cytotoxiques et les cellules tueuses naturelles sont des effecteurs importants de la surveillance des tumeurs. Ils sont armés de granzyme et de perforine pour tuer directement les cellules tumorales. Une étude récente utilisant un ensemble de 66 VRE comme référence a montré que 8 des 66 VRE étaient positivement corrélées avec l'expression du granzyme et de la perforine dans les tissus du cancer du sein, ce qui implique un rôle potentiel des VRE dans la surveillance immunitaire (19). Nous avons appliqué ERVmap au même ensemble de données sur les tissus du cancer du sein généré par le réseau de recherche The Cancer Genome Atlas (TCGA) pour déterminer si nous sommes en mesure d'identifier d'autres ERV qui sont élevés dans les tissus du cancer du sein et associés à la mesure de l'activité cytolytique du granzyme et de la perforine (CYT ), comme indiqué précédemment. Nous avons observé un grand nombre de VRE significativement élevées, ainsi que réprimées, dans les tissus du cancer du sein par rapport aux tissus mammaires normaux (Fig. 4UNE). Nous avons confirmé l'expression élevée de deux des trois ERV spécifiques aux tumeurs (TSERV) identifiés par le groupe Hacohen (19), ERVH48-1 et ERVE-4 (Fig. 4B). Nous avons également identifié 203 VRE supplémentaires qui étaient significativement élevées dans les tissus du cancer du sein, ainsi que 195 VRE réprimées (Fig. 4 UNE et C). Cinq des huit VRE positivement corrélées avec le CYT dans l'article de Hacohen et ses collègues (19) ont également montré une corrélation positive en utilisant ERVmap, mais aucune de ces VRE n'était significativement élevée dans les tissus du cancer du sein. Au lieu de cela, nous avons identifié 38 VRE qui étaient à la fois significativement élevées et ont montré une corrélation positive avec CYT (Fig. 4). Nous avons également identifié 56 VRE qui ont été significativement réprimés mais ont montré une corrélation positive avec CYT (Fig. 4). Ensemble, les données ont illustré qu'ERVmap peut révéler des ERV associées aux tumeurs, qui peuvent jouer un rôle dans la surveillance des tumeurs.

ERVmap révèle des ERV supplémentaires associés au cancer du sein qui sont en corrélation avec l'activité cytolytique. (UNE) Un tracé volcanique représentant les 3 220 VRE. Les VRE bleues sont significativement réprimées et les VRE rouges sont significativement élevées dans les tissus du cancer du sein par rapport aux témoins sains (padj < 0.05, log2 fold-change < -1,5 ou > 1,5). Les 30 premiers VRE significativement élevés et réprimés sont indiqués par leur nom. (B) Nombre de lectures normalisées de DESeq ERV pour les TSERV précédemment signalés ou les 10 principaux ERV significativement élevés ou significativement réprimés identifiés dans ce rapport (C) sont tracés sous forme de dot plots pour les VRE indiquées pour chaque échantillon (brca, cancer du sein m = 1 246, rouge normal m = 221, gris). () Lanciers r la corrélation a été calculée entre les VRE significativement élevées ou réprimées (padj < 0,05, log2 fold-change > 1,5 ou < -1,5) et le niveau d'expression moyen de granzyme et de perforine (CYT) pour tous les échantillons de tissu de cancer du sein. (*P < 0.05 **P < 0.01 ***P < 0,001 ****P < 0,0001).


CONCLUSION

SCPortalen est la première base de données à cellule unique qui fournit des métadonnées et des résultats d'analyse entièrement organisés d'ensembles de données à cellule unique accessibles au public. De plus, nous avons tenté de rendre ces ensembles de données comparables en utilisant un pipeline d'analyse unifié.

Des travaux supplémentaires se concentreront sur l'analyse, telle que (i) la caractérisation de la distribution de l'expression et l'identification des gènes multi-états, et (ii) l'expression de l'ARN long non codant. La conception de la base de données de SCPortalen sera étendue pour répondre aux demandes croissantes de la recherche en omique monocellulaire. La future mise à jour de la base de données inclura le traitement de la séquence complète du génome des images unicellulaires et ATAC-Seq et FISH. Nous pensons que SCPortalen sera une ressource utile pour la communauté de la recherche unicellulaire.


Général

Caractéristiques

Traitement de l'information

  1. Vérifiez que tous les conteneurs ne fuient pas ou ne se cassent pas.
  2. Retirez les cellules congelées de l'emballage de glace carbonique et placez immédiatement les cellules à une température inférieure à -130 ° C, de préférence dans de la vapeur d'azote liquide, jusqu'à ce qu'elles soient prêtes à l'emploi.

Pour assurer le plus haut niveau de viabilité, décongeler le flacon et initier la culture dès que possible dès réception. Si à l'arrivée, un stockage continu de la culture congelée est nécessaire, elle doit être stockée en phase vapeur d'azote liquide et non à -70°C. Le stockage à -70°C entraînera une perte de viabilité.

  1. Décongeler le flacon par agitation douce dans un bain-marie à 37°C. Pour réduire la possibilité de contamination, gardez le joint torique et le capuchon hors de l'eau. La décongélation doit être rapide (environ 2 minutes).
  2. Retirer le flacon du bain-marie dès que le contenu est décongelé et décontaminer par trempage ou pulvérisation d'éthanol à 70 %. Toutes les opérations à partir de ce point doivent être effectuées dans des conditions d'asepsie strictes.
  3. Transférer le contenu du flacon dans un flacon de culture tissulaire de 75 cm 2 et diluer avec le milieu de culture complet recommandé (voir les informations de lot spécifiques pour le rapport de dilution recommandé). Il est important d'éviter une alcalinité excessive du milieu lors de la récupération des cellules. Il est suggéré qu'avant l'ajout du contenu du flacon, le récipient de culture contenant le milieu de croissance soit placé dans l'incubateur pendant au moins 15 minutes pour permettre au milieu d'atteindre son pH normal (7,0 à 7,6).
  4. Incuber la culture à 37°C dans un incubateur adapté. A 5% de CO2 en atmosphère d'air est recommandé si vous utilisez le milieu décrit sur cette fiche produit.

Si l'on souhaite que l'agent cryoprotecteur soit éliminé immédiatement, ou qu'une suspension cellulaire plus concentrée soit obtenue, centrifuger la suspension cellulaire à environ 125 xg pendant 5 à 10 minutes. Jeter le surnageant et remettre en suspension les cellules avec un milieu de croissance frais au taux de dilution recommandé dans les informations de lot spécifiques.

  1. Retirer et jeter le milieu de culture.
  2. Rincer brièvement la couche cellulaire avec une solution de Trypsine à 0,25 % (p/v) - 0,53 mM d'EDTA pour éliminer toute trace de sérum contenant un inhibiteur de trypsine.
  3. Ajouter 2,0 à 3,0 ml de solution de Trypsine-EDTA dans le flacon et observer les cellules au microscope inversé jusqu'à ce que la couche cellulaire soit dispersée (généralement dans les 5 à 15 minutes).
    Remarque : Pour éviter l'agglutination, n'agitez pas les cellules en frappant ou en secouant le flacon en attendant que les cellules se détachent. Les cellules difficiles à détacher peuvent être placées à 37°C pour faciliter la dispersion.
  4. Ajouter 6,0 à 8,0 ml de milieu de croissance complet et aspirer les cellules en pipetant doucement.
  5. Ajouter des aliquotes appropriées de la suspension cellulaire à de nouveaux récipients de culture.
  6. Incuber les cultures à 37°C.

Spécifications de contrôle qualité

Histoire

Mentions légales

Le produit est fourni « EN L'ÉTAT » et la viabilité des produits ATCC & reg est garantie pendant 30 jours à compter de la date d'expédition, à condition que le client ait stocké et manipulé le produit conformément aux informations figurant sur la fiche d'information du produit, le site Web et Certificat d'analyse. Pour les cultures vivantes, l'ATCC répertorie la formulation des milieux et les réactifs qui se sont avérés efficaces pour le produit. Bien que d'autres milieux et réactifs non spécifiés puissent également produire des résultats satisfaisants, une modification des protocoles ATCC et/ou recommandés par les déposants peut affecter la récupération, la croissance et/ou la fonction du produit. Si une formulation de milieu ou un réactif alternatif est utilisé, la garantie de viabilité de l'ATCC n'est plus valable. Sauf indication expresse dans les présentes, aucune autre garantie de quelque nature que ce soit n'est fournie, expresse ou implicite, y compris, mais sans s'y limiter, toute garantie implicite de qualité marchande, d'adéquation à un usage particulier, de fabrication selon les normes cGMP, de typicité, de sécurité, de précision , et/ou de non-contrefaçon.

Ce produit est destiné à un usage de recherche en laboratoire uniquement. Il n'est destiné à aucun usage thérapeutique animal ou humain, aucune consommation humaine ou animale, ni aucun usage diagnostique. Toute utilisation commerciale proposée est interdite sans une licence de l'ATCC.

Bien qu'ATCC fasse des efforts raisonnables pour inclure des informations exactes et à jour sur cette fiche produit, ATCC ne fait aucune garantie ou représentation quant à son exactitude. Les citations de la littérature scientifique et des brevets sont fournies à titre informatif uniquement. ATCC ne garantit pas que ces informations ont été confirmées comme étant exactes ou complètes et le client est seul responsable de la confirmation de l'exactitude et de l'exhaustivité de ces informations.

Ce produit est envoyé à la condition que le client soit responsable et assume tous les risques et responsabilités liés à la réception, la manipulation, le stockage, l'élimination et l'utilisation du produit ATCC, y compris, sans s'y limiter, en prenant toutes les précautions de sécurité et de manipulation appropriées pour minimiser la santé. ou risque environnemental. Comme condition de réception du matériel, le client accepte que toute activité entreprise avec le produit ATCC et toute descendance ou modification soit menée conformément à toutes les lois, réglementations et directives applicables. Ce produit est fourni « EN L'ÉTAT » sans aucune représentation ou garantie que ce soit, à l'exception de ce qui est expressément indiqué dans les présentes et en aucun cas ATCC, ses sociétés mères, filiales, administrateurs, dirigeants, agents, employés, ayants droit, successeurs et sociétés affiliées ne peuvent être tenus responsables des dommages indirects. , les dommages spéciaux, accessoires ou consécutifs de quelque nature que ce soit en relation avec ou résultant de l'utilisation du produit par le client. Bien que des efforts raisonnables soient déployés pour garantir l'authenticité et la fiabilité des documents en dépôt, ATCC n'est pas responsable des dommages résultant d'une identification erronée ou d'une fausse déclaration de ces documents.


Existe-t-il une base de données contenant des séquences de lignées cellulaires humaines ? - La biologie

PhosphoSitePlus ® fournit des informations et des outils complets pour l'étude des modifications post-traductionnelles des protéines (PTM), notamment la phosphorylation, l'acétylation, etc. L'utilisation du Web est gratuite pour tous, y compris les commerciaux.

Recherche de protéines, de séquences ou de références :Les recherches de protéines récupèrent des listes de protéines et leurs types de modification en fonction du nom ou de l'ID de la protéine, du type de protéine, du domaine, du composant cellulaire, du PM et de la plage de pI. Les recherches de séquences récupèrent des listes de protéines et de séquences contenant des séquences spécifiées, des motifs dégénérés et des domaines. Les recherches de références par auteur ou protéine récupèrent des listes de références bibliographiques associées. Les recherches PubMedID renvoient des informations sur les sites sélectionnés à partir de l'article sélectionné.

Recherche du site:Récupérez les listes de sites de modification qui remplissent le(s) paramètre(s) de recherche sélectionné(s). La sortie des données comprend les séquences de résidus et flanquantes modifiées, les noms de protéines et de gènes et les informations associées.

Recherche comparative sur site :Récupère une liste de sites modifiés qui possèdent certains attributs spécifiés et en excluent d'autres. Les recherches peuvent être restreintes par huit critères : les sites répondant à des traitements spécifiques, ou ceux observés dans des types de protéines, des domaines, des composants cellulaires, des états pathologiques, des lignées cellulaires, des types cellulaires ou des tissus spécifiques.

Parcourir les données MS2 par maladie :Permet à l'utilisateur de parcourir les enregistrements MS/MS organisés en sélectionnant un type de maladie. Les résultats montrent le nombre d'enregistrements et de sites de modification associés observés dans la maladie sélectionnée.

Parcourir les données MS2 par ligne cellulaire :Permet à l'utilisateur de parcourir les enregistrements MS/MS organisés en sélectionnant une lignée cellulaire. Les résultats montrent le nombre d'enregistrements et de sites de modification associés observés dans la lignée cellulaire sélectionnée.

Parcourir les données MS2 par tissu :Permet à l'utilisateur de parcourir les enregistrements MS/MS organisés en sélectionnant un tissu. Les résultats montrent le nombre d'enregistrements et de sites de modification associés observés dans le tissu sélectionné.


Téléchargements

Utilisez l'option « Explorer » pour ouvrir un ensemble de données dans Tableau où vous pouvez parcourir de manière interactive les peptides, les protéines et les types de cellules directement dans votre navigateur !

Annotation des types de cellules

Description et origine de tous les types cellulaires et tissus utilisés pour le CSPA.

Matrice de toutes les protéines et leur détection dans les différents types cellulaires.

Fichier Excel contenant 6 tableaux organisés en différentes feuilles :

  1. Liste de toutes les protéines identifiées dans les différents types cellulaires
  2. Matrice de 1492 protéines humaines contre 47 types de cellules humaines
  3. Matrice de 1296 protéines de souris contre 31 types de cellules de souris
  4. Tableau contenant le nombre de protéines identifiées de chaque type cellulaire
  5. Matrix with human surfaceome proteins and cells and their estimated relative quantities in log2 scale
  6. Matrix with mouse surfaceome proteins and cells and their estimated relative quantities in log2 scale

Sisyphus CSPA

Filemaker based database containing the easy-to-navigate Sisyphus database executable.

CSPA validated surfaceome proteins

Excel file containing all human and mouse surfaceome proteins in two tables and an additional table with all identified N-glycopeptides:

  1. List of 1492 human surfaceome proteins and their annotation.
  2. List of 1296 mouse surfaceome proteins and their annotation.
  3. List of 13942 mouse and human derived N-glycopeptides, including identified modified form.

Corrected topologies

PDF files with original and based on N-glycopeptide identification corrected topology pictures of 51 human proteins and 39 mouse proteins. The pictures were created with PROTTER and identified N-glycopeptides were marked yellow.

CSPA based spectral libraries for human proteins

ZIP file, containing a README.txt file and two subfolders with the respective spectral libraries:

  1. The .pepidx, .spidx and .splib file of the human spectral library for proteins within the CSPA. The sequence motiv N-X-S/T has been modified to D-X-S/T, which corresponds to a deamidated asparagine (N). Methionines are variable modified by oxidation and a decoy spectral library is appended.
  2. The .pepidx, .spidx and .splib file of the human spectral library for proteins within the CSPA. Asparagines and methionines can be searched with variable modifications of deamiation and oxidation, respectively and a decoy spectral library is appended.

CSPA based spectral libraries for mouse proteins

ZIP file, containing a README.txt file and two subfolders with the respective spectral libraries:

  1. The .pepidx, .spidx and .splib file of the mouse spectral library for proteins within the CSPA. The sequence motiv N-X-S/T has been modified to D-X-S/T, which corresponds to a deamidated asparagine (N). Methionines are variable modified by oxidation and a decoy spectral library is appended.
  2. The .pepidx, .spidx and .splib file of the mouse spectral library for proteins within the CSPA. Asparagines and methionines can be searched with variable modifications of deamiation and oxidation, respectively and a decoy spectral library is appended.

CSPA toolbox

Excel file containing tables for generating inclusion lists and transition list of surfaceome proteins within the CSPA:


<p>This section provides information on the quaternary structure of a protein and on interaction(s) with other proteins or protein complexes.<p><a href='/help/interaction_section' target='_top'>More. </a></p> Interaction i

<p>This subsection of the <a href="http://www.uniprot.org/help/interaction%5Fsection">'Interaction'</a> section provides information about the protein quaternary structure and interaction(s) with other proteins or protein complexes (with the exception of physiological receptor-ligand interactions which are annotated in the <a href="http://www.uniprot.org/help/function%5Fsection">'Function'</a> section).<p><a href='/help/subunit_structure' target='_top'>More. </a></p> Subunit structure i

Found in a mRNP complex with UPF1, UPF2, UPF3B and XRN1 (PubMed:14527413). Associates with alpha and beta tubulins (By similarity).

Interacts with DIS3L2 (PubMed:23756462).

Interacts with ZC3HAV1 in an RNA-dependent manner (PubMed:21876179).

Interacts with ZFP36L1 (PubMed:15687258).

Interacts with TRIM71 (via NHL repeats) in an RNA-dependent manner (PubMed:23125361).

Interacts with YTHDC2 (via ANK repeats) (PubMed:29033321).

Manual assertion inferred from sequence similarity to i

Manual assertion based on experiment in i

Protein-protein interaction databases

The Biological General Repository for Interaction Datasets (BioGRID)

CORUM comprehensive resource of mammalian protein complexes

Database of interacting proteins

Protein interaction database and analysis system

Molecular INTeraction database

STRING: functional protein association networks

Miscellaneous databases

RNAct, Protein-RNA interaction predictions for model organisms.


Is there a database containing sequences of human cell lines? - La biologie

This brain cell database contains a survey of biological features derived from single cell data, from both human and mouse. It is part of a multi-year project to create a census of cells in the mammalian brain.

The database contains electrophysiological, morphological, and transcriptomic data measured from individual cells, as well as models simulating cell activity. Thus far, data generation has focused on select areas of cerebral cortex, and thalamic neurons.

Browse electrophysiological response data and reconstructed neuronal morphologies using the Cell Feature Search tool. Single cell gene expression data is described on the RNA-Seq Data page.

Use the Allen Software Development Kit (SDK) to programmatically access and analyze raw data, and to run models.

Data can be downloaded by selecting individual experiments in the Cell Feature Search tool, by accessing transcriptomic RNA-Seq files, or through the Allen SDK or API.

Single Cells from Human Brain

Cells are acquired from donated ex vivo brain tissue dissected from temporal or frontal lobes, based on anatomical annotations described in The Allen Human Brain Reference Atlas. For electrophysiological and morphological analyses in the cortex, cells are selected based on soma shape and laminar location.

For transcriptomic analysis, individual layers of cortex are dissected, and neuronal nuclei are isolated. Laminar sampling is guided by the relative number of neurons present in each layer.

Single Cells from Mouse Brain

Cells are acquired from selected brain areas in the adult mouse. Cells are identified for isolation using transgenic mouse lines harboring fluorescent reporters, with drivers that allow enrichment for cell classes based on marker genes. For electrophysiological and morphological analyses, excitatory cells with layer-enriched distribution and inhibitory cells expressing canonical markers were isolated. Brain areas selected for analysis include subregions from visual cortex, motor cortex and anterior lateral motor cortex (ALM), in the secondary motor area (MOs). Subregions from visual cortex (secondary visual areas) are also included.

For transcriptomic analysis, regional and laminar dissections were performed on specimens from pan-neuronal, pan-excitatory, and pan-inhibitory transgenic lines, to sample comprehensively. Data from the lateral geniculate nucleus (LGd) is also included.