Gesundheit

Neue Methode der scoring-protein-Interaktionen, Minen, große Datensätze aus einem neuen Blickwinkel

Forscher von der Stowers Institut für Medizinische Forschung haben eine neue Art und Weise zu definieren, die einzelnen protein-Assoziationen in eine schnelle, effiziente und informative Art und Weise. Diese Ergebnisse, veröffentlicht in der März 8, 2019, Ausgabe von Nature Communications, zeigen, wie die topologische Wertung (TopS) – Algorithmus, erstellt von Stowers Forscher, kann-durch die Kombination von Daten-identifizieren Proteine, die zusammen kommen.

Der Ansatz ist ähnlich zu einem Blick auf die Aktivitäten und Interaktionen aller Menschen in einer Gemeinschaft und dann auswählen, aus der die meisten sinnvollen Interaktionen, von denen einige möglicherweise sehr selten. Die Forscher suchen nach den biologischen äquivalent von zwei Personen, die sich nur zwei in der gesamten Gemeinschaft, dass die Teilnahme an einer wichtigen Wechselwirkung.

Dies hilft nicht nur Forscher erkennen, wie die Proteine führen die biologischen Funktionen oder zur Durchführung von biologischen Prozessen, kann der Algorithmus angewendet werden, um die zuvor generierten biologischen Daten und möglicherweise andere Bereiche der Wissenschaft zu erwerben neue Informationen.

„Es ist eine form von big-data-Analyse, die wir anwenden, um Proteomik-Daten zu identifizieren und zu verstehen, protein-Interaktions-Netzwerken“, sagt Michael Washburn, PhD, Direktor der Stowers Proteomics Center. „Es ist komplementär zu einer Menge von Techniken, die bereits in Gebrauch sind, so kann es verwendet werden, um Fragen und Antworten neue Fragen auf.“

Protein-Daten-sets können eine Herausforderung sein, zu untersuchen, für eine sinnvolle information, weil Sie so groß ist. „Sie haben Tausende von Proteinen zu betrachten“, sagt Mihaela Sardiu, PhD, senior research specialist bei Stowers. Das Verständnis, wie eine Vielzahl von Proteinen, die zusammen kommen, um etwas zu tun, wie der DNA-Reparatur, ist ein schwieriges problem. „Wir wollten vereinfachen das problem.“

Das bedeutete, dass statt einen Gesamtüberblick über alles, was Sie gejagt, für weniger häufige Ereignisse. Die Forscher Taten dies, indem Sie für Köder (Proteine bereits bekannt, werden an Prozessen beteiligt, die von Interesse) und Beute (Proteine, könnte die Interaktion mit dem bait-Proteine) zu sehen, wie Sie interagiert in der menschlichen DNA-Reparatur-und Hefe-chromatin-remodelling-komplexe. Über TopS, Daten analysiert, in ein parallel-Mode, was bedeutet, dass die Daten aus verschiedenen biologisch-bezogene Köder werden gleichzeitig berücksichtigt. Ein wichtiges Merkmal der Gipfel ist die Möglichkeit zur Bewertung der Präferenz eines Beute-protein für einen Köder, der im Vergleich zu anderen Ködern. „Statt der Berechnung einer Punktzahl durch die Konzentration nur Informationen von einem einzigen Köder, die wir jetzt aggregierte Informationen aus dem gesamten Datensatz“, erklärt Sardiu.

Washburn und Sardiu glauben, dass die Oberteile können angewendet werden, um eine Breite Palette von Daten-sets, die jenseits der Proteomik, sowohl in der Grundlagenforschung und darüber hinaus. Sardiu sieht Potenzial in der Verwendung für Daten im Gesundheitswesen, wo ärzte vielleicht in der Lage zu vergleichen, die Gesundheit eines Patienten zu anderen, wie können Sie sagen, wenn ein patient die Krankheit „wirklich Fortgeschritten im Vergleich zu anderen oder nicht“, sagt Sie.

Das team hat auch die veröffentlichte diese Erkenntnisse auf Github, ein computer-code-repository, weil Sie bieten möchten, um anderen Forschern die Gelegenheit zum testen des Algorithmus und sehen, wie können Sie es anwenden, um Ihre eigenen Projekte.

„Wir sind gespannt zu sehen, wie weit diese gehen kann. Es ist die potentiell hohe Wirkung-Werkzeug, und wir wollen sehen, was andere kreative und innovative Menschen, die mit oben kommen kann“, sagt Washburn. „Wir denken, dies ist ein wirklich wertvolles Potenzial tool für eine Menge Leute da draußen, die kämpfen mit der Herausforderung des Sortierens durch sehr großen Daten.“

Andere Mitwirkende aus der Stowers Institute enthalten, Joshua M. Gilmore, PhD, Brad D. Groppe, Arnob Dutta, PhD, und Laurence Florens, PhD. Dutta ist derzeit Assistant Professor an der University of Rhode Island, Groppe ist jetzt arbeiten bei Thermo Fisher Scientific, und Gilmore ist ein Wissenschaftler mit Boehringer Ingelheim.

Diese Forschung wurde gefördert von der Stowers Institute und ein Stipendium des National Institute of General Medical Sciences von den National Institutes of Health unter der award number R01GM112639. Der Inhalt liegt in der alleinigen Verantwortung der Autoren und stellt nicht notwendigerweise die offiziellen Ansichten der Nationalen Institute der Gesundheit.