Your email was sent successfully. Check your inbox.

An error occurred while sending the email. Please try again.

Proceed reservation?

Export
  • 1
    Abstract: To identify genes contributing to disease phenotypes remains a challenge for bioinformatics. Static knowledge on biological networks is often combined with the dynamics observed in gene expression levels over disease development, to find markers for diagnostics and therapy, and also putative disease-modulatory drug targets and drugs. The basis of current methods ranges from a focus on expression-levels (Limma) to concentrating on network characteristics (PageRank, HITS/Authority Score), and both (DeMAND, Local Radiality). We present an integrative approach (the FocusHeuristics) that is thoroughly evaluated based on public expression data and molecular disease characteristics provided by DisGeNet. The FocusHeuristics combines three scores, i.e. the log fold change and another two, based on the sum and difference of log fold changes of genes/proteins linked in a network. A gene is kept when one of the scores to which it contributes is above a threshold. Our FocusHeuristics is both, a predictor for gene-disease-association and a bioinformatics method to reduce biological networks to their disease-relevant parts, by highlighting the dynamics observed in expression data. The FocusHeuristics is slightly, but significantly better than other methods by its more successful identification of disease-associated genes measured by AUC, and it delivers mechanistic explanations for its choice of genes.
    Type of Publication: Journal article published
    PubMed ID: 28205611
    Signatur Availability
    BibTip Others were also interested in ...
  • 2
    facet.materialart.
    Unknown
    German Medical Science GMS Publishing House; Düsseldorf
    In:  63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS); 20180902-20180906; Osnabrück; DOCAbstr. 252 /20180827/
    Publication Date: 2018-08-29
    Keywords: Medizinische Informatik ; Epidemiologie ; Medizinische Dokumentation ; ddc: 610
    Language: English
    Type: conferenceObject
    Signatur Availability
    BibTip Others were also interested in ...
  • 3
    facet.materialart.
    Unknown
    German Medical Science GMS Publishing House; Düsseldorf
    In:  64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS); 20190908-20190911; Dortmund; DOCAbstr. 225 /20190906/
    Publication Date: 2019-09-07
    Keywords: data quality ; error prevention ; monitoring ; log-file ; rss feed ; software tool ; ddc: 610
    Language: English
    Type: conferenceObject
    Signatur Availability
    BibTip Others were also interested in ...
  • 4
    facet.materialart.
    Unknown
    German Medical Science GMS Publishing House; Düsseldorf
    In:  64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS); 20190908-20190911; Dortmund; DOCAbstr. 229 /20190906/
    Publication Date: 2019-09-07
    Keywords: data quality ; metadata ; R ; primary data collections ; ddc: 610
    Language: English
    Type: conferenceObject
    Signatur Availability
    BibTip Others were also interested in ...
  • 5
    facet.materialart.
    Unknown
    German Medical Science GMS Publishing House; Düsseldorf
    In:  GMS Medizinische Informatik, Biometrie und Epidemiologie; VOL: 15; DOC08 /20191108/
    Publication Date: 2019-11-09
    Description: High data quality is fundamental for valid inferences in health research. Metadata, i.e. "data that describe other data", are essential to implement data quality assessments but more guidance on which metadata to use is needed. Similarly, the selection and use of variables describing the measurement process should be exemplified to improve the design and conduct of observational health studies. This work provides a conceptual framework and overview of metadata and process information for systematic data quality reports based on implementations within the population-based cohort Study of Health in Pomerania (SHIP). In previous years, a prerequisite for automated data quality checks has been established by the augmentation of the data dictionary; the added information of up to 20 different characteristics for each variable is used for data quality assessments and triggers diverse data quality checks. Conceptually we distinguish static metadata, variable metadata, and process variables. Examples for static metadata are the expected probability distribution, plausibility limits, and the data type. Variable metadata may be reference limits of a laboratory marker. Information inherent to these metadata allows for the detection of data quality flaws by comparing observed with expected data characteristics. In contrast, process variables, such as the observer or device ID, also allow for the identification of sources of data quality issues. This is the case even if characteristics defined in metadata were not violated. Metadata and process variables can be used alone or in combination to implement a versatile and efficient data quality assessment. A comprehensive setup of metadata and process variables is an extensive task, particularly in studies involving large data collections. Nonetheless, the gain in transparency and efficacy of data curation and quality reporting after this setup is considerable.
    Description: Eine hohe Datenqualität ist eine wesentliche Voraussetzung für valide Entscheidungen in der Gesundheitsforschung. Metadaten bzw. "Daten über andere Daten" sind für die Implementierung eines Datenqualitätsmonitorings essentiell. Klare Empfehlungen und Benennungen von Metadaten für spezifische Aspekte von Datenqualität werden in relevanter Literatur jedoch nicht gegeben. Gleichfalls ist nicht klar, welche Informationen über den datengenerierenden Prozess gesammelt werden sollten, um Studiendesign und -durchführung zu verbessern. In dieser Arbeit wird unter konzeptioneller Perspektive ein Überblick zu Metadaten und Prozessinformationen gegeben, welche in der Kohortenstudie Study of Health in Pomerania (SHIP) verwendet werden. Zurückliegend wurde in SHIP das allgemein gebräuchliche Data Dictionary um Informationen erweitert, welche für Datenqualitätsbewertungen verwendet werden und diese auch steuern können; bis zu 20 unterschiedliche Charakteristika von Variablen können spezifiziert werden. Konzeptionell werden hierfür statische von variablen Metadaten sowie Prozessvariablen unterschieden. Zum Beispiel sind die Verteilungsform, Plausibilitäts- und Zulässigkeitsgrenzen sowie der Dateneingabetyp statische Metadaten. Variierende Referenzgrenzen von z.B. Laborparametern werden als variable Metadaten betrachtet. Diese Information erlaubt die Identifizierung von Beeinträchtigungen der Datenqualität durch einen Vergleich von beobachteten und erwarteten Charakteristika der Daten. Prozessvariablen wie die ID des Untersuchers oder des Messgeräts erlauben hingegen die Identifikation von möglichen Quellen für Fehler, selbst wenn keine Metadaten verletzt wurden. Metadaten und Prozessvariablen können jeweils allein oder in Kombination verwendet werden, um vielseitige und effiziente Qualitätsbewertungen umzusetzen. Die Erstellung notwendiger Metadaten und die Definition von Prozessvariablen bedeuten einen erheblichen Aufwand, insbesondere für größere Studien. Der Zugewinn an Transparenz und Effektivität bei der Qualitätsberichterstellung ist jedoch erheblich.
    Keywords: data quality ; metadata ; process variables ; data monitoring ; health research ; cohort studies ; Datenqualität ; Metadaten ; Prozessvariablen ; Datenmonitoring ; Gesundheitsforschung ; Kohortenstudien ; ddc: 610
    Language: English
    Type: article , info:eu-repo/semantics/article
    Signatur Availability
    BibTip Others were also interested in ...
Close ⊗
This website uses cookies and the analysis tool Matomo. More information can be found here...