High Confidence Network Predictions from Big Biological Data

High Confidence Network Predictions from Big Biological Data PDF Author: Rasmus Magnusson
Publisher: Linköping University Electronic Press
ISBN: 9179298877
Category :
Languages : en
Pages : 111

Get Book Here

Book Description
Biology functions in a most intriguing fashion, with human cells being regulated by multiplex networks of proteins and their dependent systems that control everything from proliferation to cell death. Notably, there are cases when these networks fail to function properly. In some diseases there are multiple small perturbations that push the otherwise healthy cells into a state of malfunction. These maladies are referred to as complex diseases, and include common disorders such as allergy, diabetes type II, and multiple sclerosis, and due to their complexity there is no universally defined approach to fully understand their pathogenesis or pathophysiology. While these perturbations can be measured using high-throughput technologies, the interplay of these perturbations is generally to complex to understand without any structured mathematical analysis. There is today numerous such methods that put the small perturbations of complex diseases into relation of interactions among each other. However, the methods have historically struggled with notable uncertainty in their predictions. This uncertainty can be addressed by at least two different approaches. First, mechanistically realistic mathematical modelling is an approach that has the capacity to accurately describe almost any biological system, but such models can to-date only describe small systems and networks. Secondly, large-scale mathematical modelling approaches exist, but the faithfulness of the models to the underlying biology has been compromised to achieve algorithms that are computationally effective. In this Ph.D. thesis, I suggest how high confidence predictions of network interactions can be extracted from big biological. First, I show how large-scale data can be used when building high-quality ODE models (Paper I). Secondly, by developing the software LASSIM, I show how ODE models can be expanded to the size of entire cell systems (Paper II). However, while LASSIM showed that powerful non-linear ODE-modelling can be applied to understand big biological data, it still remained a machine learning-based approach in contrast to hypothesis-driven model development. Instead, two more studies revolving around large-scale modelling approaches were initiated. The third study suggested that ambiguities in model selection and interaction identification greatly compromise the accuracy of available tools, and that the novel software of Paper III, LiPLike, can be used to remove such predictions. Intriguingly, while LiPLike was able to effectively discard false identifications, the accuracy of predictions remained relatively low. This low accuracy was thought to arise from model simplifications, and therefore the next study aimed at finding methods that come closer to the true biological system (Paper IV). In particular, the study aimed at predicting protein abundance -the true mediators of biological functionality- from the much more easily accessible mRNA levels, and found that such models could be used to get several new insights on protein mechanisms, which was exemplified by the identification of important biomarkers of autoimmune diseases. The analysis of big biological data and the underlying networks is a centrepiece of understanding both diseases and how cell functionality is orchestrated. The work that is presented in this Ph.D. thesis represents a journey between fields with different views on how these networks should be inferred. In particular, it aimed to combine the accuracy of small-scale mechanistic modelling with the system-spanning potential of large-scale linear system modelling, and this thesis thus provides a tool-bench of methods and insights on how knowledge can be extracted from big biological data, and in extension it is a small step towards a generation of new comprehensions of biological systems and complex diseases. Biologiska system är komplexa att förstå och det är först relativt nyligen man på ett strukturerat sätt börjat att analysera biologiska data genom matematisk analys. Ett av de tydligaste områden där en matematisk analys av biologiska system behövs är vid studier av komplexa sjukdomar. Sådana sjukdomar, till vilka åkommor som multipel skleros, diabetes typ II och allergi hör, uppstår genom en komplicerad kombination av arv och miljö som inte är helt förstådd. Studier av komplexa sjukdomar har dock kunnat identifiera många små potentiella störningar över hela det biologiska systemet, men ingen av dessa störningar är individuellt avgörande för att utveckla en komplex sjukdom. Denna svåröverskådlighet förhindrar traditionella analyser för att finna ursprunget till sjukdomen, och går det inte förstå en sjukdom försämras möjligheterna att till exempel hitta nya läkemedel eller att ställa diagnos. För att förstå hur systemen bakom komplexa sjukdomar fungerar, eller inte fungerar, tas olika prover vilka ofta resulterar i enorma mängder data. Dessa datamängder är oftast så stora att vi människor inte kan tolka dem genom att bara läsa talen, utan vi måste använda olika typer av matematiska modeller och datorprogram för att sådan data ska berätta något för oss. Inom två överlappande fält som kommit att kallas systembiologi och bioinformatik har metoder för att analysera biologiska data haft en snabb utveckling de senaste 50 åren. Dessa metoder har haft som mål att svara på flertalet frågor, och ett framträdande mål har varit att identifiera skillnader mellan hur friska och sjuka celler fungerar. En stor del av cellens funktioner regleras av olika nätverk av proteiner, och ett annat mål har varit att förstå hur dessa nätverk regleras. Ytterligare ett mål har varit att identifiera mätbara värden, så kallade biomarkörer, som kan användas för att identifiera sjukdom hos patienter. De metoder som används för att svara på dessa frågor kan grovt delas in i två grupper, mekanistisk modellering och storskalig modellering, med respektive styrkor och svagheter. Mekanistisk modellering har potentialen att ge mycket träffsäkra prediktioner, men kräver mycket manuellt arbete och har därför varit en alltför tidskrävande metod för att applicera på stora biologiska datamängder. Storskalig modellering klarar enkelt av stora datamängder, men har i stället haft en så låg tillförlitlighet att metoder vars förutsägelser är bättre än slumpen i många fall kunnat betraktats som bra. Denna doktorsavhandling kretsar kring utvecklingen och användandet av metoder för att analysera stora mängder av biologiska data, och har i fyra arbeten ämnat att förbättra metoder inom både småskalig mekanistisk modellering (artikel I och II) och storskalig modellering (artikel III och IV). Artikel I analyserade hur diabetes typ II påverkar fettcellers svar på insulin och hur denna insulinsignal kan beskrivas matematiskt. Detta första arbete var begränsat till just små modeller, och en naturlig utveckling var att undersöka om mekanistiska modeller kan skalas upp och beskriva system som täcker en större del av cellens funktionalitet. Detta möjliggjordes i artikel II genom LASSIM, en metod och programvara som kan expandera små mekanistiska modeller till mångdubbel storlek. Under skapandet av LASSIM stod det dock klart att storskalig modellering förblir en metod som är mycket tidskrävande. Därför syftade artikel III till att förbättra tillförlitligheten för prediktioner från befintliga metoder som kan hantera stora datamängder. Mer specifikt föreslog artikel III en ny algoritm, LiPLike, som kan användas för att ta bort prediktioner som saknar konfidens i data. Även om det gick att observera hur LiPLike kunde förbättra tillförlitligheten för etablerade metoder var flera av LiPLikes prediktioner fortfarande fel, vilket kunde antas bero på att den underliggande biologin skiljer sig från det matematiska modellantagande som låg till grund för studien. Därför inleddes den sista delen i denna avhandling, vilken syftade att utreda hur data kan beskrivas på mer biologiskt relevanta sätt. Även om det är proteiner som främst reglerar cellens system, baseras majoriteten av matematiska modeller på ett förstadium till proteiner som kallas mRNA. Anledningen till detta är att det både är svårt och kostsamt att mäta proteiner i ett prov, vilket gör att man istället förlitar sig på mRNA. I artikel IV användes matematisk modellering för att prediktera mängden protein i olika typer av immunceller. Dessa modeller visade sig vara användbara för att identifiera mätbara markörer för olika sjukdomar. Därmed går det använda mRNA-data på sätt som tar modeller närmare verkligheten, och som i förlängningen kan höja tillförlitligheten hos matematiska prediktioner. Forskningen är bara i början av ett långt arbete för att förstå hur celler fungerar, samt hur komplexa sjukdomar uppstår. En central del i detta arbete är att systematiskt beskriva de underliggande system som styr cellen, och detta går nästan enbart att uppnå genom en strukturerad matematisk analys. Denna avhandling kan sammanfattas som en serie arbeten som dels skalar upp storleken på modelleringsmetoder som tidigare varit begränsade till små modeller, och dels höjer tillförlitligheten på mer beräkningseffektiva modeller. Dessa bidrag kommer förhoppningsvis ligga till grund för en ökad förståelse för hur biologiska system bör analyseras och i förlängningen hur komplexa sjukdomar kan motverkas.

High Confidence Network Predictions from Big Biological Data

High Confidence Network Predictions from Big Biological Data PDF Author: Rasmus Magnusson
Publisher: Linköping University Electronic Press
ISBN: 9179298877
Category :
Languages : en
Pages : 111

Get Book Here

Book Description
Biology functions in a most intriguing fashion, with human cells being regulated by multiplex networks of proteins and their dependent systems that control everything from proliferation to cell death. Notably, there are cases when these networks fail to function properly. In some diseases there are multiple small perturbations that push the otherwise healthy cells into a state of malfunction. These maladies are referred to as complex diseases, and include common disorders such as allergy, diabetes type II, and multiple sclerosis, and due to their complexity there is no universally defined approach to fully understand their pathogenesis or pathophysiology. While these perturbations can be measured using high-throughput technologies, the interplay of these perturbations is generally to complex to understand without any structured mathematical analysis. There is today numerous such methods that put the small perturbations of complex diseases into relation of interactions among each other. However, the methods have historically struggled with notable uncertainty in their predictions. This uncertainty can be addressed by at least two different approaches. First, mechanistically realistic mathematical modelling is an approach that has the capacity to accurately describe almost any biological system, but such models can to-date only describe small systems and networks. Secondly, large-scale mathematical modelling approaches exist, but the faithfulness of the models to the underlying biology has been compromised to achieve algorithms that are computationally effective. In this Ph.D. thesis, I suggest how high confidence predictions of network interactions can be extracted from big biological. First, I show how large-scale data can be used when building high-quality ODE models (Paper I). Secondly, by developing the software LASSIM, I show how ODE models can be expanded to the size of entire cell systems (Paper II). However, while LASSIM showed that powerful non-linear ODE-modelling can be applied to understand big biological data, it still remained a machine learning-based approach in contrast to hypothesis-driven model development. Instead, two more studies revolving around large-scale modelling approaches were initiated. The third study suggested that ambiguities in model selection and interaction identification greatly compromise the accuracy of available tools, and that the novel software of Paper III, LiPLike, can be used to remove such predictions. Intriguingly, while LiPLike was able to effectively discard false identifications, the accuracy of predictions remained relatively low. This low accuracy was thought to arise from model simplifications, and therefore the next study aimed at finding methods that come closer to the true biological system (Paper IV). In particular, the study aimed at predicting protein abundance -the true mediators of biological functionality- from the much more easily accessible mRNA levels, and found that such models could be used to get several new insights on protein mechanisms, which was exemplified by the identification of important biomarkers of autoimmune diseases. The analysis of big biological data and the underlying networks is a centrepiece of understanding both diseases and how cell functionality is orchestrated. The work that is presented in this Ph.D. thesis represents a journey between fields with different views on how these networks should be inferred. In particular, it aimed to combine the accuracy of small-scale mechanistic modelling with the system-spanning potential of large-scale linear system modelling, and this thesis thus provides a tool-bench of methods and insights on how knowledge can be extracted from big biological data, and in extension it is a small step towards a generation of new comprehensions of biological systems and complex diseases. Biologiska system är komplexa att förstå och det är först relativt nyligen man på ett strukturerat sätt börjat att analysera biologiska data genom matematisk analys. Ett av de tydligaste områden där en matematisk analys av biologiska system behövs är vid studier av komplexa sjukdomar. Sådana sjukdomar, till vilka åkommor som multipel skleros, diabetes typ II och allergi hör, uppstår genom en komplicerad kombination av arv och miljö som inte är helt förstådd. Studier av komplexa sjukdomar har dock kunnat identifiera många små potentiella störningar över hela det biologiska systemet, men ingen av dessa störningar är individuellt avgörande för att utveckla en komplex sjukdom. Denna svåröverskådlighet förhindrar traditionella analyser för att finna ursprunget till sjukdomen, och går det inte förstå en sjukdom försämras möjligheterna att till exempel hitta nya läkemedel eller att ställa diagnos. För att förstå hur systemen bakom komplexa sjukdomar fungerar, eller inte fungerar, tas olika prover vilka ofta resulterar i enorma mängder data. Dessa datamängder är oftast så stora att vi människor inte kan tolka dem genom att bara läsa talen, utan vi måste använda olika typer av matematiska modeller och datorprogram för att sådan data ska berätta något för oss. Inom två överlappande fält som kommit att kallas systembiologi och bioinformatik har metoder för att analysera biologiska data haft en snabb utveckling de senaste 50 åren. Dessa metoder har haft som mål att svara på flertalet frågor, och ett framträdande mål har varit att identifiera skillnader mellan hur friska och sjuka celler fungerar. En stor del av cellens funktioner regleras av olika nätverk av proteiner, och ett annat mål har varit att förstå hur dessa nätverk regleras. Ytterligare ett mål har varit att identifiera mätbara värden, så kallade biomarkörer, som kan användas för att identifiera sjukdom hos patienter. De metoder som används för att svara på dessa frågor kan grovt delas in i två grupper, mekanistisk modellering och storskalig modellering, med respektive styrkor och svagheter. Mekanistisk modellering har potentialen att ge mycket träffsäkra prediktioner, men kräver mycket manuellt arbete och har därför varit en alltför tidskrävande metod för att applicera på stora biologiska datamängder. Storskalig modellering klarar enkelt av stora datamängder, men har i stället haft en så låg tillförlitlighet att metoder vars förutsägelser är bättre än slumpen i många fall kunnat betraktats som bra. Denna doktorsavhandling kretsar kring utvecklingen och användandet av metoder för att analysera stora mängder av biologiska data, och har i fyra arbeten ämnat att förbättra metoder inom både småskalig mekanistisk modellering (artikel I och II) och storskalig modellering (artikel III och IV). Artikel I analyserade hur diabetes typ II påverkar fettcellers svar på insulin och hur denna insulinsignal kan beskrivas matematiskt. Detta första arbete var begränsat till just små modeller, och en naturlig utveckling var att undersöka om mekanistiska modeller kan skalas upp och beskriva system som täcker en större del av cellens funktionalitet. Detta möjliggjordes i artikel II genom LASSIM, en metod och programvara som kan expandera små mekanistiska modeller till mångdubbel storlek. Under skapandet av LASSIM stod det dock klart att storskalig modellering förblir en metod som är mycket tidskrävande. Därför syftade artikel III till att förbättra tillförlitligheten för prediktioner från befintliga metoder som kan hantera stora datamängder. Mer specifikt föreslog artikel III en ny algoritm, LiPLike, som kan användas för att ta bort prediktioner som saknar konfidens i data. Även om det gick att observera hur LiPLike kunde förbättra tillförlitligheten för etablerade metoder var flera av LiPLikes prediktioner fortfarande fel, vilket kunde antas bero på att den underliggande biologin skiljer sig från det matematiska modellantagande som låg till grund för studien. Därför inleddes den sista delen i denna avhandling, vilken syftade att utreda hur data kan beskrivas på mer biologiskt relevanta sätt. Även om det är proteiner som främst reglerar cellens system, baseras majoriteten av matematiska modeller på ett förstadium till proteiner som kallas mRNA. Anledningen till detta är att det både är svårt och kostsamt att mäta proteiner i ett prov, vilket gör att man istället förlitar sig på mRNA. I artikel IV användes matematisk modellering för att prediktera mängden protein i olika typer av immunceller. Dessa modeller visade sig vara användbara för att identifiera mätbara markörer för olika sjukdomar. Därmed går det använda mRNA-data på sätt som tar modeller närmare verkligheten, och som i förlängningen kan höja tillförlitligheten hos matematiska prediktioner. Forskningen är bara i början av ett långt arbete för att förstå hur celler fungerar, samt hur komplexa sjukdomar uppstår. En central del i detta arbete är att systematiskt beskriva de underliggande system som styr cellen, och detta går nästan enbart att uppnå genom en strukturerad matematisk analys. Denna avhandling kan sammanfattas som en serie arbeten som dels skalar upp storleken på modelleringsmetoder som tidigare varit begränsade till små modeller, och dels höjer tillförlitligheten på mer beräkningseffektiva modeller. Dessa bidrag kommer förhoppningsvis ligga till grund för en ökad förståelse för hur biologiska system bör analyseras och i förlängningen hur komplexa sjukdomar kan motverkas.

Network Science

Network Science PDF Author: National Research Council
Publisher: National Academies Press
ISBN: 0309100267
Category : Computers
Languages : en
Pages : 125

Get Book Here

Book Description
The military is currently attempting to develop itself into a force capable of networkcentric operations. While this effort has highlighted the military's dependence on interacting networks, it has also shown that there is a huge gap between what we need to know about networks and our fundamental knowledge about network behavior. This gap makes the military vision of NCO problematic. To help address this problem, the Army asked the NRC to find out whether identifying and funding a new field of "network science" could help close this gap. This report presents an examination of networks andthe military, an analysis of the promise, content, and challenges of network science, and an assessment of approaches to creating value from network science.

Encyclopedia of Bioinformatics and Computational Biology

Encyclopedia of Bioinformatics and Computational Biology PDF Author:
Publisher: Elsevier
ISBN: 0128114320
Category : Medical
Languages : en
Pages : 3421

Get Book Here

Book Description
Encyclopedia of Bioinformatics and Computational Biology: ABC of Bioinformatics, Three Volume Set combines elements of computer science, information technology, mathematics, statistics and biotechnology, providing the methodology and in silico solutions to mine biological data and processes. The book covers Theory, Topics and Applications, with a special focus on Integrative –omics and Systems Biology. The theoretical, methodological underpinnings of BCB, including phylogeny are covered, as are more current areas of focus, such as translational bioinformatics, cheminformatics, and environmental informatics. Finally, Applications provide guidance for commonly asked questions. This major reference work spans basic and cutting-edge methodologies authored by leaders in the field, providing an invaluable resource for students, scientists, professionals in research institutes, and a broad swath of researchers in biotechnology and the biomedical and pharmaceutical industries. Brings together information from computer science, information technology, mathematics, statistics and biotechnology Written and reviewed by leading experts in the field, providing a unique and authoritative resource Focuses on the main theoretical and methodological concepts before expanding on specific topics and applications Includes interactive images, multimedia tools and crosslinking to further resources and databases

High Content Screening

High Content Screening PDF Author: D. Lansing Taylor
Publisher: Springer Science & Business Media
ISBN: 1597452173
Category : Science
Languages : en
Pages : 437

Get Book Here

Book Description
There has always been some tension between proponents of hypothesis-driven and discovery-driven research in the broad field of life sciences. Academic research has been primarily focused on hypothesis-driven research. However, the success of the human genome project, a discovery-driven research approach, has opened the door to adding other types of discovery-driven research to a continuum of research approaches. In contrast, drug discovery research in the pharmaceutical industry has embraced discovery-driven research for many years. A good example has been the discovery of active compounds from large chemical libraries, through screening campaigns. The success of the human genome project has also demonstrated the need for both academic researchers and industrial researchers to now understand the functions of genes and gene products. The cell is the basic unit of life and it has been at the cellular level where function can be demonstrated most cost-effectively and rapidly. High content screening (HCS) was developed by Cellomics Inc. in the mid-1990s to address the need for a platform that could be used in the discovery-driven research and development required to understand the functions of genes and gene products at the level of the cell.

Large-Scale Scientific Computing

Large-Scale Scientific Computing PDF Author: Ivan Lirkov
Publisher: Springer Nature
ISBN: 3030975495
Category : Computers
Languages : en
Pages : 557

Get Book Here

Book Description
This book constitutes revised selected papers from the 13th International Conference on Large-Scale Scientific Computing, LSSC 23021, which was held in Sozopol, Bulgaria, during June 7-11, 2021. The 60 papers included in this book were carefully reviewed and selected from a total of 73 submissions. The volume also includes two invited talks in full paper length. The papers were organized in topical sections as follows: Fractional diffusion problems: numerical methods, algorithms and applications; large-scale models: numerical methods, parallel computations and applications; application of metaheuristics to large-scale problems; advanced discretizations and solvers for coupled systems of partial differential equations; optimal control of ODEs, PDEs and applications; tensor and matrix factorization for big-data analysis; machine learning and model order reduction for large scale predictive simulations; HPC and big data: algorithms and applications; and contributed papers.

Molecular Imaging

Molecular Imaging PDF Author: Ralph Weissleder
Publisher: PMPH-USA
ISBN: 9781607950059
Category : Medical
Languages : en
Pages : 1384

Get Book Here

Book Description
The field of molecular imaging of living subjects have evolved considerably and have seen spectacular advances in chemistry, engineering and biomedical applications. This textbook was designed to fill the need for an authoritative source for this multi-disciplinary field. We have been fortunate to recruit over 80 leading authors contributing 75 individual chapters. Given the multidisciplinary nature of the field, the book is broken into six different sections: "Molecular Imaging technologies", "Chemistry", "Molecular Imaging in Cell and Molecular Biology", "Applications of Molecular Imaging", "Molecular Imaging in Drug Evaluation" with the final section comprised of chapters on computation, bioinformatics and modeling. The organization of this large amount of information is logical and strives to avoid redundancies among chapters. It encourages the use of figures to illustrate concepts and to provide numerous molecular imaging examples.

Advances in Protein Molecular and Structural Biology Methods

Advances in Protein Molecular and Structural Biology Methods PDF Author: Timir Tripathi
Publisher: Academic Press
ISBN: 0323902650
Category : Science
Languages : en
Pages : 716

Get Book Here

Book Description
Advances in Protein Molecular and Structural Biology Methods offers a complete overview of the latest tools and methods applicable to the study of proteins at the molecular and structural level. The book begins with sections exploring tools to optimize recombinant protein expression and biophysical techniques such as fluorescence spectroscopy, NMR, mass spectrometry, cryo-electron microscopy, and X-ray crystallography. It then moves towards computational approaches, considering structural bioinformatics, molecular dynamics simulations, and deep machine learning technologies. The book also covers methods applied to intrinsically disordered proteins (IDPs)followed by chapters on protein interaction networks, protein function, and protein design and engineering. It provides researchers with an extensive toolkit of methods and techniques to draw from when conducting their own experimental work, taking them from foundational concepts to practical application. - Presents a thorough overview of the latest and emerging methods and technologies for protein study - Explores biophysical techniques, including nuclear magnetic resonance, X-ray crystallography, and cryo-electron microscopy - Includes computational and machine learning methods - Features a section dedicated to tools and techniques specific to studying intrinsically disordered proteins

Application of Large Language Models (LLMs) for Software Vulnerability Detection

Application of Large Language Models (LLMs) for Software Vulnerability Detection PDF Author: Omar, Marwan
Publisher: IGI Global
ISBN:
Category : Computers
Languages : en
Pages : 534

Get Book Here

Book Description
Large Language Models (LLMs) are redefining the landscape of cybersecurity, offering innovative methods for detecting software vulnerabilities. By applying advanced AI techniques to identify and predict weaknesses in software code, including zero-day exploits and complex malware, LLMs provide a proactive approach to securing digital environments. This integration of AI and cybersecurity presents new possibilities for enhancing software security measures. Application of Large Language Models (LLMs) for Software Vulnerability Detection offers a comprehensive exploration of this groundbreaking field. These chapters are designed to bridge the gap between AI research and practical application in cybersecurity, in order to provide valuable insights for researchers, AI specialists, software developers, and industry professionals. Through real-world examples and actionable strategies, the publication will drive innovation in vulnerability detection and set new standards for leveraging AI in cybersecurity.

Myocarditis

Myocarditis PDF Author: Daniela Cihakova
Publisher: BoD – Books on Demand
ISBN: 953307289X
Category : Medical
Languages : en
Pages : 444

Get Book Here

Book Description
Myocarditis, the inflammation of the heart muscle, could be in some cases serious and potentially fatal disease. This book is a comprehensive compilation of studies from leading international experts on various aspects of myocarditis. The first section of the book provides a clinical perspective on the disease. It contains comprehensive reviews of the causes of myocarditis, its classification, diagnosis, and treatment. It also includes reviews of Perimyocarditis; Chagas' chronic myocarditis, and myocarditis in HIV-positive patients. The second section of the book focuses on the pathogenesis of myocarditis, discussing pathways and mechanisms activated during viral infection and host immune response during myocarditis. The third, and final, section discusses new findings in the pathogenesis that may lead to new directions for clinical diagnosis, including use of new biomarkers, and new treatments of myocarditis.

Prediction and Explanation in Biomedicine using Network-Based Approaches

Prediction and Explanation in Biomedicine using Network-Based Approaches PDF Author: Alessio Martino
Publisher: Frontiers Media SA
ISBN: 2832502229
Category : Medical
Languages : en
Pages : 128

Get Book Here

Book Description