PIPELINE PILOT 介绍
Pipeline Pilot 软件介绍
一、Pipeline Pilot 软件介绍
Pipeline Pilot是一个科学智能的分析平台,提供了几千个分析组件,涉及生物、制药、化工、材料等多个学科和领域。它以图形化的形式,让用户可以像搭积木一样将各个科学组件组合成各种分析流程,从而来完成复杂科学数据的自动处理。它在优化研究创新周期、提高工作效率与减少研究和IT经费方面能发挥巨大作用,实现企业级的数据快速分析、可视化与共享,提升大范围的协作能力。
图1 Pipeline Pilot 组件示例
二、Pipeline Pilot 价值
Pipeline Pilot具有强大的数据处理能力,其利用强大的数据管道引擎处理Pipeline Pilot图形化环境中的数据,这能够促进了科学数据管理、分析和报告的开发、标准化和自动化。基于Pipeline Pilot的组件,Pipeline Pilot可以提供文本、数字和复杂科学数据的数据管理、分析和报告,包括化学结构、生物基因序列和图像;为工程师、开发人员和科学家提供快速应用程序开发环境,该环境使用图形设计界面实现标准软件开发过程;一系列的“科学模块”(>2000)可以快速创建数据处理所需的各方面组件,包括数据检索、操作、计算分析、过滤和显示;“Build-your-own” 组件可以利用标准技术,包括REST Web服务、Python、Perl和Java• 经验证的科学组件和涵盖多学科的最佳实践工作流。
使用Pipeline Pilot可以获取和部署最佳实践。您可以封装、注释和版本化企业的最佳实践,并以文档的形式记录实现特定结果的相关步骤。您生产的Pipeline Pilot Protocol可以共享给其他人,以促进合作开发和知识共享。您还可以通过Web接口,包括:Pipeline Pilot Web端口、Share Point、自定义客户端和其他方式,将您的自动化过程分享给更广泛的区域。定制报告和WEB应用程序开发您可以创建自定义的报告,汇总您的数据分析和数据挖掘的Protocols,并提供各种文本,表格,图表和图像。由于您可以完全控制布局和内容,因此您可以轻松地解释和传达您的结果。通过在单个报告中显示多个表格,图表和图像,您可以看到数据的不同视图,包括不同来源的并行比较以及以不同方式处理的数据。您可以采用多种格式部署报告,包括HTML(5),PDF,Word,Excel和PowerPoint。为了使报告更具动态性,您可以添加交互性,在报告内部,外部之间以及外部进行链接。您可以进一步扩展交互性,以创建将多个Protocols链接到一个功能单元中的Web应用程序。BIOVIA应用能力拓展 Pipeline Pilot除了是提高个人和工作组工作效率的出色工具,还可以用于扩展和增强其他BIOVIA应用程序,包括但不限于Insight,Excel for Insight,Workbook,Notebook和EKB。大多数BIOVIA应用程序都具有专门设计的扩展点,通过这些扩展点,Pilotline Pilot Protocols可以提供计算服务,创建图表或完整报告,用于从文件,数据库和在线资源中加载数据,并与其他应用程序和仪器集成。鉴于管道试验的性质,可能性是无限的!应用程序的最终用户通常不知道他们正在运行Pipeline Pilot Protocols,这意味着这些最终用户将从Pipeline Pilot和组件集合的广泛而深入的功能中受益,同时保持用户界面非常简单–按下按钮或简单的配置表格。
Pipeline Pilot 拥有强大的数据处理引擎和灵活的架构,这使得它能完美地解决研发机构面临的众多难题。Pipeline Pilot 具有以下功能:
文本、数字和包括化学结构、生物序列和科学图像在内的复杂数据结构进行数据管理、分析和生成报告。
对工程师、开发人员和领域专家来说,Pipeline Pilot 是一个快速的应用开发环境,它帮助收集用户需求并将之模型化,从而直接形成一个最终的产品系统。
提供可用于数据检索、处理、过滤和显示的可配置组件。
使用标准技术来构建自定义组件,这些标准技术包括 SOAP/Web Services、Perl、Java 和命令行方式。
提供一个灵活的、可配置的、面向服务的架构。
提供大量已由实践检验的科学组件和最佳工作流,这些组件和工作流涵盖了众多的科学领域。
能够整合第三方应用程序、数据库和已有的常用科学工具,包括微软 SharePoint、微软 Office 应用程序、化学制品注册数据库、图像数据管理系统、在线数据库(如 PubMed 和 PubChem)、专利数据库、RCSB(生物序列数据和蛋白质结构)和 BLAST(序列数据库)。Pipeline Pilot 的开放式架构使得它能够整合大量其它的第三方数据资源,包括 ODBC、JDBC 或网络服务兼容的那些资源。
所以使用PIPELINE PILOT后,您可以获得
利用现有的研究和知识产权以及自动化数据收集和过程 分析,大大加快项目进度(10倍或更多)
在单个环境中快速聚合和处理来自多个不同研究领域的 大量结构化和非结构化数据,发现隐藏在数据中的知识。
实施最佳的解决方案,确保合规性和实现不同组织见的协同合作
开发科学的仿真计算模型,降低实验研究成本
基于标准化技术和广泛接受的科学知识,快速构建和部署高质量的科学解决方案
实时报告可以帮助科研人员改进实验决策,更快地得到理想的实验结果
三、Pipeline Pilot 软件特点
3.1 强大的数据处理能力
Pipeline Pilot 能够图形化地定制符合您的要求的数据管理和信息挖掘等科研工作流程。Pipeline Pilot 中包含了几千个功能的组件(Components),您可以根据自己的需求,将其组合成不同的数据处理流程(Protocols),实现各种功能,如数据检索和处理,化合物各种性质的计算、筛选与显示等。Pipeline Pilot 平台还提供了Web服务层接口,允许您将建立的数据处理流程部署在服务器上,通过Web向外界提供服务。
3.2 灵活的数据与应用程序整合能力
Pipeline Pilot 通过一系列的标准化技术,能帮助您将各种不同格式的数据,如内部数据库,文档或任何从企业中获得的数据组织成统一有序的信息,为您的决策提供有力依据。对于科研工作者,Pipeline Pilot 还可以读取各种通用格式的化学、生物序列、文本、图像和数字信息并对它们进行实时的分析。同时,通过 SOAP、Perl、Java、VB Script 和命令行等方式,研究人员可以把工作相关的第三方软件整合成为新的组件,建立更符合自己科研习惯和要求的数据处理流程,这些新组件将被自动整合为系统模块组件的一部分,能以系统原有组件相同的方式与其他用户共享使用。
3.3 最佳流程的共享和部署能力
在 Pipeline Pilot 中,可以对数据处理流程实现自动获取,注释和版本编号,还可以方便地将建立的数据处理流程发布给其他研究人员,实现流程共享,使得团队合作开发变得更加方便。为了进行更广泛的交流,您甚至可以将您的数据处理流程通过 Pipeline Pilot 的 Web 接口发布到网络上,提供基于浏览器的使用方式,供更多人的交流和使用。
3.4 可定制的报告和网络应用的开发能力
在 Pipeline Pilot 中,可以使用表格、图表、图片和文字等定制数据报告,对数据分析和数据挖掘过程进行总结和展示,并按照您的意愿设计合适的报告布局和报告内容,从而更深入地解释所获得的结果。您在同一张报告中使用表格、图表和图像,可以从不同的视角上观察同一份数据,或使用不同的方式对不同来源的数据进行相互比较,从而得出合理的结论,为最终决策提供依据。您还可以使用多种格式输出报告,包括 HTML、PDF、Word 和 PowerPoint。
为了让您的报告更加生动,您可以在其中加入 Web 交互元素,如报告内加入超链接,各种信息提示等。您甚至可以将几个数据处理流程整合成为一个网络应用程序,由最终用户来决定显示哪些数据和用哪种方式来显示数据,而不需要最终用户设计任何数据处理流程。
3.5 系统架构和客户端类型
Pipeline Pilot 采用灵活的系统架构,其服务端支持 Windows 和 Linux平台,并可以按 Client / Server(客户端/服务器)和 Browse / Server(浏览器/服务器)两种模式来部署,使得各种流程和任务能够方便地跨平台(Windows/Linux)运行。
四、Pipeline Pilot 组件分类
在Pipeline Pilot客户端,用户可以使用Pipeline Pilot组件创建和编辑Pipeline Pilot Protocols。这些“科学计算分析模块”按科学或功能类别归类为集合。这些集合内包含许多组件,研究人员,开发人员,工程师和IT专业人员可以执行科学的和通用的数据处理功能。通过以图形方式组合组件,您可以构建用于数据检索,过滤,分析和报告的工作流。
4.1 材料建模&仿真
Pipeline Pilot中的Materials Studio Collection(MSC)模块,集成并支持 Materials Studio(MS)中主要的建模和模拟工具,可以为材料研究的预测分析和自动化工作流程提供完整的软件解决方案。与传统的材料模拟不同的是,通过Pipeline Pilot,复杂的工作流程能够被轻松迅速的开发、记录和共享,同时在与Pipeline Pilot的其它 Collection 模块相结合后,工作流能够在不同的部门内部更加深化和部署。
MSC模块使用户可以通过 Pipeline Pilot 构建多种 MS 应用程序,包括:
量化工具(CASTEP、DMol3、VAMP)
分子力学模拟工具(Forcite Plus、Amorphous Cell)
晶体结构分析工具(Polymorph Predictor、Reflex、Reflex Plus)
聚合物性质计算工具(Synthia)
分子性质预测建模(QSAR)
通过 Materials Studio 模块,用户可以:
采用属性计算组件来构建流程,从而简便地计算材料分子的复杂属性
可以直接读入和输出 Materials Studio 支持的文件格式,与Materials Studio良好互动
整合来自 Materials Studio 的脚本(MS Perl Script)应用程序
拥有对周期性结构可视化和生成报告的工具
4.2 CHEMISTRY 化学
Chemistry
通过化学智能过滤器和学习功能,可以分析,管理公司数据库中的化学物质。该集合还包括化学试剂盒-高性能数据试剂盒,使您能够在Oracle中存储和搜索化学结构和反应。
ADMET
分子集合(例如合成候选物,供应商库和筛选集合)的预 测吸收,分布,代谢,排泄和毒性(ADMET)属性。 该 集合包括人体肠道吸收,水溶性,血脑屏障渗透,血浆蛋 白结合,细胞色素P450 2D6抑制和肝毒性的模型。
4.3 生物
基因表达和质谱分析
基因表达致力于可视化,分析,注释和报告包括单个靶基 因在内的基因表达实验。 核心功能基于BioConductor,这 是用于分析和理解基因组数据的开源软件。 质谱提供了 一套全面的组件和示例协议,可创建和自动化定制的蛋白 质组学和代谢组学工作流程。
基因序列分析
在可以将模块化工具图形化链接在一起以创建实用的生物 信息学例程的环境中,分析,注释和比较生物序列。
高通量测序(NGS)
分析和解释由最新的 DNA 测序仪器生成的大量数据集。 NGS Collection 附带了各种各样的 NGS 数据分析管道,它 们准备以无与伦比的功能和灵活性来分析您的数据。
4.4 数据库 & 应用集成
集成
Integration 是基础 Pipeline Pilot 系统的一部分,可让您使 用Java,Python,REST 将现有的内部程序或第三方程序作 为计算服务纳入其中。 另外,使用ODBC和JDBC 技术从 Oracle 检索数据进行分析或报告,并将结果直接存储回自己的公司数据库中。
4.5 图像
图像处理
成像提供增强,处理,分析,集成,分类,搜索和报告图 像数据的功能。 它在统一的计算框架中将图像数据与数 字,化学,图形和文本数据集成在一起。
4.6 分析 & 统计
分析和机器学习
借助这套全面的学习和数据建模工具,针对大型现实数据 集进行了优化的统计过滤器和集群组件,可以进行强大的 分析和机器学习。 访问强大的方法,例如快速数据聚类, 贝叶斯学习,主成分分析,线性回归和偏最小二乘回归。 集合中提供了用于递归分区(RP),多目标Pareto优化和 多种 RP 方法的高级建模方法,包括单树和树型学习者林。 此外,组件可用于统计方法,以进行数据处理,聚类,学习,经典和探索性数据分析。 基础的统计引擎是广泛使 用的公共领域R统计软件包。
4.7 报告 & 可视化
报告
作为基础Pipeline Pilot 系统的一部分,Reporting 提供了一 组全面的组件来创建自定义报告,您可以使用这些报告来 显示数据分析和挖掘协议的结果。 通过完全控制要包含 的内容以及布局的方式,您可以创建高效的交流工具,与 同事共享知识。
Dashboards
使用Pipeline Pilot 内置的 HTML5 图表功能,可以轻松地为 任何设备构建现代化的响应式仪表板。
4.8 实验室
实验室数据分析
访问读取,写入,报告,可视化,操纵和执行板数据计算 的方法。该集合允许您在数据管道上收集每个数据记录, 并可以从不同维度分析您的数据。该集合还支持访问您在 分析实验室中生成的数据,例如,常用数据处理操作,例 如峰识别,峰积分,线宽分析背景检测和去除,内插,截 断,谱图缩放和平滑,谱图减法,傅里叶变换以及 NMR 特定功能。
4.9 文档搜索 & 分析
文档 & 文本
通过文档和在线资源搜索,表征和分析,可以使用新信息 来增强处理例程,并且用户可以对公共文档和内部文档进 行化学智能的文本挖掘。 编辑现有文档的高级功能可实 现手动文档编辑与自动分析以及内容插入之间的高效集成。
Clarivate Analytics
借助Clarivate Analytics Cortellis™集合,您可以通过直接从 Pipeline Pilot Protocols 的 Cortellis 数据库访问广泛的生命科 学信息,并将其与您的内部数据相互集成,从而简化与 “数据泛滥”保持一致的过程。 Cortellis 系列是 BIOVIA 与 Clarivate Analytics 之间持续合作关系的一部分,可访问 Cortellis 数据库,包括药物靶标,化合物,公司,临床试 验和结果以及专利等。
4.10 移动端访问
移动端 Pipeline Pilot Mobile 集合旨在提供对数据和信息的即时访 问。 通过使用 ScienceCloud Tasks 应用程序,最终用户可 以直接从其 iPad 或 iPhone 访问功能强大但易于使用的 Pipeline Pilot Protocols。 您可以将现有的 Pipeline Pilot Protocols 作为“任务”部署到应用程序中,通常无需更改 Protocols。 此外,Mobile 集合提供了丰富的输入文本格式 (例如,音频,GPS 位置,摄像头),可以充分利用 iOS 设备的支持触摸的环境。 您还可以将 Mobile 集合用于针 对移动设备进行优化(基于HTML5)的图表,以提供复杂 的最终用户体验。