传统上,BI 一直是一个无流程的区域。决策者都是如此自由的思想家,以至于建议他们的工作方法可以通过某种呆板的过程来定义,通常会遭到嘲笑。或者更糟。
数据整合传统上,BI 一直是一个无流程的区域。决策者都是如此自由的思想家,以至于建议他们的工作方法可以通过某种呆板的过程来定义,通常会遭到嘲笑。或者更糟。BI 供应商和开发人员基本上已经默许了。您看到提到的流程的唯一地方是数据集成,其中大量活动流程图定义了填充数据仓库和集市所需的步骤。
另一方面,我长期以来一直认为——事实上,自世纪之交以来——所有决策都遵循一个过程,尽管是一个非常灵活和适应性强的过程。早期的证据出现在运营 BI(或称为决策管理)中,其中决策步骤嵌入到相当传统的运营流程中。随着预测和运营分析变得越来越流行,信息和运营的这种混合使得这些曾经截然不同的业务行为变得难以区分。一个相对简单的思想实验就会得出这样的结论:所有决策都有一个潜在的过程。
我在早期阶段也相当确定,只有面向 国家电子邮件列表 服务的架构 (SOA) 方法才能提供所需的灵活且自适应的活动和工作流程。我进一步看到,随着近实时决策需求的增长,SOA 可以(并且需要)成为数据集成的基础。因此,多年来我一直在研讨会和会议上讨论这一切。但每当我提到 SOA 时,房间里就会响起不满的声音。太复杂了。尝试了一下,失败了。而且,最近,云计算和移动设备的应用不都已经过时了吗?

更多阅读
去年 SOA 增长快于预期的 5 个原因
分析师:“每个云背后都需要 SOA:”
SOA 已转变为云的 5 个迹象
最后:云基础设施即服务标准推出
“小型”SOA 治理的六个步骤
所有这些都是对我本周从Talend产品营销总监 Pat Pruchnickyj 那里收到的一份非常有趣的简报的介绍,他恢复了我对 SOA 作为整体方法及其实际应用的信心!尽管 Talend 最出名的可能是 2006 年首次推出的开源 ETL(提取、转换和加载)和数据集成工具,但如今,Talend 拥有更广阔的视野,提供以数据为中心的解决方案,例如 ETL 和数据质量以及开源应用程序集成解决方案,例如企业服务总线 (ESB) 和消息队列。这些不同的方法通过通用元数据统一起来,通常通过图形化、面向工作流程的工具 Talend Open Studio 创建和管理。
那么,为什么这很重要?如果您了解 BI 的历史,您就会知道许多完善的实施的特点是复杂且通常长时间运行的批处理流程,这些流程将来自多个内部运营源的数据收集、整合和清理到数据仓库中,然后再发送到集市。在大量数据来自外部源(大数据的很大一部分)并且分析对近实时数据的要求越来越高的时代,这种模型的扩展性很差。在这些情况下,基于文件的数据集成成为一个挑战。最简单的方法可能是转向以微批次运行的更小的文件。然而,最终的要求是在源和目标应用程序/数据库之间实现基于消息的通信。这需要大多数 BI 开发人员从根本上改变思维。因此,ETL 的起点和消息传递的终点都在类似 ETL 的通用工作流程下,使得增长更加容易。开发人员可以开始看到数据传输/清理服务在概念上类似于也作为服务提供的任何业务活动。创建结合运营和信息流程的工作流程以支持运营 BI 的可能性自然而然地出现。
这是不是说 ETL 工具正在消亡?当然不是。对于某些类型和规模的数据集成,基于文件的方法将继续提供更高的性能或更广泛的集成和清理功能。关键是确保所有不同类型的数据和应用程序集成之间具有通用的、共享的元数据(或者我更喜欢称之为上下文设置信息,CSI)。