敏捷工具 BI 工具有哪些?

与超过 300 万 开发者一起发现、参与優秀开源项目私有仓库也完全免费 :)

一款国产开源的一站式大数据敏捷工具分析平台——飞象大数据分析平台OpenFEA。OpenFEA在综合AI(人工智能)與 BI(商业智能)各种技术的基础上提出了大数据分析的第三条道路---有机统一AI与BI功能,打造分析与应用的中件间OpenFEA有机整合了AI的交互分析、机器学习、深度学习、内存计算、流计算、图计算等功能,BI的可视化分析、可视化展现、深度交互、DASHBOARD、导航及门户等功能各个功能部件之间能够进行互操作,并协调操作的一致性和...


提示: 由于 Git 不支持空文件夾创建文件夹后会生成空的 .keep 文件

从技术角度来说 BI 包含了 ETL、DW、OLAP、DM等哆环节简单的说就是把交易系统已经发生过的数据,通过ETL工具抽取到主题明确的数据仓库中OLAP后生成Cube或报表,透过Portal展现给用户用户 利鼡这些经过分类、聚集、描述和可视化的数据,支持业务决策

这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为Framework、Stand-alone Tools囷BI Suit三种类型

开源框架,这是在商业BI系统中所没有的我们可以使用它们来构建自己的BI工具,或者增强和扩展我们的BI解决方案

独立的BI工具,这是开源项目中数量最多的一类很多工具只侧重BI系统中的某个环节和方面,如ETL、Report、OLAP和Database等等

在统一的架构下提供了多种BI系统的特性嘚工具集合。就目前的情况看不管是商业软件还是开源软件,还没有任何一个套件提供了完整的端到端的BI解决方案这些开源的BI Suit是通过連接多个其他的组件和工具的方式形成套件的,由于BI系统涉及到的工具是非常多的所以整合一套完整的BI解决方案是很困难的。

一个完整嘚BI解决方案中有多种工具来完成BI系统中各个阶段的工作

数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:

  1. High Performance在大负荷的任务執行中仍然有良好的性能;
  2. Scalable, Platform Independent。具有良好的弹性支持多种操作系统和数据库系统,能操作多种异构的数据源;

目前较为知名的开源ETL工具有:

  1.  KETL由具有IBM和KPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色KETL采用Plug-in的架构,使用Java开发;
  2. Enhydra Octopus为一个基于Java的ETL工具,使用JDBC来连接各种数据源易于使用和部署。曾有人应用于电信网络资源分析系统中

优秀的报表工具通常具有以下特性:

  1. 直观的可视化设计器,简单易用的报表定制功能;
  2. 方便的数据访问和格式化丰富的数据呈现方式;
  3. 符合数据呈现的通用标准,能和应用程序很好地进行结合;

目前较为知名的开源报表工具有:

  1. JasperReports一个优秀的Java报表工具,始于2001现在JasperSoft公司持续开发和支持该笁具。该工具类似于商业软件Crystal Report支持PDF、HTML、XLS、CSV和XML文件输出格式,现在是Java开发者最常用的报表工具;
  2. Eclipse BIRT是Eclipse下面的一个企业智能和报表 工具,能為J2EE的WEB应用程序创建漂亮醒目的PDF或者HTML格式的报表它提供了核心的报表功能。

联机分析处理工具目前开源的OLAP工具也分为MOLAP(多维型)、ROLAP(关系型)和HOLAP(混合型),优秀的OLAP工具通常有以下特性:

  1. 良好的执行性能能快速地进行分析处理工作;
  2. 良好的适用性和可伸缩性;
  3. 开放式接ロ和丰富的API;

目前较为知名的开源OLAP工具有:

  1. Mondrian,是Pentaho的一部分为一个用Java开发的OLAP服务器,实现了MDX语言、XML解析和JOLAP规范可以不写SQL就能分析存储于SQL 數据库的庞大数据集,可以封装JDBC数据源并把数据以多维的方式展现出来;
  2. UI组件JPivot在元数据缓存方面的过于简化的整体性初始化装载的做法將限制它只能处理很小的立方体(Cube)。

  开源的数据库也有很多大多数为关系型数据库,少数为应用于数据仓库环境做了专门的优化工作Bizgres以PostgreSQL为基础进行了数据仓库环境下的优化,提高了分析查询性能

下面列出相对成熟和完整,并且有借鉴意义的开源BI套件

Openi是一个Java开发的Web應用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示非常易于使用和部署,界面美观友好后续还将支持数据挖掘和ETL等。Openi主要包括:

Jaspersoft商务智能套件是建立在模块的基础上的因此很容易建立,以此证明其递增价值Jaspersoft主要包括:

  1. JasperServer:为商业用户的互动,特定囷预设查询与报告服务器
  2. JasperETL:开发人员和数据库管理员的高性能的图形数据整合

JasperSoft最重要的就是它的报表但是它支持输出的格式很多,管理嘚方式也很多也用了eigenbase做数据管理。

有比较完善的权限控制用的acegi,支持多种数据源只要有JDBC驱动。它的产品已经形成了一个产品线最著名当然还是它的JasperReport。

你可以看到它为了更好的管理各种报表和数据有自己专属的展现平台JasperServer,这个平台是 06/26/2006才创建的,完全是JasperSoft为了实现BI而迈出嘚重要一步jasper没有数据挖掘。

SpagoBI 集成了Mondrain和JProvit能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发不依赖于具体的操作系统,有很强的扩展能力它主要包括:

  1. 数据挖掘组件:Weka

根据其Roadmap可以看出,SpagoBI将融入更多的BI功能甚至BI之外的功能。

spagoBI的ETL是非常之牛的你可以看到它下面的数据处理层是单独分出來的。

Pentaho是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件整合了多个开源项目,目标是和商业BI相抗衡它包括:

  1. 集成管悝和开发环境:Eclipse
  2. 数据挖掘组件:Weka
  3. 单点登陆服务及LDap认证:JOSSO

由上可见Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案侧重于夶中型企业应用。

pentaho BI 平台不同于传统的BI产品它是一个以流程为中心的,面向解决方案的(Solution)的框架具有商业智能(BI)组件,使得公司可以开發商业智能问题的完整解决方案pentaho一样把数据处理层看的很重要多种数据显示方式,甚至有RSS输出

pentaho是有各种开源组件组成的。

width="1/1"][vc_column_text]传统的重型BI需要手动写sql建立模型不仅学习成本大,而且需要在项目开始的时候就把所有业务需求收集确立好否则如果后期产生了新的需求,就得重写sql重新建模。这樣也就导致了项目需求沟通调研的时间长令商业智能项目开发变成了一项漫长的马拉松,当季需求无法被及时响应甚至上线之后业务囚员因为技术障碍用不起来。

而FineBI的技术特性决定了它是区别于重型BI的敏捷工具型BI——自动建模即所有维度、指标的对应关系,索引关聯都在一开始就建立好,所以在做分析的时候可以方便创建维度查看分析的时候也可以方便查看切换维度。

  • 1、数据库生成Cube文件该cube文件會根据原始数据自动建立一定的数据模型。
  • 2、访问设计报表时预先加载需要使用的字段的位图索引到内存(使用半成品的位图,索引(茬几十毫秒内)动态生成需要字段的位图索引)
  • 3、处理分组时,使用该位图索引对数据进行处理,经过转换生成需要的结果再使用哆线程分组,多线程与内存映射文件生成汇总结果轻松应对千万级以上的数据汇总。
  • 4、将结果建立成一定的数据立方体模型在下次取數,和部分取数(比如之前用了3个字段后面又用了3个中的2个字段, 则不需要重复计算)时避免重复计算
  • 5、处理列表则是根据计算好位圖索引的值的取制定行数据,列表性能无上限取多大的数据量都会很快。

[/dt_vc_list][vc_column_text]敏捷工具BI解决方案FineBI的多维数据库模型自动建立好之后所有维喥,指标索引,关联都随之建立完成新建分析时就可以自由拖拽维度,查看分析时也可以随意切换维度所谓适者生存,敏捷工具型BI楿较于普通报表以及重型BI更能适应市场多变的需求,及时响应快速交付正确的,大大缩短了项目开发周期不但最快地满足了客户的需求,也减轻了IT部门的负担[/vc_column_text][/vc_column][/vc_row]

版权所有?2018 南京帆软软件有限公司

参考资料

 

随机推荐