Flume是什么框架

Apache flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制。具有高可用,分布式,配置工具,其设计的原理也是基于将数据流。

Apache Flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制。flume 具有高可用,分布式,配置工具,其设计的原理也是基于将数据流,如日志数据从各种网站服务器上汇集起来存储到 HDFS,HBase 等集中存储器中。

Flume是什么框架

flume 是由 cloudera 软件公司产出的可分布式日志收集系统,后与 2009 年被捐赠了 apache 软件基金会,为 hadoop 相关组件之一。尤其近几年随着 flume 的不断被完善以及升级版本的逐一推出,特别是 flume-ng;同时 flume 内部的各种组件不断丰富,用户在开发的过程中使用的便利性得到很大的改善,现已成为 apache top 项目之一。

Flume 应用场景

比如我们在做一个电子商务网站,然后我们想从消费用户中访问点特定的节点区域来分析消费者的行为或者购买意图. 这样我们就可以更加快速的将他想要的推送到界面上,实现这一点,我们需要将获取到的她访问的页面以及点击的产品数据等日志数据信息收集并移交给 Hadoop 平台上去分析.而 Flume 正是帮我们做到这一点。现在流行的内容推送,比如广告定点投放以及新闻私人定制也是基于次,不过不一定是使用 FLume,毕竟优秀的产品很多,比如 facebook 的 Scribe,还有 Apache 新出的另一个明星项目 chukwa,还有淘宝 Time Tunnel。

Flume 的优势

1.  Flume 可以将应用产生的数据存储到任何集中存储器中,比如 HDFS,HBase

2.  当收集数据的速度超过将写入数据的时候,也就是当收集信息遇到峰值时,这时候收集的信息非常大,甚至超过了系统的写入数据能力,这时候,Flume 会在数据生产者和数据收容器间做出调整,保证其能够在两者之间提供一共平稳的数据.

3.   提供上下文路由特征

4.   Flume 的管道是基于事务,保证了数据在传送和接收时的一致性.

5.   Flume 是可靠的,容错性高的,可升级的,易管理的,并且可定制的。

4. Flume 具有的特征:

1. Flume 可以高效率的将多个网站服务器中收集的日志信息存入 HDFS/HBase 中

2. 使用 Flume,我们可以将从多个服务器中获取的数据迅速的移交给 Hadoop 中

3. 除了日志信息,Flume 同时也可以用来接入收集规模宏大的社交网络节点事件数据,比如 facebook,twitter,电商网站如亚马逊,flipkart 等

4. 支持各种接入资源数据的类型以及接出数据类型

5. 支持多路径流量,多管道接入流量,多管道接出流量,上下文路由等

6. 可以被水平扩展

本文来自投稿,不代表【】观点,发布者:【

本文地址: ,如若转载,请注明出处!

举报投诉邮箱:253000106@qq.com

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年11月13日 上午4:22
下一篇 2023年11月13日 上午4:24

相关推荐

  • Phpstudy 是什么

    PHPStudy是一个PHP调试环境的程序集成包。该程序包集成Apache、PHP、MySQL、phpMyAdmin、ZendOptimizer,是方便好用的PHP调试环境,不仅包括PHP调试环境,还有开发工具、开发手册等。 phpStudy 是一个 PHP 调试环境的程序集成包。该程序包集成 Apache、PHP、MySQL、phpMyAdmin、Zend…

    2023年11月13日
    1800
  • Apache 是什么

    Apache是使用最广泛的Web服务器软件。Apache是由Apache Software Foundation开发和维护的,它是一个免费提供的开源软件。它占全球所有网络服务器的67%。 Apache 是​​使用最广泛的 Web 服务器软件。Apache 是​​由 Apache Software Foundation 开发和维护的,它是一个免费提供的开源软件…

    2023年11月12日
    1600
  • htaccess 是什么

    .htaccess文件是Apache HTTP Server的配置文件,允许管理员为各个目录指定选项。语法与Apache的其他配置文件完全相同,该文件放在提供Web页面的目录中。 .htaccess 文件是 Apache HTTP Server 的配置文件,允许管理员为各个目录指定选项。语法与 Apache 的其他配置文件完全相同。该文件放在提供 Web 页…

    2023年11月12日
    1900
  • Apache软件介绍

    Apache II评分系统官方版是一款用于医疗行业的评分工具,ApacheII评分系统电脑版只需输入病人的基本资料、急性生理学数据、慢性手术情况,即可根据Apache-II评分系统快速给出APS总分、CHS评分以及总评分和R值,ApacheII评分系统由APS、年龄、CPS三部分组成,专为ICU量身打造。 软件介绍 Apache II评分系统官方版,原APA…

    2023年10月22日
    500
  • win10系统apache启动失败的处理教程

    如果你使用win10系统遇到了Apache启动失败还不会处理的话,就来下文学习学习win10系统apache启动失败的处理教程吧,希望可以帮助到大家。 win10系统apache启动失败的处理教程 Apache启动失败的三种问题 一、端口占用问题 1、这个是最有可能出现无法启动的问题之一,运行CMD然后执行netstat -aon | findstr :80…

    2023年10月19日 用户投稿
    600
  • win8系统apache服务启动失败解决方法

    今天小编就带大家来共同学习win8系统Apache服务启动失败解决方法?希望可以帮助到有需要的小伙伴哦,下面就是详细完整的操作步骤。 win8系统apache服务启动失败解决方法 1、首先,打开浏览器,在其中输入localhost按回车,如果出现如下图所示的页面,则继续。如果出现响应,则很有可能是您的其它服务器还开着,如IIS,需要先关闭这些服务器。因为这些…

    2023年10月15日 用户投稿
    600
  • Apache Log4j是什么

    Log4j是Apache的一个开源项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件,甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等。 Log4j 是 Apache 的一个开源项目,通过使用 Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI 组件,甚至是套接口服务器、NT 的事件记录…

    2023年9月23日
    1400
  • Hadoop YARN是什么

    Apache Hadoop YARN是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源…

    2023年9月16日
    1200
  • Apache ActiveMQ是什么

    Apache ActiveMQ是Apache软件基金会所研发的开放源代码消息中间件;由于ActiveMQ是一个纯java程序,因此只需要操作系统支持Java虚拟机,ActiveMQ便可执行。 Apache ActiveMQ 是 Apache 软件基金会所研发的开放源代码消息中间件;由于 ActiveMQ 是一个纯 Java 程序,因此只需要操作系统支持 Ja…

    2023年9月15日
    3300
  • flume是什么

    Apache flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制。具有高可用,分布式,配置工具,其设计的原理也是基于将数据流。 Apache Flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制。f…

    2023年9月12日
    1500



微信客服