hadoop 之 storm （程式設計模型、併發度、架構模型）

阿新 • • 發佈：2018-12-31

1、程式設計模型
2、併發度
3、架構模型

1、程式設計模型

DataSource：外部資料來源；
Spout：接受外部資料來源的元件，將外部資料來源轉化成Storm內部的資料，以Tuple為基本的傳輸單元下發給Bolt；
Bolt: 接受Spout傳送的資料，或上游的bolt的傳送的資料。根據業務邏輯進行處理，傳送給下一個Bolt或者是儲存到某種介質上，介質可以是Redis可以是mysql，或者其他；

Tuple：Storm內部中資料傳輸的基本單元，裡面封裝了一個List物件，用來儲存資料；
StreamGrouping: 資料分組策略：shuffleGrouping(Random函式), Non Grouping(Random函式), FieldGrouping(Hash取模)、Local or ShuffleGrouping 本地或隨機，優先本地。

2、併發度

使用者指定的一個任務，可以被多個執行緒執行，併發度的數量等於執行緒的數量。一個任務的多個執行緒，會被執行在多個Worker（JVM）上，有一種類似於平均演算法的負載均衡策略。儘可能減少網路IO，和Hadoop中的MapReduce中的本地計算的道理一樣。

3、架構模型

Nimbus：任務分配；
Supervisor：接受任務，並啟動worker，worker的數量根據埠號來的。
Worker:執行任務的具體元件（其實就是一個JVM）,可以執行兩種型別的任務，Spout任務或者bolt任務。
Task：Task=執行緒=executor。一個Task屬於一個Spout或者Bolt併發任務。
Zookeeper：儲存任務分配的資訊、心跳資訊、元資料資訊。

hadoop 之 storm （程式設計模型、併發度、架構模型）

目錄 1、程式設計模型 2、併發度 3、架構模型 1、程式設計模型 DataSource：外部資料來源； Spout：接受外部資料來源的元件，將外部資料來源轉化成Storm內部的

大資料之storm（一） --- storm簡介，核心元件，工作流程，安裝和部署，電話通訊案例分析，叢集執行，單詞統計案例分析，調整併發度

一、storm簡介 --------------------------------------------------------- 1.開源，分散式，實時計算 2.實時可靠的處理無限資料流，可以使用任何語言開發 3.適用於實時分析，線上機器學習

Storm WordCount程式設計模型，併發度&分組策略

程式設計模型： Spout /** * @program: WordCountSpout.class * @description: 傳輸資料到bolt,有一個抽象類BaseRichSpout，BaseRichBolt，一個介面IRichSpout,IRichBolt, * 常

Storm學習記錄（四、併發機制和通訊機制）

一、併發機制 Worker – 程序：一個Topology拓撲會包含一個或多個Worker（每個Worker程序只能從屬於一個特定的Topology）這些Worker程序會並行跑在叢集中不同的伺服器上，即一個Topology拓撲其實是由並行執行在Storm叢集中多臺伺服器上的程序所組成

Hadoop 面試題之storm （3）

storm怎麼完成對單詞的計數？（個人看完storm 後一直都認為他是流處理，好像沒有積攢資料的能力，都是處理完之後直接分發給下一個元件）【SplitBolt接收SentenceSpout發射的tuple，它將每句話分割成每個單詞，並將每個單詞作為tuple發射。再次，WordCountBolt接收S

（20）ASP.NET Core EF建立模型（必需屬性和可選屬性、最大長度、併發標記、陰影屬性）

1.必需和可選屬性如果實體屬性可以包含null，則將其視為可選。如果屬性的有效值不可以包含null，則將其視為必需屬性。對映到關係資料庫架構時，必需的屬性將建立為不可為null的列，而可選屬性則建立為可以為null的列。 1.1約定按照約定，.NET 型別可以包含null的屬性將配置為可選，而.NE

Hadoop之Storm基礎

1、離線計算是什麼　　離線計算：批量獲取資料，批量傳輸資料，週期性批量計算資料，資料展示　　代表技術：sqoop批量匯入資料，hdfs批量儲存資料，mapreduce批量計算資料，hive批量計算資料，***任務排程 2、流式就算是什麼　　流式計算：資料實時產生，資料實時傳輸，資料實時計算，實時展示

js 定位當前城市之介面定位（搜狐、新浪、百度、騰訊API）

1.搜狐API <script src="http://pv.sohu.com/cityjson?ie=utf-8"></script> <script type="text/javascript"> console.log(returnC

吞吐量、TPS、QPS、併發數、響應時間（RT）、吞吐率概念

一、QPS: 每秒鐘處理完請求的次數；注意這裡是處理完。具體是指發出請求到伺服器處理完成功返回結果。可以理解在server中有個counter，每處理一個請求加1，1秒後counter=QPS。二、TPS：每秒鐘處理完的事務次數，一般TPS是對整個系統來講的。一個應用系統1s能完成多少

吞吐量（Throughput）、QPS、併發數、響應時間（RT）對系統性能的影響

首先對吞吐量（）、QPS、併發數、響應時間（RT）幾個概念一直比較模糊，也不知道哪些指標可以較好的衡量系統的效能。今天特意查了些資料做一些記錄：首先看一些概念（來自百度百科） 1. 響應時間(RT) 　　響應時間是指系統對請求作出響應的時間。直觀上看，這個指標與人

hadoop之安裝（一）

我是在阿里雲伺服器ECS上安裝的，這個雲伺服器上面自帶的ubutun 14.04版本，如果是一般的學習的話電腦配置還可以的話，安裝個vmware裝個linux系統也可以，但電腦配置不好可能會影響學習體驗一.安裝JDK 安裝jdk apt-get ins

linux驅動由淺入深系列：usb子系統之三（usb系統中的裝置、配置、介面、端點概念及程式碼解釋）

一個usb裝置對應一個或多個配置一個配置包含一個或多個usb介面一個usb介面可能存在一種或多種設定一個設定會使用零個或多個usb端點裝置裝置就是一個usb物理裝置，一個usb裝置可以只包含一個簡單功能的device，也可以包含一個由hub連線的多個裝置，叫作複合裝

Hadoop之旅（7）— HDFS HA Zookeeper自動故障轉移

<property> <name>dfs.nameservices</name> <value>ns1</value> </property> <property&g

程式設計師求職之道（《程式設計師面試筆試寶典》）之快樂程式設計的好習慣有哪些？

這一點錯，那一點錯，錯到一起就是大錯。——《我是特種兵之利刃出鞘》程式設計是一項聰明人玩的遊戲，它既是對智力的考驗，也是對習慣的考驗，智力的好壞取決於父母的基因，人們無從左右，但習慣的好壞卻是可以不斷培養。一項由美國芝加哥大學國家研究組織進行的綜合社會調查，公佈了“十大最痛苦

【STM庫應用】stm32 之 TIM （詳解二脈衝寬度、週期測量）

昨天已經把這個研究出來了，但是由於該專利申請書，一直沒有時間上傳，今天補上！今天主要是用TIM3進行PWM的輸入模式，進行對矩形波的脈衝訊號寬度以及其週期進行測量，先來看一幅圖。圖1 TIM內部邏輯圖我們先來看看datasheet上是怎麼說的：

使用PHP製作簡易員工管理系統之七（MVC實現使用者資訊增、刪、改、查）

一、專案目錄結構：二、檔案Admin.class.php管理員類 <?php class Admin{ private $id; private $name; private $pass

Linux IO多路複用之epoll網路程式設計，高併發的使用例子 (含原始碼)

#include <unistd.h> #include <sys/types.h> /* basic system data types */ #include <sys/socket.h> /* basic socket definiti

吞吐量（TPS）、QPS、併發數、響應時間（RT）概念

1. 響應時間(RT) 　　響應時間是指系統對請求作出響應的時間。直觀上看，這個指標與人對軟體效能的主觀感受是非常一致

老司機帶你玩轉面試（6）：分散式鎖、併發競爭、雙寫一致

![](https://cdn.geekdigging.com/Interview/mianshi_header_1.jpg) ## 前文回顧建議前面文章沒看過的同學先看下前面的文章： [「老司機帶你玩轉面試（1）：快取中介軟體 Redis 基礎知識以及資料持久化」](https://www.geek

hadoop之yarn（優化篇）

最近一直在學習hadoop的一些原理和優化，然後也做了一些實踐，也有沒有去做實踐的，反正個人觀點都記錄下來一、yarn的介紹　　YARN的基本結構由一個ResourceManager與多個NodeManager組成。ResourceManager負責對NodeManager所持有的資源進行統一管理和排程。

hadoop 之 storm （程式設計模型、併發度、架構模型）

相關推薦