elasticsearch使用筆記
http://www.elasticsearch.org/overview/elkdownloads/下載對應系統的安裝包(我下載的是tar的),下載解壓以後運行es根目錄下bin目錄的elasticsearch命令(無需配置直接啟動),啟動後如果能看到類似於下面情況的大量的“INFO”信息。
(O_O)~/software/elasticsearch/elasticsearch-1.4.0/bin(O_O)./elasticsearch
[2014-11-17 10:48:15,563][INFO ][node ] [bf1] version[1.4.0], pid[21187], build[bc94bd8/2014-11-05T14:26:12Z] [2014-11-17 10:48:15,563][INFO ][node ] [bf1] initializing ... [2014-11-17 10:48:15,630][INFO ][plugins ] [bf1] loaded [], sites [head] Java HotSpot(TM) Client VM warning: You have loaded library /home/bf/software/elasticsearch/elasticsearch-1.4.0/lib/sigar/libsigar-x86-linux.so which might have disabled stack guard. The VM will try to fix the stack guard now. It‘s highly recommended that you fix the library with ‘execstack -c <libfile>‘, or link it with ‘-z noexecstack‘. [2014-11-17 10:48:20,950][INFO ][node ] [bf1] initialized [2014-11-17 10:48:20,950][INFO ][node ] [bf1] starting ... [2014-11-17 10:48:21,128][INFO ][transport ] [bf1] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/192.168.1.41:9300]} [2014-11-17 10:48:21,169][INFO ][discovery ] [bf1] baifan/umHszDJERCqepk1knkERFw [2014-11-17 10:48:24,969][INFO ][cluster.service ] [bf1] new_master [bf1][umHszDJERCqepk1knkERFw][bf][inet[/192.168.1.41:9300]]{master=true}, reason: zen-disco-join (elected_as_master) [2014-11-17 10:48:25,028][INFO ][http ] [bf1] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/192.168.1.41:9200]} [2014-11-17 10:48:25,028][INFO ][node ] [bf1] started [2014-11-17 10:48:25,886][INFO ][gateway ] [bf1] recovered [4] indices into cluster_state
elasticsearch服務端默認端口為9200,啟動以後可以在瀏覽器地址欄輸入http://localhost:9200/後會返回一個json信息,類似於下面這樣,status等於200則說明啟動成功。bf1是我自己設置的當前機器節點名(node.name),cluster_name為baifan,這些都是我自己設置的,elasticsearch本身有默認配置,如果僅僅是測試和了解,可以不設。
{ "status" : 200, "name" : "bf1", "cluster_name" : "baifan", "version" : { "number" : "1.4.0", "build_hash" : "bc94bd81298f81c656893ab1ddddd30a99356066", "build_timestamp" : "2014-11-05T14:26:12Z", "build_snapshot" : false, "lucene_version" : "4.10.2" }, "tagline" : "You Know, for Search" }
配置文件詳解
配置文件位於es根目錄的config目錄下面,有elasticsearch.yml和logging.yml兩個配置,主配置文件是elasticsearch.yml,日誌配置文件是logging.yml,elasticsearch調用log4j記錄日誌,所以日誌的配置文件可以按照默認的設置,我來介紹下elasticsearch.yml裏面的選項。
cluster.name: elasticsearch
配置的集群名稱,默認是elasticsearch,es服務會通過廣播方式自動連接在同一網段下的es服務,通過多播方式進行通信,同一網段下可以有多個集群,通過集群名稱這個屬性來區分不同的集群。
node.name: "Franz Kafka"
當前配置所在機器的節點名,你不設置就默認隨機指定一個name列表中名字,該name列表在es的jar包中config文件夾裏name.txt文件中,其中有很多作者添加的有趣名字。
node.master: true
指定該節點是否有資格被選舉成為node(註意這裏只是設置成有資格, 不代表該node一定就是master),默認是true,es是默認集群中的第一臺機器為master,如果這臺機掛了就會重新選舉master。
node.data: true
指定該節點是否存儲索引數據,默認為true。
index.number_of_shards: 5
設置默認索引分片個數,默認為5片。
index.number_of_replicas: 1
設置默認索引副本個數,默認為1個副本。如果采用默認設置,而你集群只配置了一臺機器,那麽集群的健康度為yellow,也就是所有的數據都是可用的,但是某些復制沒有被分配(
健康度可用 curl ‘localhost:9200/_cat/health?v‘ 查看, 分為綠色、黃色或紅色。綠色代表一切正常,集群功能齊全,黃色意味著所有的數據都是可用的,但是某些復制沒有被分配,紅色則代表因為某些原因,某些數據不可用)。
path.conf: /path/to/conf
設置配置文件的存儲路徑,默認是es根目錄下的config文件夾。
path.data: /path/to/data
設置索引數據的存儲路徑,默認是es根目錄下的data文件夾,可以設置多個存儲路徑,用逗號隔開,例:
path.data: /path/to/data1,/path/to/data2
path.work: /path/to/work
設置臨時文件的存儲路徑,默認是es根目錄下的work文件夾。
path.logs: /path/to/logs
設置日誌文件的存儲路徑,默認是es根目錄下的logs文件夾
path.plugins: /path/to/plugins
設置插件的存放路徑,默認是es根目錄下的plugins文件夾, 插件在es裏面普遍使用,用來增強原系統核心功能。
bootstrap.mlockall: true
設置為true來鎖住內存不進行swapping。因為當jvm開始swapping時es的效率 會降低,所以要保證它不swap,可以把ES_MIN_MEM和ES_MAX_MEM兩個環境變量設置成同一個值,並且保證機器有足夠的內存分配給es。 同時也要允許elasticsearch的進程可以鎖住內存,linux下啟動es之前可以通過`ulimit -l unlimited`命令設置。
network.bind_host: 192.168.0.1
設置綁定的ip地址,可以是ipv4或ipv6的,默認為0.0.0.0,綁定這臺機器的任何一個ip。
network.publish_host: 192.168.0.1
設置其它節點和該節點交互的ip地址,如果不設置它會自動判斷,值必須是個真實的ip地址。
network.host: 192.168.0.1
這個參數是用來同時設置bind_host和publish_host上面兩個參數。
transport.tcp.port: 9300
設置節點之間交互的tcp端口,默認是9300。
transport.tcp.compress: true
設置是否壓縮tcp傳輸時的數據,默認為false,不壓縮。
http.port: 9200
設置對外服務的http端口,默認為9200。
http.max_content_length: 100mb
設置內容的最大容量,默認100mb
http.enabled: false
是否使用http協議對外提供服務,默認為true,開啟。
gateway.type: local
gateway的類型,默認為local即為本地文件系統,可以設置為本地文件系統,分布式文件系統,hadoop的HDFS,和amazon的s3服務器等。
gateway.recover_after_nodes: 1
設置集群中N個節點啟動時進行數據恢復,默認為1。
gateway.recover_after_time: 5m
設置初始化數據恢復進程的超時時間,默認是5分鐘。
gateway.expected_nodes: 2
設置這個集群中節點的數量,默認為2,一旦這N個節點啟動,就會立即進行數據恢復。
cluster.routing.allocation.node_initial_primaries_recoveries: 4
初始化數據恢復時,並發恢復線程的個數,默認為4。
cluster.routing.allocation.node_concurrent_recoveries: 2
添加刪除節點或負載均衡時並發恢復線程的個數,默認為4。
indices.recovery.max_size_per_sec: 0
設置數據恢復時限制的帶寬,如入100mb,默認為0,即無限制。
indices.recovery.concurrent_streams: 5
設置這個參數來限制從其它分片恢復數據時最大同時打開並發流的個數,默認為5。
discovery.zen.minimum_master_nodes: 1
設置這個參數來保證集群中的節點可以知道其它N個有master資格的節點。默認為1,對於大的集群來說,可以設置大一點的值(2-4)
discovery.zen.ping.timeout: 3s
設置集群中自動發現其它節點時ping連接超時時間,默認為3秒,對於比較差的網絡環境可以高點的值來防止自動發現時出錯。
discovery.zen.ping.multicast.enabled: false
設置是否打開多播發現節點,默認是true。
discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
設置集群中master節點的初始列表,可以通過這些節點來自動發現新加入集群的節點。
基本操作
設置集群中master節點的初始列表,可以通過這些節點來自動發現新加入集群的節點。
elasticsearch使用筆記