pca各個向量之間的相關度_PCA與SVD之間的關係

阿新 • • 發佈：2020-12-31

一、叢集目錄檔案分發

1. scp（secure copy）安全拷貝

 1）scp定義：
  scp可以實現伺服器與伺服器之間的資料拷貝。（from server1 to server2）
（2）基本語法
  scp    -r          $pdir/$fname              $user@hadoop$host:$pdir/$fname
  命令   遞迴       要拷貝的檔案路徑/名稱    目的使用者@主機:目的路徑/名稱
  （a）在hadoop102上，將hadoop102中/opt/module目錄下的軟體拷貝到hadoop103上
        scp -r /opt/module  atguigu@hadoop103:/opt/module
  （b）在hadoop104上，將hadoop102伺服器上的/opt/module目錄下的軟體拷貝到hadoop104上。
        scp -r atguigu@hadoop102:/opt/module /opt/module
  （c）在hadoop103上操作將hadoop102中/opt/software目錄下的軟體拷貝到hadoop104上。
        scp -r atguigu@hadoop102:/opt/software atguigu@hadoop104:/opt/software

2. rsync 遠端同步工具（只能分發自己機器上的）

rsync和scp區別：用rsync做檔案的複製要比scp的速度快，rsync只對差異檔案做更新。scp是把所有檔案都複製過去。
rsync    -av       $pdir/$fname              $user@hadoop$host:$pdir/$fname
  命令   選項引數   要拷貝的檔案路徑/名稱    目的使用者@主機:目的路徑/名稱
  -a 歸檔拷貝   -v 顯示覆制過程
  a）把hadoop102機器上的/opt/software目錄同步到hadoop103伺服器的/opt/software目錄下
  rsync -av /opt/software/ atguigu@hadoop103:/atguigu /software

3.xsync叢集分發指令碼

 1.迴圈複製檔案到所有節點的相同目錄下:
 2.基於rsync技術將檔案從一個節點同步到其他所有節點    xsync  要同步的檔名稱 
 3.指令碼實現(一般會把指令碼放到使用者的家目錄下的bin目錄下，因為這個路徑下會直接放到環境變數中）
  在/home/atguigu目錄下建立bin目錄，並在bin目錄下建立xsync檔案
  說明：在/home/atguigu/bin這個目錄下存放的指令碼，atguigu使用者可以在系統任何
  地方直接執行。因為/home/atguigu/bin在系統的PATH環境變數中。

#!/bin/bash
#1. 判斷引數個數
if [ $# -lt 1 ]
then
  echo Not Enough Arguement!
  exit;
fi
#2. 遍歷叢集所有機器
for host in hadoop102 hadoop103 hadoop104
do
  echo ====================  $host  ====================
  #3. 遍歷所有目錄，挨個傳送
  for file in $@
  do
    #4 判斷檔案是否存在
    if [ -e $file ]
    then
      #5. 獲取父目錄
      pdir=$(cd -P $(dirname $file); pwd)
      #6. 獲取當前檔案的名稱
      fname=$(basename $file)
      ssh $host "mkdir -p $pdir"
      rsync -av $pdir/$fname $host:$pdir
    else
      echo $file does not exists!
    fi
  done
done

（b）修改指令碼 xsync 具有執行許可權
  chmod +x xsync
 c）測試指令碼
  xsync /home/atguigu/xsync

二、hadoop叢集配置

1.配置叢集資訊（修改hadoop的自定義配置檔案）

1.配置：hadoop-env.sh （路徑：$HADOOP_HOME/etc/hadoop ）可以不修改 hadoop 3.x 之後不影響

        export JAVA_HOME=/opt/module/jdk1.8.0_212      （不知道jdk的路徑的話  echo $JAVA_HOME）

2.配置core-site.xml (核心配置檔案)（路徑：$HADOOP_HOME/etc/hadoop ）

      cd $HADOOP_HOME/etc/hadoop
      vim core-site.xml

檔案內容如下：

    <!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:8020</value>
</property>
<!-- 指定hadoop資料的儲存目錄  
      
      官方配置檔案中的配置項是hadoop.tmp.dir ,用來指定hadoop資料的儲存目錄,此次配置用的hadoop.data.dir是自己定義的變數， 因為在hdfs-site.xml中會使用此配置的值來具體指定namenode 和 datanode儲存資料的目錄

-->
    <property>
        <name>hadoop.data.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
</property>



<!-- 下面是相容性配置，先跳過 -->
<!-- 配置該atguigu(superUser)允許通過代理訪問的主機節點 -->
    <property>
        <name>hadoop.proxyuser.atguigu.hosts</name>
        <value>*</value>
</property>
<!-- 配置該atguigu(superuser)允許代理的使用者所屬組 -->
    <property>
        <name>hadoop.proxyuser.atguigu.groups</name>
        <value>*</value>
</property>
<!-- 配置該atguigu(superuser)允許代理的使用者-->
    <property>
        <name>hadoop.proxyuser.atguigu.users</name>
        <value>*</value>
    </property>

3.配置hdfs-site.xml HDFS配置檔案

      cd $HADOOP_HOME/etc/hadoop
      vim hdfs-site.xml

檔案內容如下：

<!-- 指定副本數  -->
<property>
  <name>dfs.replication</name>
  <value>3</value>
</property>
	
<!-- 指定NameNode資料的儲存目錄 -->
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file://${hadoop.data.dir}/name</value>
  </property>
 <!-- 指定Datanode資料的儲存目錄 -->

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file://${hadoop.data.dir}/data</value>
  </property>
    
   <!-- 指定SecondaryNameNode資料的儲存目錄 -->

    <property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>file://${hadoop.data.dir}/namesecondary</value>
  </property>
   
   <!-- 相容配置，先跳過 -->
    <property>
    <name>dfs.client.datanode-restart.timeout</name>
    <value>30s</value>
  </property>

  <!-- nn web端訪問地址-->
<property>
  <name>dfs.namenode.http-address</name>
  <value>hadoop102:9870</value>
</property>
  <!-- 2nn web端訪問地址-->

  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop104:9868</value>
</property>

4.配置yarn-site.xml YARN配置檔案

      cd $HADOOP_HOME/etc/hadoop
      vim yarn-site.xml

 檔案內容如下：

<!--NodeManager上執行的附屬服務。需配置成mapreduce_shuffle，才可執行MapReduce程式-->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
 <!-- 指定ResourceManager的地址-->
<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
</property>
<!-- 環境變數的繼承 -->
<property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>
<!--  取消虛擬記憶體的限制 -->
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>

5.配置mapred-site.xml MapReduce配置檔案

      cd $HADOOP_HOME/etc/hadoop
      vim mapred-site.xml

 檔案內容如下：

<!-- 指定MapReduce程式執行在Yarn上 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

2.在叢集上分發配置好的hadoop

xsync /opt/module/hadoop-3.1.3

3.叢集單點啟動

1）如果叢集是第一次啟動，需要格式化NameNode
hdfs namenode -format
2）在hadoop102上啟動NameNode
 hdfs --daemon start namenode
3）完成後執行jps命令，看到如下結果（程序號可能不同）
   2867 NameNode
4）在hadoop102、hadoop103以及hadoop104上執行如下命令（三臺都要執行  xshell 工具的群發功能）啟動datanode
   hdfs --daemon start datanode
5）	在hadoop104上啟動secondarynamenode
  hdfs --daemon start secondarynamenode
6）在hadoop103上啟動ResourceManager
  yarn --daemon start resourcemanager
7）在hadoop102、hadoop103以及hadoop104上執行如下命令（三臺都要執行）啟動nodemanager
  yarn --daemon start nodemanager

4.叢集單點關閉

YRAN  和 HDFS無先後順序
1）在hadoop102、hadoop103以及hadoop104上關閉DataNode(Xshell群發功能)
 hdfs --daemon stop datanode
2）在hadoop102上關閉NameNode 
  hdfs --daemon stop namenode
3）	在hadoop104上關閉SecondaryNameNode
  hdfs --daemon stop secondarynamenode
4)在hadoop102、hadoop103以及hadoop104上關閉NodeManager(Xshell群發功能)
  yarn --daemon stop nodemanager
5)在hadoop103上關閉ResourceManager
   yarn --daemon stop resourcemanager

5.配置免密

（1）分別在hadoop102 hadoop103 hadoop104三臺機器上生成公鑰和私鑰：
    ssh-keygen -t rsa
   然後敲（三個回車），就會在 ~/.ssh目錄下生成兩個檔案
     id_rsa（私鑰）、id_rsa.pub（公鑰）

（2）分別在hadoop102 hadoop103 hadoop104執行,將公鑰拷貝到要免密登入的目標機器上  自身機器也要配置
  ssh-copy-id hadoop102
  ssh-copy-id hadoop103
  ssh-copy-id hadoop104

pca各個向量之間的相關度_PCA與SVD之間的關係

技術標籤：pca各個向量之間的相關度在用資料對模型進行訓練時，通常會遇到維度過高，也就是資料的特徵太多的問題，有時特徵之間還存在一定的相關性，這時如果還使用原資料訓練模型，模型的精度會大大下降，

java實體物件與Map之間的轉換工具類程式碼例項

這篇文章主要介紹了java實體物件與Map之間的轉換工具類程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

在Java與Kotlin之間如何進行互操作詳解

前言目前kotlin是谷歌首推的開發Android的語言，但由於歷史原因，我們絕大部分專案依舊還是以Java為主的，也就是說存在Java和Kotlin兩種語言同時開發的情況。

C# char[]與string byte[]與string之間的轉換詳解

1、char[]與string之間的轉換 //string 轉換成 Char[] string str=\"hello\"; char[] arr=str.ToCharArray();

Pyorch之numpy與torch之間相互轉換方式

numpy中的ndarray轉化成pytorch中的tensor : torch.from_numpy() pytorch中的tensor轉化成numpy中的ndarray : numpy()

Mysql中關於表與表之間連線查詢的問題

三種連線方式一對一：兩張表為一一對應的關係，如編號01在表1與表2中僅有一條記錄，現實中極為少見

node.js實現http伺服器與瀏覽器之間的內容快取操作示例

本文例項講述了node.js實現http伺服器與瀏覽器之間的內容快取操作。分享給大家供大家參考，具體如下：

vue與iframe之間的資訊互動的實現

說一下我的使用場景：在vue中使用百度地圖，需要使用離線地圖先上程式碼然後細細品第一張圖

window10與Ubuntu之間的檔案傳輸——FileZilla實現

參考文章源地址： https://blog.csdn.net/songyunli1111/article/details/79792958?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase&depth_1-utm_source=distrib

uniapp與webview之間的相互傳值的實現

1.uni-app 如何傳送資料到 H5？其實很接單、在 web-view 中只需要通過 URL 就可以向 H5 進行傳參例如在 uni-app 中：

位元組陣列與檔案之間的相互轉換的工具

工具程式碼： 1 using System; 2 using System.IO; 3 4 /// <summary> 5 /// 位元組陣列與檔案之間的相互轉換的介面

rabbitmq傳送訊息的兩種格式：傳送json資料和直接傳送物件以及對json與物件之間的相互轉換

前奏：json格式字串與Java物件的相互轉換方法第一種：com.fasterxml.jackson.databind.ObjectMapper 包

Docker實用技巧（三）：容器與主機之間的埠對映

docker容器想要實現一些網路通訊的功能，就需要埠對映，這裡想實現三個目標：埠對映、多埠對映、xshell遠端登陸docker容器。

Java 字串與byte之間的相互轉換

原理我們都知道，在Java裡byte型別是佔用1個位元組，即8位的，而16進位制的字元佔用4位，所以每個byte可以用兩個字元來表示，反之亦然。

檢視與控制器之間的互動

向檢視中分配動態資料並顯示輸出，都是在控制器類的某個操作方法中完成的。我們自定義的控制器類都間接地繼承了 Smarty 類，所以在每個控制器類中都可以直接使用$this 訪問從Smarty 類中繼承過來的成員。在每個模組控

pymysql模組，python與MySQL之間的互動

import pymysql db = pymysql.connect(host=\"192.168.137.1\", port=3306, user=\"wu\", password=\"123456\", db=\"爸爸測試\",

pytest與unittest之間的故事

unittest-- 寫用例 - TestCase-- 收集用例 -TestLoader.discover()-- 生成報告 -HtmlTestRunner-- 模板pytest-- 能夠執行unittest用例-- 靈活nosebehave - 行為驅動共同點：1、測試框架 - 通過python程式碼來編寫測試

C# int與byte之間轉換的方法

方法1：使用左移和右移 int轉化為byte[]: publicbyte[] intToBytes(int value) { byte[] src = new byte[4];

詞距與關鍵詞之間的詞頻詞距統計操作

需求： tid ：帖子的id 　　　　sentence num：句子在帖子中的編號　　　　wordindex：分好的每個詞在帖子中的位置

C/C++ 實現VA與FOA之間的轉換

PE結構中的地址互轉，這次再來系統的複習一下關於PE結構中各種地址的轉換方式，最終通過程式設計來實現自動解析計算。

pca各個向量之間的相關度_PCA與SVD之間的關係

一、叢集目錄檔案分發

1. scp（secure copy）安全拷貝

2. rsync 遠端同步工具 （只能分發自己機器上的）

3.xsync叢集分發指令碼

二、hadoop叢集配置

1.配置叢集資訊（修改hadoop的自定義配置檔案）

1.配置：hadoop-env.sh （路徑：$HADOOP_HOME/etc/hadoop ） 可以不修改 hadoop 3.x 之後不影響

2.配置core-site.xml (核心配置檔案)（路徑：$HADOOP_HOME/etc/hadoop ）

3.配置hdfs-site.xml HDFS配置檔案

4.配置yarn-site.xml YARN配置檔案

5.配置mapred-site.xml MapReduce配置檔案

2.在叢集上分發配置好的hadoop

3.叢集單點啟動

4.叢集單點關閉

5.配置免密

相關推薦

2. rsync 遠端同步工具（只能分發自己機器上的）

1.配置：hadoop-env.sh （路徑：$HADOOP_HOME/etc/hadoop ）可以不修改 hadoop 3.x 之後不影響