極簡python教程02：基礎變數，刪繁就簡

阿新 • • 發佈：2020-12-06

一、hive用本地檔案進行詞頻統計

1.準備本地txt檔案

mkdir wc
cd wc
echo "hadoop hbase" > f1.txt
echo "hadoop hive" > f2.txt

2.啟動hadoop，啟動hive

start-all.sh
hive

3.建立資料庫，建立文字表

use hive;
create table if not exists wctext(line string); 
show tables;

4.對映本地檔案的資料到文字表中

load data local inpath '/home/hadoop/wc/f1.txt' into table wctext;
load data local inpath '/home/hadoop/wc/f2.txt' into table wctext;
select * from wctext;

5.hql語句進行詞頻統計交將結果儲存到結果表中

SELECT word, count(1) AS count FROM  (SELECT explode(split(line, ‘ ’)) AS word FROM wctext) w GROUP BY word ORDER BY word;
create table wc as SELECT word, count(1) AS count FROM  (SELECT explode(split(line, ' ')) AS word FROM wctext) w GROUP BY word ORDER BY word;

6.檢視統計結果

select * from wc;

二、hive用HDFS上的檔案進行詞頻統計

1.準備電子書或其它大的文字檔案

2.將文字檔案上傳到HDFS上

hdfs dfs -put ~/wc/f3.txt /input

3.建立文字表

create table if not exists docs(line string);
show tables;

4.對映HDFS中的檔案資料到文字表中

load data inpath '/input/f3.txt' into table docs;

5.hql語句進行詞頻統計交將結果儲存到結果表中

create table wctest as SELECT word, count(1) AS count FROM  (SELECT explode(split(line, ' ')) AS word FROM docs) w GROUP BY word ORDER BY word;
SELECT word, count(1) AS count FROM  (SELECT explode(split(line, ‘ ’)) AS word FROM docs) w GROUP BY word ORDER BY word;

6.檢視統計結果

select * from wctest;

極簡python教程02：基礎變數，刪繁就簡

python極簡教程已經開賽，如果錯過說明可以回翻：極簡python教程：賽前說明借這個機會，我再講講我的教程和其他網上的教程的區別：

python極簡教程01：基礎變數

測試奇譚，BUG不見。其實很久之前，就有身邊的同事或者網友讓我分享一些關於python程式語言的教程，他們同大多數自學程式語言的人一樣，無外乎遇到以下這些問題：

Java基礎總結02：環境變數的配置

（一）Windows系統下配置環境變數 ※在\"系統變數\"中設定3項屬性JAVA_HOME、PATH、CLASSPATH(JDK1.5之後此項屬性不必再配)，若已存在則點選\"編輯\"，不存在則點選\"新建\"※

activiti 5.22介面文件_Activiti極簡入門教程

技術標籤：activiti 5.22介面文件 activiti極簡入門大綱 1.activiti簡介 2.BPMN2.0流程定義規範

30 個極簡Python程式碼，拿走即用（真乾貨）

1、列表重複元素判定以下方法可以檢查給定列表是不是存在重複元素，它會使用 set() 函式來移除所有重複元素。

中興通訊業界首創“極簡車載 5G 方案”：極大提高車廂內 5G 網路質量

11 月 12 日訊息，根據中興官方的訊息，在中國電信 2021 天翼智慧生態博覽會上，中興通訊釋出了業界首創“極簡車載 5G 方案”並展示方案定製產品。官方表示，該創新方案適配 5G 行業應用發展新需求，通過車載數字基

微軟 Win11 極簡工作列上手：優化平板體驗，但也缺了點小功能

4 月 22 日訊息，微軟正在為 Windows 11 試驗一個新的極簡工作列，改進了隱藏托盤的 UI，並進行了一些相關的更改，以迎合喜歡簡潔工作列的人，但與此同時，另一個工作列功能也消失了。據 Windows Latest 的上手體驗

python配置了系統環境變數，也在安裝目錄的Scripts下找到pip.exe檔案，但還是報“Did not provide a command”解決方案

錯誤原因分析：輸入where pip發現有三個pip檔案，此時會識別不了到底找哪個，但輸入pip3發現是可以的。解決方案：到c盤下把這兩個目錄直接刪除再次輸入pip list 或pip --version出現如下頁面代表問題解決

PW8600極簡80V轉5V的LDO晶片，PW8600代理

PW8600一般說明 PW8600系列專為功率敏感型應用而設計。它包括一個精密的高電壓輸入級，一個超低壓差線性調節器。PW8600的輸入電壓範圍為VOUT+1V至65V，低消耗靜態電流，並提供2%的初始精度和低電壓降，10m

python面試題：一個整數，它加上100後是一個完全平方數，再加上168又是一個完全平方數，請問該數是多少？

題目：一個整數，它加上100後是一個完全平方數，再加上168又是一個完全平方數，請問該數是多少？

02：新建專案，註釋，識別符號，關鍵字，命名規範

新建一個專案開啟idea，點選file，New一個新專案選擇建立一個空專案,點選next，輸入專案名，點選finish

python極簡教程08：物件的方法

測試奇譚，BUG不見。講解之前，我先說說我的教程和網上其他教程的區別： 1 我分享的是我在工作中高頻使用的場景，是精華內容；

python極簡教程09：常用庫推薦

極簡python教程迎來了終章——常用庫推薦。在本章中，我將羅列python的哪些庫是日常高頻使用的，哪些庫是身為寫python程式碼的測試工程師，應當逐步去了解並掌握的。

c語言密碼程式輸入3次_極簡教程：C 語言實現密碼隱式輸入顯示 * 星號效果

技術標籤：c語言密碼程式輸入3次新增標頭檔案 #include<conio.h>，才能使用後面的getch()函式程式碼如下：

go 變數在其中一個函式中賦值另一個函式_Go語言極簡教程 - 第二篇變數與常量...

技術標籤：go 變數在其中一個函式中賦值另一個函式變數 “變數”一詞來源於數學。計算機程式語言中為了程式碼的可讀性，使用變數名來標識一塊記憶體地址，可以簡單地理解為變數是給某塊記憶體地址起一個有

Python AI極簡入門：2、簡單理解機器學習（轉發）

文章目錄[隱藏] 一、AI與機器學習二、基於機器學習方法的AI解決什麼問題三、機器學習工作流

VBA基礎教程Day03：單元格區域操作02

3-21.FIND單元格查詢技術 Range.Find 方法在區域中查詢特定資訊語法表示式.Find(What, After, LookIn, LookAt, SearchOrder, SearchDirection, MatchCase, MatchByte, SearchFormat)

寫給後端的Docker初級入門教程：基礎篇

前言: 之前很早就對Docker有所耳聞，但是礙於時間(就是懶得學)的關係，就一直沒有開始行動，直到最近這個學期課比較少，實在不知道該幹啥了，算了，學習吧。所以就開始了我漫長Docker學習之旅。當然，寫這篇筆記的時

小白學 Python（3）：基礎資料型別（下）

人生苦短，我選Python 引言前文傳送門小白學 Python（1）：開篇小白學 Python（2）：基礎資料型別（上）

Python爬蟲之urllib基礎用法教程

綜述本系列文件用於對Python爬蟲技術進行簡單的教程講解，鞏固自己技術知識的同時，萬一一不小心又正好對你有用那就更好了。

極簡python教程02：基礎變數，刪繁就簡

相關推薦