大資料面試題及答案 2018

阿新 • • 發佈：2019-01-25

1. java記憶體模型

2.gc

3.編譯好的scala程式，執行時還需要scala環境嗎

Scala的程式碼執行是用REPL過程，ReadExecute Print Loop

4.object中有哪些方法

5.監測叢集中的cpu，記憶體使用情況？

6、ArrayList中的Array長度超了是怎麼增加的，一次增加多少？

---------------------------------------------------

linux的啟動順序

通電後讀取ROM的BIOS程式進行硬體自檢，自檢成功後把計算機控制權交給BIOS中BOOTsequence中的下一個有效裝置，讀取該裝置MBR找到作業系統，載入linux的bootloader，一般是grub。之後載入kernel，執行 /etc/rc.d/sysinit ，開啟其他元件（/etc/modules.conf），執行執行級別，執行/etc/rc.d/rc.local ，執行/bin/login，最後shell啟動。

使用過的開源框架介紹

Struts2

Spring

hibernate

mybatis

hadoop

hive

hbase

flume

sqoop

Zookeeper

Mahout

Kafka

Storm

Spark

擅長哪種技術

Hadoop。介紹

HIVE的優化

底層是MapReduce，所以又可以說是MapReduce優化。

1. 小檔案都合併成大檔案

2. Reducer數量在程式碼中介於節點數*reduceTask的最大數量的0.95倍到1.75倍

3. 寫一個UDF函式，在建表的時候制定好分割槽

4. 配置檔案中，開啟在map端的合併

開發中遇到的問題

Hbase節點執行很慢，發現是Hfile過小，hbase頻繁split。

修改了hfile大小。或者設定major compack設定為手動

Major compack設定為手動會出現什麼問題

？

Zookeeper的二次開發

Flume 的實時和定時資料採集，專案和flume的解耦

Mogodb和hbase的區別

Mogodb是單機

Hbase是分散式？？

專案組多少人？人員分配？資料量？叢集的配置？

大資料面試題及答案 2018

1. java記憶體模型2.gc3.編譯好的scala程式，執行時還需要scala環境嗎Scala的程式碼執行是用REPL過程，ReadExecute Print Loop4.object中有哪些方法5.監測叢集中的cpu，記憶體使用情況？6、ArrayList中的Arr

2019最新大資料面試題及答案整理

大資料面試題總結一波，助力準備在金三銀四尋找好工作的小夥伴們，只有度過筆試這一關才能在下面的關卡中大展巨集圖！一、如何檢查namenode是否正常執行？重啟namenode的命令是什麼？通過節點資訊和瀏覽器檢視，通過指令碼監控 hadoop-daemon.sh start namenod

大資料面試題以及答案整理（一）

kafka的message包括哪些資訊一個Kafka的Message由一個固定長度的header和一個變長的訊息體body組成 header部分由一個位元組的magic(檔案格式)和四個位元組的CRC32(用於判斷body訊息體是否正常)構成。當magic的值為

大資料面試題必會2018.01.07

資料分析師常見的10道面試題解答 1.海量日誌資料，提取出某日訪問百度次數最多的那個IP。首先是這一天，並且是訪問百度的日誌中的IP取出來，逐個寫入到一個大檔案中，注意到IP是32位的，最多有個2*32個IP。同樣可以採用對映的方法，比如模1000，把整個大檔案對映為100

大資料面試題hadoop部分及答案(16道)

1.Hadoop安裝步驟（九部曲）？主從節點都要操作的： 1.在/etc/hosts下配置IP及主機名 2.建立hadoop使用者（同時配置hosts） 3.安裝jdk 4.配置環境變數/etc/profile 5.在主節點操作（1）解壓並安裝

2018的初冬，派臥底去阿里、京東、美團帶回來的面試題及答案

最近有很多朋友去目前主流的大型網際網路公司面試（阿里巴巴、京東、美團、滴滴），面試回來之後會發給我一些面試題。有些朋友輕鬆過關，拿到offer，但是有一些是來詢問我答案的。我特意整理了一下，有很多問題不是靠幾句話能講清楚，所以乾脆找朋友錄製了一些視訊，用來回來這些面試題

2018 Python 面試題及答案

2018Python資料下載 Python 面試問題及答案作為一個 Python 新手，你必須熟悉基礎知識。在本文中我們將討論一些 Python 面試的基礎問題和高階問題以及答案，以幫助你完成面試。包括 Python 開發問題、程式設計問題、資料結構問題、和 Pyth

2018年最新Java面試題及答案整理(持續完善中…)

下列面試題都是在網上收集的，本人抱著學習的態度找了下參考答案，有不足的地方還請指正基礎篇基本功面向物件特徵封裝，繼承，多型和抽象封裝封裝給物件提供了隱藏內部特性和行為的能力。物件提供一些能被其他物件訪問的方法來改變它內部的資料。在 Ja

2018年大資料面試題總結

目前面試了多家大資料開發工程師，成長了很多，也知道了很多知識，下面和大家分享一下我遇到的面試題和答案。 1.kafka叢集的規模，消費速度是多少。答：一般中小型公司是10個節點，每秒20M左右。 2.hdfs上傳檔案的流程。答：這裡描述的是一個256M的檔

2018最新版本的spark面試題及答案

Spark是一個圍繞速度、易用性和複雜分析構建的大資料處理框架，Spark提供了一個全面、統一的框架用於管理各種有著不同性質(文字資料、圖表資料等)的資料集和資料來源(批量資料或實時的流資料)的大資料處理的需求。成為大資料核心技術之一，自然也成為了眾多企業面試的核心專業問題，小編針對spark整理了一套相關的

2018年UI設計師經典面試題及答案總結

2018年馬上就要結束了，給大家總結了一些UI設計出現比較多的面試題，很多時候我們有足夠的技術，但是可能就斷送在了面試上，大家如果去面試，可以多瞭解看看以下的這些UI設計師經典面試題及答案，畢竟知己知彼才能更好的發揮自己的特長，提高面試的機率嘛。 1、推動一個專案的時間要多久？舉個例子？答案：專

2018最新Web前端經典面試題及答案

javascript: JavaScript中如何檢測一個變數是一個String型別？請寫出函式實現 typeof(obj) === "string" typeof obj === "string" obj.constructor === String 請用js去除字

2018的初冬，派臥底去阿里、京東、美團、滴滴帶回來的面試題及答案

最近有很多朋友去目前主流的大型網際網路公司面試（阿里巴巴、京東、美團、滴滴），面試回來之後會發給我一些面試題。有些朋友輕鬆過關，拿到offer，但是有一些是來詢問我答案的。我特意整理了一下，有很多問題不是靠幾句話能講清楚，所以乾脆找朋友錄製了一些視訊，用來回來這些面試題。很多問題其實

2018的初冬，派臥底去阿裏、京東、美團、滴滴帶回來的面試題及答案

zookeep 高並發來看 class 分布式 title 美團 height 幾句話最近有很多朋友去目前主流的大型互聯網公司面試（阿裏巴巴、京東、美團、滴滴），面試回來之後會發給我一些面試題。有些朋友輕松過關，拿到offer，但是有一些是來詢問我答案的。我特意整

2018年web前端經典面試題及答案

javascript: JavaScript中如何檢測一個變數是一個String型別？請寫出函式實現方法1、function isString(obj){ return typeof(obj) === "string"? true: false; //

大資料面試題之2018.01.05

5.簡述Hadoop1和Hadoop2架構異同 Hadoop2相比較於Hadoop1來說，HDFS的架構與Mapreduce的都有較大的變化，且速度上和可用性上都有了很大的提高，Hadoop2中有兩個重要的變更。 1 Hdfs的NameNodes可以以叢集方

.net面試題,各大企業常見的.net面試題及答案(精華)

隨著.net平臺開發的職位的增加，筆試、面試也越來越有“套路”，這裡我總結了一些面試題，多數是.net的基礎知識，適合於面試新人。經過本人最近的面試和對面試資料的一些彙總，準備記錄這些面試題，以便.net開發工程師找工作複習之用，本人希望有面試經驗的同學能和我同時完成這個模

2018最新大資料面試題下載

　　人生的每一個階段，都有自己應該做的事情，我們在大資料時代，該學習大資料技術就應該好好學習大資料技術，將自己的技術學到精深，學到大資料技術的精華。該面試找工作的時候，也要做好一切準備，無論是禮儀的學習、說話的技巧還是大資料的面試題也是要面面俱到的。恰巧小編整理了一份大資料面

【2018年最新】 iOS面試題及答案

(1)#import指令是Object-C針對@include的改進版本，能確保引用的檔案只會被引用一次，不會陷入遞迴包含的問題中；(2)@import與@class的區別： #import會鏈入該標頭檔案的全部資訊，包括實體變數和方法等；二@class只是告訴編譯器，其後面宣告的名稱是類的名稱，至於這

大資料面試題總結（附答案）

目錄最近由於要準備面試就開始提早看些面試、筆試題。以下是自己總結的一些經常出現、有價值的試題，包含hadoop、hive、hbase、storm、spark等。答案僅供參考，如有錯誤，請指

大資料面試題及答案 2018

1. java記憶體模型

2.gc

3.編譯好的scala程式，執行時還需要scala環境嗎

4.object中有哪些方法

5.監測叢集中的cpu，記憶體使用情況？

6、ArrayList中的Array長度超了是怎麼增加的，一次增加多少？

---------------------------------------------------

linux的啟動順序

使用過的開源框架介紹

擅長哪種技術

HIVE的優化

開發中遇到的問題

Major compack設定為手動會出現什麼問題

Zookeeper的二次開發

Flume 的實時和定時資料採集，專案和flume的解耦

Mogodb和hbase的區別

專案組多少人？人員分配？資料量？叢集的配置？

相關推薦