乘用車輛和商用車輛銷售資料分析
1 資料概況
本資料為上牌汽車的銷售資料,分為乘用車輛和商用車輛。資料包含銷售相關資料與汽車具體引數。資料項包括:時間、銷售地點、郵政編碼、車輛型別、車輛型號、製造廠商名稱、排量、油耗、功率、發動機型號、燃料種類、車外廓長寬高、軸距、前後車輪、輪胎規格、輪胎數、載客數、所有權、購買人相關資訊等。
2 資料背景介紹
汽車銷售(Atuo Sales)是消費者支出的重要組成成分,同時能很好的反映出消費者對經濟前景的信心。通常,汽車銷售情況我們瞭解一個國家經濟迴圈強弱情況的第一手資料,早於其他個人消費資料的公佈。因此,汽車銷售為隨後的零售額和個人消費支出提供了很好的預示作用,汽車消費額佔零售額的25%和整個銷售總額的8%。另外,汽車銷售可作為預示經濟衰退和復甦的早期訊號。
3 基本操作(使用HiveQL實現)
3.1建立資料庫
Create database cars;
3.2建立外部表
CREATE EXTERNAL TABLE cars(
province STRING,
month INT,
city STRING,
county STRING,
year INT,
cartype STRING,
productor STRING,
brand STRING,
mold STRING,
owner STRING,
nature STRING,
number INT,
ftype STRING,
outv INT,
power DOUBLE,
fuel STRING,
length INT,
width INT,
height INT,
xlength INT,
xwidth INT,
xheight INT,
count INT,
base INT,
front INT,
norm STRING,
tnumber INT,
total INT,
curb INT,
hcurb INT,
passenger STRING,
zhcurb INT,
business STRING,
dtype STRING,
fmold STRING,
fbusiness STRING,
name STRING,
age INT,
sex STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';
3.3匯入資料
Load data local inpath ‘/usr/local/hivedata/cars.txt’into table cars;
3.4查詢結果前十條
Select * from cars limit 10;
4 需求分析(使用HiveQL實現):
4.1汽車行業市場分析:
1、統計乘用車輛和商用車輛的數量(即非營運和營運車輛)
select nature ,count(*) from cars group by nature where nature is not null;
2、統計山西省2013年每個月的汽車銷售數量的比例
select month , m.c/n.d (select month ,count(*) from cars where year=2013 group by month) m,(select count(*) d from cars) n;
4.2 使用者資料市場分析:
1 統計買車的男女比例
select m.c/n.d from (select sex ,count(*) c from cars group by sex) m,(select count(*) d from cars) n;
2 統計的車的所有權、型號和型別
select owner,cartype,mold from cars ;
4.3 不同車型銷售統計分析:
1 統計不同型別車在一個月(對一段時間:如每個月或每年)的總銷售量
select cartype , count(*) from cars where month=1 group by cartype ;
2 通過不同型別(品牌)車銷售情況,來統計發動機型號和燃料種類
select brand,ftype,fuel from cars group by brand,ftype,furl;
5 針對某一品牌的競爭分析:
1 統計五菱每一個月的銷售量
select month , count(*) from cars where brand=’五菱’group by month;