沒練過這個專案，怎麼做AI工程師？

阿新 • • 發佈：2018-11-24

640?wx_fmt=jpeg

從年初起，幾家國際大廠的開發者大會，無論是微軟Build、Facebook F8還是稍後的Google I/O，莫不把“AI優先”的大旗扯上雲霄。

如果這一波AI大潮只是空喊幾句口號，空提幾個戰略，空有幾家炙手可熱的創業公司，那當然成不了什麼大氣候。但風浪之下，我們看到的卻是，Google一線的各大業務紛紛改用深度學習，落伍移動時代的微軟則已拉起一支近萬人的AI隊伍。而國內一線大廠的情況，更是把AI牢牢把握住，試圖再創高峰。

今天本文將分享一篇AI入門實戰的專案經驗分享，手把手帶你進入AI的世界，讓你消除對AI技術壁壘過高的恐懼~

【AI專案實戰】多標籤影象分類競賽小試牛刀

初次拿到這個題目，想了想做過了貓狗大戰這樣的二分類，也做過cifar-10這樣的多分類，類似本次比賽的題目多標籤影象分類的確沒有嘗試過。6941個標籤，每張圖片可能沒有標籤也可能存在6941個標籤，即各個標籤之間是不存在互斥關係的，所以最終分類的損失函式不能用softmax而必須要用sigmoid。然後把分類層預測6941個神經元，每個神經元用sigmoid函式返回是否存在某個標籤即可。

來蹚下整個流程看看，在jupyter notebook上做得比較亂，但是整個流程還是可以看出來的。深度學習模型用的Keras。

先匯入train_csv資料，這裡用的是最初版的訓練csv檔案，img_path裡存在地址，後面做了處理。

code

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

from glob import 
 glob
from tqdm import tqdm

import cv2
from PIL import Image

train_path = 'visual_china_train.csv'
train_df = pd.read_csv(train_path)
train_df.head()

640?wx_fmt=png

code

train_df.shape
#(35000, 2)

可以看到總共有35000張訓練圖片，第一列為圖片名稱（帶地址，需處理），第二列為圖片對應標籤。

來看下是不是的確只有6941個標籤：

code

tags = []
for i in range(train_df['tags'].shape[0]):
    for tag in train_df['tags'].iloc[i].split(','):
        tags.append(tag)

tags = set(tags)
len(tags)
#6941

事實證明標籤總數無誤，可以放心大膽地繼續進行下去了。

然後我處理了下圖片名稱，並存到了img_paths列表裡。

code

#如果使用的是官方後來更新的visual_china_train.csv，可以直接使用最後一行程式碼
for i in range(35000):
    train_df['img_path'].iloc[i] = train_df['img_path'].iloc[i].split('/')[-1]

img_paths = list(train_df['img_path'])

定義三個函式，其中：

hash_tag函式讀入valid_tags.txt檔案，並存入字典，形成索引和標籤的對照。
load_ytrain函式讀入tag_train.npz檔案，並返回訓練集的y_train，形式為ndarray，shape為(35000, 6941)，即35000張圖片和對應標籤的one-hot編碼。
arr2tag函式將預測結果的y_pred轉變成對應的中文標籤。（實際上最後還需要做下處理）

code

def hash_tag(filepath):
    fo = open(filepath, "r",encoding='utf-8')
    hash_tag = {}
    i = 0
    for line in fo.readlines():     #依次讀取每行  
        line = line.strip()         #去掉每行頭尾空白  
        hash_tag[i] = line
        i += 1
    return hash_tag

def load_ytrain(filepath):  
    y_train = np.load(filepath)
    y_train = y_train['tag_train']

    return y_train

def arr2tag(arr):
    tags = []
    for i in range(arr.shape[0]):
        tag = []
        index = np.where(arr[i] > 0.5)  
        index = index[0].tolist()
        tag =  [hash_tag[j] for j in index]

        tags.append(tag)
    return tags

讀入valid_tags.txt，並生成索引和標籤的對映。

code

filepath = "valid_tags.txt"
hash_tag = hash_tag(filepath)

hash_tag[1]
#'0到1個月'

載入y_train

code

y_train = load_ytrain('tag_train.npz')
y_train.shape
#(35000, 6941)

前期準備工作差不多做完了，開始匯入訓練集。此處有個坑，即原始訓練集中存在CMYK格式的圖片，傳統圖片處理一般為RGB格式，所以使用Image庫中的convert函式對非RGB格式的圖片進行轉換。

code

nub_train = 5000  #可修改，前期嘗試少量資料驗證模型
X_train = np.zeros((nub_train,224,224,3),dtype=np.uint8)
i = 0

for img_path in img_paths[:nub_train]:
    img = Image.open('train/' + img_path)
    if img.mode != 'RGB':
        img = img.convert('RGB')
    img = img.resize((224,224))
    arr = np.asarray(img)
    X_train[i,:,:,:] = arr
    i += 1

訓練集匯入完成，來看圖片的樣子，判斷下圖片有沒有讀入錯誤之類的問題。

code

fig,axes = plt.subplots(6,6,figsize=(20, 20))

j = 0
for i,img in enumerate(X_train[:36]):
    axes[i//6,j%6].imshow(img)
    j+=1

640?wx_fmt=png

看樣子還不錯，go on！訓練集的X_train、y_train都拿到了，分割出驗證集。這裡要說明一下，官方的y_train裡圖片名稱與X_train裡圖片名稱是對應的所以可以直接分割。

code

from sklearn.model_selection import train_test_split
X_train2,X_val,y_train2,y_val = train_test_split(X_train, y_train[:nub_train], test_size=0.2, random_state=2018)

資料準備完成，開始搭建模型。咳咳，先從簡單的入手哈，此模型仿tinymind上一次的漢字書法識別大賽中“真的學不會”大佬的結構來搭的，又加了些自己的東西，反正簡單模型試試水嘛。

code

from keras.layers import *
from keras.models import *
from keras.optimizers import *
from keras.callbacks import *

def bn_prelu(x):
    x = BatchNormalization()(x)
    x = PReLU()(x)
    return x

def build_model(out_dims, input_shape=(224, 224, 3)):
    inputs_dim = Input(input_shape)
    x = Lambda(lambda x: x / 255.0)(inputs_dim) #在模型裡進行歸一化預處理

    x = Conv2D(16, (3, 3), strides=(2, 2), padding='same')(x)
    x = bn_prelu(x)
    x = Conv2D(16, (3, 3), strides=(1, 1), padding='same')(x)
    x = bn_prelu(x)
    x = MaxPool2D(pool_size=(2, 2))(x)

    x = Conv2D(32, (3, 3), strides=(1, 1), padding='same')(x)
    x = bn_prelu(x)
    x = Conv2D(32, (3, 3), strides=(1, 1), padding='same')(x)
    x = bn_prelu(x)
    x = MaxPool2D(pool_size=(2, 2))(x)

    x = Conv2D(64, (3, 3), strides=(1, 1), padding='same')(x)
    x = bn_prelu(x)
    x = MaxPool2D(pool_size=(2, 2))(x)

    x = Conv2D(128, (3, 3), strides=(1, 1), padding='same')(x)
    x = bn_prelu(x)
    x = GlobalAveragePooling2D()(x)

    dp_1 = Dropout(0.5)(x)

    fc2 = Dense(out_dims)(dp_1)
    fc2 = Activation('sigmoid')(fc2) #此處注意，為sigmoid函式

    model = Model(inputs=inputs_dim, outputs=fc2)
    return model

看下模型結構：

code

model = build_model(6941)
model.summary()

_________________________________________________________________Layer (type)                 Output Shape              Param #   
=================================================================input_1 (InputLayer)         (None, 224, 224, 3)       0         
_________________________________________________________________lambda_1 (Lambda)            (None, 224, 224, 3)       0         
_________________________________________________________________conv2d_1 (Conv2D)            (None, 112, 112, 16)      448       
_________________________________________________________________batch_normalization_1 (Batch (None, 112, 112, 16)      64        
_________________________________________________________________p_re_lu_1 (PReLU)            (None, 112, 112, 16)      200704    
_________________________________________________________________conv2d_2 (Conv2D)            (None, 112, 112, 16)      2320      
_________________________________________________________________batch_normalization_2 (Batch (None, 112, 112, 16)      64        
_________________________________________________________________p_re_lu_2 (PReLU)            (None, 112, 112, 16)      200704    
_________________________________________________________________max_pooling2d_1 (MaxPooling2 (None, 56, 56, 16)        0         
_________________________________________________________________conv2d_3 (Conv2D)            (None, 56, 56, 32)        4640      
_________________________________________________________________batch_normalization_3 (Batch (None, 56, 56, 32)        128       
_________________________________________________________________p_re_lu_3 (PReLU)            (None, 56, 56, 32)        100352    
_________________________________________________________________conv2d_4 (Conv2D)            (None, 56, 56, 32)        9248      
_________________________________________________________________batch_normalization_4 (Batch (None, 56, 56, 32)        128       
_________________________________________________________________p_re_lu_4 (PReLU)            (None, 56, 56, 32)        100352    
_________________________________________________________________max_pooling2d_2 (MaxPooling2 (None, 28, 28, 32)        0         
_________________________________________________________________conv2d_5 (Conv2D)            (None, 28, 28, 64)        18496     
_________________________________________________________________batch_normalization_5 (Batch (None, 28, 28, 64)        256       
_________________________________________________________________p_re_lu_5 (PReLU)            (None, 28, 28, 64)        50176     
_________________________________________________________________max_pooling2d_3 (MaxPooling2 (None, 14, 14, 64)        0         
_________________________________________________________________conv2d_6 (Conv2D)            (None, 14, 14, 128)       73856     
_________________________________________________________________batch_normalization_6 (Batch (None, 14, 14, 128)       512       
_________________________________________________________________p_re_lu_6 (PReLU)            (None, 14, 14, 128)       25088     
_________________________________________________________________global_average_pooling2d_1 ( (None, 128)               0         
_________________________________________________________________dropout_1 (Dropout)          (None, 128)               0         
_________________________________________________________________dense_1 (Dense)              (None, 6941)              895389    
_________________________________________________________________activation_1 (Activation)    (None, 6941)              0         
=================================================================Total params: 1,682,925
Trainable params: 1,682,349
Non-trainable params: 576_________________________________________________________________

由於比賽要求裡最終得分標準是fmeasure而不是acc，故網上找來一段程式碼用以監測訓練中查準率、查全率、fmeasure的變化。原地址找不到了，故而無法貼上，罪過罪過。

code

import keras.backend as K

def precision(y_true, y_pred):
    # Calculates the precision
    true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    predicted_positives = K.sum(K.round(K.clip(y_pred, 0, 1)))
    precision = true_positives / (predicted_positives + K.epsilon())
    return precision

def recall(y_true, y_pred):
    # Calculates the recall
    true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))
    recall = true_positives / (possible_positives + K.epsilon())
    return recall

def fbeta_score(y_true, y_pred, beta=1):
    # Calculates the F score, the weighted harmonic mean of precision and recall.
    if beta < 0:
        raise ValueError('The lowest choosable beta is zero (only precision).')

    # If there are no true positives, fix the F score at 0 like sklearn.
    if K.sum(K.round(K.clip(y_true, 0, 1))) == 0:
        return 0

    p = precision(y_true, y_pred)
    r = recall(y_true, y_pred)
    bb = beta ** 2
    fbeta_score = (1 + bb) * (p * r) / (bb * p + r + K.epsilon())
    return fbeta_score

def fmeasure(y_true, y_pred):
    # Calculates the f-measure, the harmonic mean of precision and recall.
    return fbeta_score(y_true, y_pred, beta=1)

這裡稍做圖片增強，用Keras裡的ImageDataGenerator函式，同時還可生成器方法進行訓練。

code

from keras.preprocessing.image import ImageDataGenerator

train_datagen = ImageDataGenerator(width_shift_range = 0.1, 
                                 height_shift_range = 0.1, 
                                 zoom_range = 0.1)
val_datagen = ImageDataGenerator()     #驗證集不做圖片增強

batch_size = 8

train_generator = train_datagen.flow(X_train2,y_train2,batch_size=batch_size,shuffle=False) 
val_generator = val_datagen.flow(X_val,y_val,batch_size=batch_size,shuffle=False)

開始訓練。這裡在ModelCheckpoint裡設定monitor監控feasure，mode為max，不再以最低loss作為模型最優的判斷標準（個人做法，好壞可自行實驗判斷）。

code

checkpointer = ModelCheckpoint(filepath='weights_best_simple_model.hdf5', 
                            monitor='val_fmeasure',verbose=1, save_best_only=True, mode='max')
reduce = ReduceLROnPlateau(monitor='val_fmeasure',factor=0.5,patience=2,verbose=1,min_delta=1e-4,mode='max')

model.compile(optimizer = 'adam',
           loss='binary_crossentropy',
           metrics=['accuracy',fmeasure,recall,precision])

epochs = 20

history = model.fit_generator(train_generator,
       validation_data = val_generator,
       epochs=epochs,
       callbacks=[checkpointer,reduce],
       verbose=1)

訓練了20個epoch，這裡給出第20個epoch時的訓練結果，可以看到，val_loss 0.0233，其實已經挺低了；val_acc0.9945，參考意義不大（暫時不清楚有什麼參考意義~~）；val_fmeasure0.17，嗯。。任重道遠啊。

Epoch 20/20500/500 [==============================] - 48s 96ms/step - loss: 0.0233 - acc: 0.9946 - fmeasure: 0.1699 - recall: 0.0970 - precision: 0.7108 - val_loss: 0.0233 - val_acc: 0.9946 - val_fmeasure: 0.1700 - val_recall: 0.0968 - val_precision: 0.7162
    Epoch 00020: val_fmeasure did not improve from 0.17148

以上只給出5000張圖片的簡單模型訓練方法，但資料處理，搭建模型以及訓練過程已經很清晰明瞭了，後面的進階之路就憑大家各顯身手了。

然後開始進行預測，匯入測試集（當然是在訓練集全部訓練之後再進行測試集的預測）。

code

nub_test = len(glob('valid/*'))
X_test = np.zeros((nub_test,224,224,3),dtype=np.uint8)
path = []
i = 0
for img_path in tqdm(glob('valid/*')):
    img = Image.open(img_path)
    if img.mode != 'RGB':
        i

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    沒練過這個專案，怎麼做AI工程師？
       
 
  
  
  從年初起，幾家國際大廠的開發者大會，無論是微軟Build、Facebook F8還是稍後的Google I/O，莫不把“AI優先”的大旗扯上雲霄。
  如果這一波AI大潮只是空喊幾句口號，空提幾個戰略，空有幾家炙手可熱的創業公司，那當然成不了什麼大氣候。但風浪之下，我們看到的卻是，Go 

  
 

    

    
    沒做過大專案，但我會建大專案
      剛出來實習的時候，參與的專案使用的還是SSH框架。
那時候還在使用SVN進行版本管理，常常在合併程式碼的時候遇到各種莫名其妙的問題。
那時候使用著曾經宇宙最好用的Java IDE Eclipse寫程式碼，也沒有覺得介面簡陋影響編碼。
那時候還不知道啥s是微服務，只知道有需求了就把程式碼往單體專案的程式碼里加， 

  
 

    

    
    個人的一些介紹和做過的專案，呵呵
      
                
性格開朗，為人幽默，工作有責任感。
1精通Java基礎語言
2精通J2EE相關技術，熟悉使用Myeclipse等開發平臺
3熟悉Oracle、SQLserver資料庫的開發，能熟練編寫SQL語句
4掌握WEB前端技術的使用，JS、JQurey、html、css等WEB前端技 

  
 

    

    
    你可能沒聽過“智慧製造”，但它肯定改變了你的生活
      “智慧製造”這詞兒有點新鮮，一聽感覺和咱們沒什麼關係嘛，平時也很少接觸到相關的行業。可能學工科的同學、從事工業生產的朋友們會熟悉一些，那為啥說它改變了我們的生活呢？咱們慢慢道來。 
從智慧製造的核心技術上來說，可以歸結為——大資料、物聯網、雲端計算。這個嘛，你絕對聽說過了，你看電視機裡頭天天講這些，那個男人經 

  
 

    

    
    想做AI工程師？這個案例必須掌握！（附完整程式碼Keras實現CNN）
      
                有人說，2018年人工智慧已經進入了全球爆發的時刻。個性化資訊推送、人臉識別、語音操控等人工智慧技術，已“入侵”日常生活的細枝末節。

十多年前，所有的企業都在想辦法網際網路化，如今，所有的網際網路企業都在試圖AI化，據資料統計，平均每 10.9 個小時會誕生一家 AI 企業 

  
 

    

    
    黑馬程式設計師：開源Swift 3.0微博專案 ，做最具情懷的IT教育
      
                

   眾所周知，今年的蘋果開發者大會之後，作為國內iOS培訓機構的領頭羊，黑馬程式設計師iOS學院率先放出iOS10的最新教程，分享給廣大iOS愛好者及新老學員。而就在前幾天，黑馬程式設計師的資深iOS講師居然做起了“網紅”。
 
在未大肆宣傳的情況下，直播前，同時線上人 

  
 

    

    
    你沒中過勒索病毒，不知道備份有多重要
      
							
							
							今天是春節放假前的最後一天，照例對自己一些資料開始進行了備份。突然想到關於資料備份有些心得想要分享下，於是寫了這篇文章。



點此進入公眾號檢視。



為什麼備份很重要

你沒吃過虧，可能永遠不明白資料有多珍貴。我在去年8月的時候中過臭名昭著的勒索病毒zep 

  
 

    

    
    新手學Python必看的幾個練手小專案，輕鬆不枯燥哦！
       
 Python是一種面向物件的解釋型程式語言，原始碼與直譯器CPython遵守GPL協議，Python語法簡潔清晰。 
 語法簡潔清晰，那麼我們用少量的Python程式碼能做哪些有趣的東西？溫馨提示：文末必看。 
   
 一、畫愛心表白 
 1、圖形都是由一系列的點(X，Y)構成的曲線，由於X 

  
 

    

    
    沒做過幾個專案，簡歷怎麼寫啊
      


有問有答是程式視界的一個免費問答欄目，感興趣的朋友，可以按照下面的方式參與：



在本文後留言，以有問有答開始（放心，這類留言不會被公開，只有被選中的留言會出現在週四晚釋出的文章內，同時可根據要求匿名）。// 或發郵件給 [email protected]，標題註明“有問有答”。


描述你 

  
 

    

    
    看到好的東西，就是不捨得不轉：【轉載】有了這個列表，程式設計師不愁沒練手的小專案了
      幻燈片——做一個以幻燈片形式顯示各種圖片的程式。為了增加難度可以做些額外的效果，譬如漸進檢出、星型擦除、視窗漸隱。
	思維導圖——允許使用者記錄下各種構思並且快速地進行頭腦風暴將這些構思整合到一張思維導圖中。越快越好，因此要讓使用者能迅速地寫下構思，然後將其拖到可視的導圖中去，將構思之間的關係展現出來。
	匯 

  
 

    

    
    寫了8年的程式碼，做過的專案都下線了，程式設計師的意義在哪裡！
      一、起因 
前幾天專案交付上線，所以閒下來了。忽然想起來，自己業餘接的活，有些專案已經不再運營了，所以想清理下域名解析。 
上去阿里雲一看，總的大概有15個解析。這15個解析就意味著15個專案。這些專案都是我去談的需求、寫的文件、前後端開發、部署上線維護，整個專案幾乎都是我一人完成的。 
想當初，很用心的去開 

  
 

    

    
    店鋪淘客模式怎麼做的？帶你操作2019年×××電商專案，月入過萬
      再沒錢的時候最能看出一個人的洞察力，嗅出商機的能力，還有執行力，電商時代不缺商機，缺少是發現商機的眼睛。如果你錯過了當年的淘寶網店，前些年的淘客，那你就不要再錯過當下熱門的店鋪淘客了。 
店鋪淘客有很多種的說法，店淘，淘客，店群等同行的一些用語，主要以“店中店”的模式操作，利用軟體批量採集寶貝，釋出和下單，依 

  
 

    

    
    JS的原型鏈，這個圖你沒見過
      
                想到Objective-C有個isa指標，物件的isa指向類，類的isa指向元類，元類的isa指向自己。正是有了isa指標，才有了強大的runtime功能。

那麼，前端技術js也有自己的指向關係，這裡借用《JavaScript高階程式設計》中的描述：

每個建構函式都有一個 

  
 

    

    
    寫了8年的程式碼，做過的專案都下線了，程式設計師的意義在哪裡？
      
                





我堅信未來是我的，也是你的。但歸根結底是程式設計師的!

——忘記來自哪裡了





程式碼，正在改變世界。正是因為有了程式碼的存在，才有了百度、阿里巴巴、騰訊、京東、等的存在......

下面是一位來自工作了八年的資深碼農的深刻感悟，正值“1024 程式設計 

  
 

    

    
    網路狀態改變是無序廣播還是有序廣播，安裝了，沒啟動過，會接受這個廣播麼?
      
								
								            
						
                是無序廣播

不會接受這個廣播
因為android在3.0之後，對廣播添加了一個flag :
Intent.FLAG_EXLUDE_STOPPED_PACKAGES
這個是為了加強對“停止”狀態APP的 

  
 

    

    
    做外G我沒服過誰，除了Python
      
  
   
 
玩過電腦遊戲的同學對於外掛肯定不陌生，但是你在用外掛的時候有沒有想過如何做一個外掛呢？ 
學習Python中有不明白推薦加入交流裙                號：735934841  & 

  
 

    

    
    精選180+Python開源專案，隨你選！做專案何愁沒程式碼！
       
 
  
   
   
  
   
   
   
 網際網路（9） 
 私信菜鳥 007 
   
   
  
   
   
   
 Reddit，很多小夥伴應該都會 Reddit 不陌生。一個 

  
 

    

    
    親愛的面試官，這個我可沒看過！（Android部分）
      
                
如何保證Service不被殺死 
Android 程序不死從3個層面入手：
A.提供程序優先順序，降低程序被殺死的概率
方法一：監控手機鎖屏解鎖事件，在螢幕鎖屏時啟動1個畫素的 Activity，在使用者解鎖時將 Activity 銷燬掉。
方法二：啟動前臺service。 

  
 

    

    
    釋出一年了，做NLP的還有沒看過這篇論文的嗎？--“Attention is all you need”
      
							
							
							筆記作者：王小草
日期：2018年10月30日
歡迎關注我的微信公眾號“AI躁動街”


1 Background
說起深度學習和神經網路，影象處理一呼百應的“卷積神經網路CNN“也好，還是自然語言處理得心應手的”迴圈神經網路RNN”，都簡直是膾炙人口、婦孺皆知 

  
 

    

    
    用了這個jupyter外掛，我已經半個月沒開啟過excel了
      # 1 簡介

　　`jupyter lab`是我迄今為止體驗過開展資料分析等任務最舒適的平臺，但這不代表它是完美的，因為在很多方面它仍然存在欠缺，譬如在對`csv`檔案的互動式編輯方面。

 圖1

　　而本文將要介紹的`jupyter lab`外掛就賦予我們高度的互動式操縱`csv`檔案的自由，無需exc