目標檢測中的資料增強技術

阿新 • • 發佈：2020-08-11

------------恢復內容開始------------

目標檢測中的資料增強方式

目標檢測中的資料增強需要做兩方面，首先是影象本身的修改，另外需要修改標註檔案中的標註框。所以自然而然的在進行資料增強時，就需要分兩種：
- 一種是隻修改影象而不需要修改其對應的標註資訊，例如修改色調，加椒鹽噪聲，隨機擦除等等
- 一種是急需要修改影象又需要修改標註資訊，甚至生成新的標註資訊，比如mosaic，旋轉，映象等等。
下面就講一下應用較為廣泛的資料增強方式及其python的實現。在講之前為了程式碼的完整性，先將影象資料和載入標註檔案獲取標註框資訊

資料載入

在實際場景下我們拿到的標註檔案時各種各樣的，但標註檔案必定包含了兩個方面的資訊，一個是對應圖片中目標的類別。另外一個就是對應圖片中目標的左上角座標和右下角座標，我這次拿到的資料是使用point

的格式標註的，如果你的演算法資料載入入口是標註的VOC格式（一般都是），那你就不得不在儲存的時候儲存成VOC格式。

資料封裝

在處理之前先對資料進行了封裝，這樣在處理的過程中比較方便，也可以使用字典進行簡單的封裝

class Data:
    """
    封裝影象和其對應的標註資訊
    """
    def __init__(self, name, boxes=None, img=None):
        if boxes is None:
            boxes = []
        self.name = name
        self.boxes = boxes
        self.img = img
        self.shape = img.shape


    def append_box(self, box):
        """
        向這個資料中新增標註框資訊
        :param box:
        :return:
        """
        self.boxes.append(box)

    def set_name(self, name):
        self.name = name

    def set_img(self, img):
        self.img = img


class Box:
    """
    box類包含兩個欄位，一個是這個box的類別，一個是這個box的座標資訊[xmin,ymin,xmax,ymax]
    """
    def __init__(self, label, cod):
        self.label = label
        self.cod = cod

    def get_label(self):
        return self.label

    def get_cod(self):
        return self.cod

載入標準的VOC格式資料集的程式碼實現

def load_data(img_path, xml_path, flog_path, save_path):
    """
    載入所有的影象和其標註，以標註檔案為準，有的影象並沒有標註,然後對其進行資料增強並儲存
    :param flog_path: 雲霧影象所在目錄
    :param save_path: 資料集儲存的根目錄
    :param img_path: 影象檔案路徑， tif格式
    :param xml_path: 標註檔案路徑，VOC格式
    :return:
    """
    annotations = os.listdir(xml_path)
    data_list = []
    for annotation in annotations:
        xml_file = open(os.path.join(xml_path, annotation), 'br')
        # 如果是解析標準的VOC標註此處更換函式voc2data
        boxes = load_annotations(xml_file)
        name = annotation.split(".")[0]
        img = cv2.imread(os.path.join(img_path, name + ".tif"))
        data = Data(name=name, boxes=boxes, img=img)
        data_list.append(data)
  
def load_annotations(xml_file):
    """
    解析標註檔案中的資訊，這個標註檔案格式與標準的VOC不同，是我個人拿到的資料形式
    :param xml_file:標註檔案
    :return: 標註檔案中的座標資訊和所屬類別，對應的影象名稱等等資訊
    """
    boxes = []
    # 解析檔案
    tree = ET.parse(xml_file)
    # 獲取根節點
    root = tree.getroot()
    # 獲取目標節點
    objects = root.find("objects")
    for obj in objects.iter("object"):
        # 找到這個標註框對應的標籤
        label = obj.find("possibleresult").find("name").text
        x = []
        y = []
        # 找到這個框的座標
        for temp in obj.find("points").iter("point"):
            xy = temp.text.split(",")
            x.append(int(float(xy[0])))
            y.append(int(float(xy[1])))
        cod = [min(x), min(y), max(x), max(y)]
        box = Box(label=label, cod=cod)
        boxes.append(box)

    return boxes

def voc2data(xml_file):
    """
    解析標準VOC格式的標註檔案獲取其對應的box和所屬的類別
    :param xml_file:
    :return:
    """
    boxes = []
    tree = ET.parse(xml_file)
    root = tree.getroot()
    for obj in root.iter("object"):
        label = obj.find("name").text
        bndbox = obj.find("bndbox")
        xmin = int(bndbox.find("xmin").text)
        ymin = int(bndbox.find("ymin").text)
        xmax = int(bndbox.find("xmax").text)
        ymax = int(bndbox.find("ymax").text)
        boxes.append(Box(label=label, cod=[xmin, ymin, xmax, ymax]))
    return boxes

以上我們就完成了資料的封裝部分，後續就需要對這些封裝起來的資訊進行操作。後面的所有函式中的引數都是以data或者data的列表形式進行傳遞的

旋轉

對於矩形影象，如果旋轉的度數不是90的倍數，就意味著需要將旋轉過後的影象進行裁剪或者縮小後進行背景補充才行。旋轉的過程中標註檔案也必須做相應的改動才能對應上。

def rot90(data):
    """
    將data中的影象做一個旋轉90度的處理，將其對應的標註資訊也做對應的處理
    :param data:
    :return:
    """
    img = data.img
    img_new = np.rot90(img)
    boxes_new = []
    boxes = data.boxes
    for box in boxes:
        # 旋轉90度，現在的x_min就是原來的y_min
        cod = box.cod
        x_min = cod[1]
        # 現在的y_min就是影象的寬減去原來的x_max
        y_min = data.shape[1] - cod[2]
        # 現在的x_max就是原來的y_max
        x_max = cod[3]
        # 現在的y_max就是影象的寬減去原來的x_min
        y_max = data.shape[1] - cod[0]
        box_new = Box(box.label, [x_min, y_min, x_max, y_max])
        boxes_new.append(box_new)

    data_new = Data(data.name + "_rot90", boxes_new, img_new)

    return data_new

如果你想要實現逆時針選裝180度，可以巢狀使用上面的rot90()函式

翻轉

翻轉是另外一種非常常用的資料增強方式，和上面的旋轉一樣，在實際應用場合中只是為了擴充後續更加複雜的資料增強方式的影象基數。
以下的程式碼實現了水平翻轉，和旋轉一樣，標註檔案需要做出相應的改變。

def flip_vertical(data):
    """
    將data中的影象水平旋轉
    :param data:
    :return:
    """
    img = data.img.copy()
    img_new = cv2.flip(img, 0)
    boxes = data.boxes
    boxes_new = []
    for box in boxes:
        cod = box.cod
        y_min = data.shape[0] - cod[3]
        y_max = data.shape[0] - cod[1]
        x_min = cod[0]
        x_max = cod[2]
        cod_new = [x_min, y_min, x_max, y_max]
        box_new = Box(box.label, cod_new)
        boxes_new.append(box_new)
    data_new = Data(data.name + "_flip", boxes_new, img_new)
    return data_new

複製小目標

複製小目標這種資料增強方式主要針對小目標檢測，通過將資料中面積較小的目標進行復制貼上來達到使小目標數量增多的目的。理論依據出自論文《Augmentation for small object detection》
複製小目標首先要確認小目標，給什麼樣的目標是小目標定一個標準

def paste(data):
    """
    拷貝影象中的小目標，根據長寬的統計，劃定面積小於300*300的為小目標
    :param data:
    :return:
    """
    change = False
    img_new = data.img.copy()
    boxes = data.boxes.copy()
    for index, box in enumerate(data.boxes):
        cod = box.cod
        length = cod[3] - cod[1]
        width = cod[2] - cod[0]
        area = length * width
        if area < 20000:
            # 如果有需要複製的目標，儲存新的標註檔案和圖片
            change = True

            # 判定為小目標,把目標部分截取出來
            cropped_img = data.img[cod[1]:cod[3], cod[0]:cod[2]]
            # 獲取隨機位置
            copy_cods = getRandomCod(data.shape, boxes, 5, width, length)
            for cod in copy_cods:
                img_new[cod[1]:cod[3], cod[0]:cod[2]] = cropped_img
                boxes.append(Box(box.label, cod))
    if change:
        data_new = Data(name=data.name + "_small", img=img_new, boxes=boxes)
        return data_new

    else:
        return None

上面的程式碼邏輯很簡單，首先是對圖中所有的目標進行一個分析，對面積小於20000的目標進行復制，這裡用2000是因為我們的資料集影象尺寸是一致的，並且事先對標註框尺寸分佈做了統計，如下圖。
由論文中的思想，對於小目標的複製過程中，需要保證不與已經存在的標註框重合，所以需要iou檢測。

def check_overlap(cod_1, cod_2):
    """
    判斷兩個標註框是否重疊
    :param cod_1:
    :param cod_2:
    :return: true or false
    """
    # 計算交集
    x_min = max(cod_1[0], cod_2[0])
    y_min = max(cod_1[1], cod_2[1])
    x_max = min(cod_1[2], cod_2[2])
    y_max = min(cod_1[3], cod_2[3])

    x = max(0, x_max - x_min)
    y = max(0, y_max - y_min)

    if x * y > 0:
        return True
    else:
        return False

然後對每個小目標都隨機取個位置進行貼上，獲取他們的位置。

def getRandomCod(shape, boxes, num, width, height):
    """
    根據傳入的影象尺寸和原始標註框的座標資訊來獲取num個隨機的標註框左上角座標
    :param height:
    :param width:
    :param num: 生成的隨機標註框個數
    :param shape: 影象本身的尺寸
    :param boxes: 原始標註框的座標資訊
    :return: 返回n個cod回去
    """
    ret = []
    for i in range(num):
        while True:
            x = random.randint(0, shape[1])
            y = random.randint(0, shape[0])
            cod_tmp = [x, y, x + width, y + height]
            # 先檢驗是否越界
            if check_overSize(cod_tmp, shape):
                # 如果越界了，就重新生成座標
                continue
            overlap = False
            for box in boxes:
                if check_overlap(box.cod, cod_tmp):
                    # 如果相交的話，那麼就直接break
                    overlap = True
                    break
                else:
                    continue

            if not overlap and len(ret) != 0:
                for cod in ret:
                    if check_overlap(cod, cod_tmp):
                        overlap = True
                        break
            if not overlap:
                ret.append(cod_tmp)
                break

            else:
                continue

    return ret

高斯模糊

對資料進行增強有一個常見的方式就是新增各種各樣的噪聲，從而讓這些資料去訓練網路的時候，能夠使網路變得適應性更強，魯棒性更強，對真實情況的泛化能力也越強。通常使用的有椒鹽噪聲，高斯噪聲等等。但是這次由於資料集的獨特性，所以使用了高斯模糊進行資料增強，這個實現起來很簡單，使用opencv中的高斯濾波函式即可實現影象的效果，對應的標註檔案位置不變。

def gaussian_blur(data):
    """
    高斯模糊
    :param data:
    :return:
    """
    img_new =  data.img.copy()
    img_new = cv2.GaussianBlur(img_new, (11, 11), 0)
    data_new = Data(name=data.name + "_gaussian", boxes=data.boxes.copy(), img=img_new)

    return data_new

新增雲霧

我們的資料是遙感影象，所以在拍攝中會有很多的雲霧，為了模擬在這種情況下的網路輸入，使用認為新增雲霧的方式來做資料增強。
我們事先採集了一些雲霧的影象，這些影象對比度較強，除了雲霧部分其餘部分都是接近黑色的深色，這樣天空背景對影象的影響比較小。

def add_flog(data, flog_list):
    """

    :param data:
    :param flog_list:儲存雲霧影象的絕對路徑列表
    :return:
    """
    img_src = data.img.copy()
    img_flog = cv2.imread(random.choice(flog_list))
    if random.randint(0, 10) > 5:
        img_flog = np.rot90(img_flog)
    img_flog = cv2.resize(img_flog, img_src.shape[:2][::-1])
    img_new = cv2.addWeighted(img_src, 0.6, img_flog, 0.4, 0)
    data_new = Data(name=data.name + "_flog", boxes=data.boxes.copy(), img=img_new)
    return data_new

縮小大目標

為了進一步增加網路對小目標的泛化能力，我們對資料集中僅有大目標的影象進行了整體縮小，然後將邊緣使用黑色填充，這樣也是增加了小目標出現的頻率。

def shrink(data):
    """
    放大僅有小目標的影象
    :param data:
    :return:
    """
    # num用於檢測整張影象中是否僅有大目標，仍然是以20000為界
    num = 0
    for box in data.boxes:
        cod = box.cod
        area = (cod[3] - cod[1]) * (cod[2] - cod[0])
        if area < 20000:
            num += 1
    if num == 0:
        plate = np.zeros_like(data.img)
        data_new = resize(data, shape=(plate.shape[1] // 2, plate.shape[0] // 2))
        # 確保縮小影象在中間位置
        shape = data_new.shape
        plate[shape[0] // 2 :shape[0] // 2 + shape[0], shape[1] // 2: shape[1] + shape[1] // 2] = data_new.img.copy()
        data_new.set_img(plate)
        data_new.set_name(data.name + "_shrink")
        return data_new
    else:
        return None

馬賽克

mosaic技術是YOLOv4的技巧之一，也是一種用於增強網路對小目標的泛化能力所使用的手段，見論文YOLOv4: Optimal Speed and Accuracy of Object Detection,思想就是隨機讀取四張影象，然後將這些影象隨機進行資料增強，如翻轉，旋轉等等，然後進行組合，原文中四張影象的尺寸是不一致的。這裡為了實現起來方便拼接，對四張影象的尺寸都做了統一處理，處理為長寬皆為600，然後進行組合。

def mosaic(data_list):
    """
    mosaic技術需要四張影象才能做
    :param data_list:
    :return:
    """
    img_1 = np.vstack((data_list[0].img.copy(), data_list[1].img.copy()))
    img_2 = np.vstack((data_list[2].img.copy(), data_list[3].img.copy()))

    img_new = np.hstack((img_1, img_2))

    boxes_new = data_list[0].boxes.copy()
    for box in data_list[2].boxes:
        cod = box.cod
        x_min = 600 + cod[0]
        y_min = cod[1]
        x_max = 600 + cod[2]
        y_max = cod[3]
        boxes_new.append(Box(label=box.label, cod=[x_min, y_min, x_max, y_max]))

    for box in data_list[1].boxes:
        cod = box.cod
        x_min = cod[0]
        y_min = cod[1] + 600
        x_max = cod[2]
        y_max = cod[3] + 600
        boxes_new.append(Box(label=box.label, cod=[x_min, y_min, x_max, y_max]))

    for box in data_list[3].boxes:
        cod = box.cod
        boxes_new.append(Box(label=box.label, cod=[x + 600 for x in cod]))

    data_new = Data(name=data_list[0].name + "_mosaic", img=img_new, boxes=boxes_new)

    return data_new

為了減小記憶體的壓力，這裡選擇每四張影象做一次處理，而不是所有的資料都載入進記憶體進行處理

def do_mosaic(data_list, result):
    temp_list = []
    data_list = random.sample(data_list, len(data_list))
    for data in data_list:
        if len(temp_list) < 4:
            temp_list.append(resize(data))

        if len(temp_list) == 4:
            new_data = mosaic(temp_list)
            result.append(new_data)
            temp_list = temp_list[-3:]
    return result

resize()函式的實現，這是一個工具函式，多個處理都用到了這個函式

def resize(data, shape=None):
    """
    將影象縮放至600 * 600，方便拼接,
    :param shape:
    :param data:
    :return:
    """
    if shape is None:
        shape = (600, 600)

    img_new = cv2.resize(data.img.copy(), shape)
    boxes = []
    for box in data.boxes:
        cod = box.cod
        x_min = int(shape[0] / data.shape[1] * cod[0])
        y_min = int(shape[0] / data.shape[0] * cod[1])
        x_max = int(shape[1] / data.shape[1] * cod[2])
        y_max = int(shape[1] / data.shape[1] * cod[3])
        box_tmp = Box(label=box.label, cod=[x_min, y_min, x_max, y_max])
        boxes.append(box_tmp)
    data_new = Data(name=data.name, boxes=boxes, img=img_new)

    return data_new

程式入口

當load所有的資料之後，需要對這個列表進行處理，以上的每個函式都是對data物件進行處理，但是實際要處理的是一個data的列表，為了少些for迴圈，所以用一個函式去對以上的每一種處理進行封裝。

def do(func, data_list, ret, ext=None):
    if ext is None:
        for data in data_list:
            new_data = func(data)
            if new_data is not None:
                ret.append(new_data)
    else:
        for data in data_list:
            new_data = func(data, ext)
            if new_data is not None:
                ret.append(new_data)

為了節約時間使用多執行緒並行，因為每個執行緒間的讀寫都是不相互干擾的，所以不用使用鎖

    flog_list = os.listdir(flog_path)
    flog_list = [os.path.join(flog_path, x) for x in flog_list]
    ret = []
    # 旋轉，加霧，高斯模糊和反轉使用並行
    t1 = threading.Thread(target=do, args=(rot90, data_list, ret))
    t1.start()
    t1.join()
    t2 = threading.Thread(target=do, args=(flip_vertical, data_list, ret))
    t2.start()
    t2.join()
    t3 = threading.Thread(target=do, args=(gaussian_blur, data_list, ret))
    t3.start()
    t3.join()
    t4 = threading.Thread(target=do, args=(add_flog, data_list, ret, flog_list))
    t4.start()
    t4.join()
    # 小目標複製, 馬賽克和大目標放大並行
    data_list += ret
    ret = []
    print("processing 1")
    t5 = threading.Thread(target=do, args=(copy_small, data_list, ret))
    t5.start()
    t5.join()
    t6 = threading.Thread(target=do, args=(shrink, data_list, ret))
    t6.start()
    t6.join()
    t7 = threading.Thread(target=do_mosaic, args=(data_list,ret))
    t7.start()
    t7.join()
    data_list += ret
    save(data_list, save_path)

儲存

有了經過處理之後的資料，這些資料目前還在記憶體中，需要將這些資料存到本地(也可以將這些程式碼放到網路處理資料資料輸入的部分也可以)

def save(data_list, save_path):
    annotation_path = os.path.join(save_path, "Annotations")
    img_path = os.path.join(save_path, "JPEGImages")
    if not os.path.exists(annotation_path):
        os.mkdir(annotation_path)
    if not os.path.exists(img_path):
        os.mkdir(img_path)

    for data in data_list:
        img = data.img
        name = os.path.join(img_path, data.name +".tif")
        cv2.imwrite(name, img)
        print("saving image %s to %s" %(data.name +".tif", img_path))
        tree = data2xml(data)
        tree.write(os.path.join(annotation_path, data.name +".xml"), "utf-8", True)
        print("saving annotation %s to %s" % (data.name +".xml", annotation_path))

將data中的資料轉化成xml的ElementTree物件

def data2xml(data):
    """
    將data中的資料解析成xml格式的tree
    :param data:
    :return:
    """
    root = ET.Element("annotation")
    folder = ET.SubElement(root, "folder")
    folder.text = "VOC"
    filename = ET.SubElement(root, "filename")
    filename.text = data.name + ".tif"
    size = ET.SubElement(root, "size")
    width = ET.SubElement(size, "width")
    height = ET.SubElement(size, "height")
    depth = ET.SubElement(size, "depth")
    width.text = str(data.shape[1])
    height.text = str(data.shape[0])
    depth.text = str(data.shape[2])
    source = ET.SubElement(root, "source")
    database = ET.SubElement(source, "database")
    database.text = "高分軟體大賽"
    for box in data.boxes:
        obj = ET.SubElement(root, "object")
        name = ET.SubElement(obj, "name")
        name.text = box.label
        bndbox = ET.SubElement(obj, "bndbox")
        xmin = ET.SubElement(bndbox, "xmin")
        ymin = ET.SubElement(bndbox, "ymin")
        xmax = ET.SubElement(bndbox, "xmax")
        ymax = ET.SubElement(bndbox, "ymax")
        xmin.text = str(box.cod[0])
        ymin.text = str(box.cod[1])
        xmax.text = str(box.cod[2])
        ymax.text = str(box.cod[3])
        truncated = ET.SubElement(obj, "truncated")
        truncated.text = '0'
        difficult = ET.SubElement(obj, "difficult")
        difficult.text = '0'

    pretty_xml(element=root, indent='\t', newline='\n')
    tree = ET.ElementTree(root)
    return tree

隨機檢測

對儲存好的資料隨機選擇幾個做視覺化

def random_check(save_path, num):
    """
    隨機視覺化檢查save_path下num個樣本
    :param save_path:
    :param num:
    :return:
    """
    temp_path = os.path.join(save_path, "tmp")
    if not os.path.exists(temp_path):
        os.mkdir(temp_path)
    font = cv2.FONT_HERSHEY_SIMPLEX
    annotation_path = os.path.join(save_path, "Annotations")
    img_path = os.path.join(save_path, "JPEGImages")
    xml_list = os.listdir(annotation_path)
    xml_list = random.sample(xml_list, num)
    xml_list = [os.path.join(annotation_path, xml) for xml in xml_list]
    for xml in xml_list:
        tree = ET.parse(xml)
        root = tree.getroot()
        img = None
        img_name = ''
        try:
            img_name = root.find("filename").text
            img = cv2.imread(os.path.join(img_path, img_name))
        except IOError:
            RuntimeError("no such file")
        except TypeError:
            RuntimeError("xml tag error")
        for obj in root.iter("object"):
            name = obj.find("name").text
            box = obj.find("bndbox")
            xmin = int(box.find("xmin").text)
            ymin = int(box.find("ymin").text)
            xmax = int(box.find("xmax").text)
            ymax = int(box.find("ymax").text)
            img = cv2.putText(img, name, (xmin, ymin), font, 1.2, (255,255,255), 2)
            cv2.rectangle(img,(xmin, ymin), (xmax, ymax), (255,0,0),2)
        cv2.imwrite(os.path.join(temp_path, img_name), img)

------------恢復內容結束------------

目標檢測中的資料增強技術

------------恢復內容開始------------ 目標檢測中的資料增強方式目標檢測中的資料增強需要做兩方面，首先是影象本身的修改，另外需要修改標註檔案中的標註框。所以自然而然的在進行資料增強時，就需要分兩種：

目標檢測中計算資料集每一類別框的數量

技術標籤：好用的python小程式python演算法眾所周知，一個好的目標檢測模型需要大量的資料來訓練，當資料量較多的情況，我們沒辦法直觀看到每一類別的目標框個數，就無法判斷類別是否平衡。下面的演算法作用就

目標檢測中分析訓練資料來進行anchor_ratio的設定

有關目標檢測的更多tricks點選下面連結：初識CV：目標檢測比賽中的trick（已更新更多程式碼解析）957 贊同 · 170 評

目標檢測中的IOU和CIOU原理講解以及應用（附測試程式碼）

上期講解了目標檢測中的三種資料增強的方法，這期我們講講目標檢測中用來評估物件檢測演算法的IOU和CIOU的原理應用以及程式碼實現。

目標檢測中的NMS演算法(Non-max suppression)

技術標籤：目標檢測深度學習影象識別非極大值抑制：即找到區域性極大值，而非最大值，並抑制其領域內的其餘值。在目標檢測中，對於一個物體可能會預測出多個候選框，那麼這時就可以用極大值抑制對一些冗餘的

深度學習-目標檢測中的mAP計算

table { margin: auto } 謹以本文記錄深度學習入門過程中學習的目標檢測常見指標，如有錯誤還請朋友不吝指教！

紅外街道影象的目標檢測：多尺度物件級資料增強

紅外街道影象的目標識別：多尺度+物件級資料增強 Multiscale Object Detection in Infrared Streetscape Images Based on Deep Learning and Instance Level Data Augmentation

Windows版YOLOv4目標檢測實戰：訓練自己的資料集

課程連結：https://edu.51cto.com/course/22982.html 課程演示環境：Windows10; cuda 10.2; cudnn7.6.5; Python3.7; VisualStudio2019; OpenCV3.4

C#中的快取技術(頁面資料快取)

頁面資料快取頁面資料快取即應用程式快取，他提供一種程式設計方式，可通過鍵將任意資料儲存在內容中。使用應用程式緩存於應用程式狀態類似，但是於應用程式狀態不同的是，應用程式資料快取中的資料容易丟失，即資料

產業AI實踐中，如何有效提升影象識別精度、實現極小目標檢測？ | 百度AI公開課報名...

位來發自凹非寺量子位報道 | 公眾號 QbitAI 目前，各個企業行業在AI落地應用中，常常會遇到極小目標檢測問題。

機器視覺自動檢測技術在工業檢測中有哪些優點

機器視覺檢測裝置包括感測器，光學成像系統，資料採集和處理系統的元件。機器視覺自動檢測技術裝置可以根據背景設定不同顏色的座標線，並且在通用配置中，可以同時設定四個座標線。彩色CCD還可以用於產品的

使用TensorFlow Object Detection Api 進行環境搭建、訓練自定義的資料集、輸出模型、Android端使用模型目標檢測

技術標籤：機器學習計算機視覺移動端tensorflow神經網路機器學習深度學習一、環境搭建

目標檢測_訓練資料處理

1、訓練xml中的矩形框到圖上並儲存： # coding=utf-8 import os import xml.dom.minidom import cv2 as cv

detectron2訓練自己的資料集_目標檢測基於kerasYoloV3訓練自己的資料集

技術標籤：detectron2訓練自己的資料集mask rcnn訓練自己的資料集maskrcnn訓練自己的資料集mmdetection訓練自己的資料ssd目標檢測訓練自己的資料yolov3資料集下載訓練

目標檢測 – 解析VOC和COCO格式並製作自己的資料集

http://www.xyu.ink/3612.html xhy2020年10月9日無評論　　相對其他計算機視覺任務，目標檢測演算法的資料格式更為複雜。為了對資料進行統一的處理，目標檢測資料一般都會做成VOC或者COCO的格式。　　VOC和COCO都

JS陣列索引檢測中的資料型別問題詳解

之前在寫微信小程式專案時，裡面有一個“城市選擇”的功能，筆者用的是 <picker-view> 元件，這個元件比較特別，因為它的 value 屬性規定是陣列格式的。比如： value=\"[1]\"。

【CV】目標檢測的常用資料處理方法

【CV】目標檢測的常用資料處理方法！機器學習初學者今天以下文章來源於Datawhale，作者徐和鼎

WIP:【資料增強】深度學習中的影象資料增強及實踐

Test Time Augmentation What is Test Time Augmentation (TTA)? Similar to what Data Augmentation is doing to the training set, the purpose of Test Time Augmentation is to perform random modifications t

大資料開發技術基礎篇Linux中遠端登入的設定

1. 安裝SecureCRT(英文版) Linux遠端登入及相關工具介紹 Linux一般作為伺服器使用，而伺服器一般放在機房，你不可能在機房操作你的Linux伺服器。這時我們就需要遠端登入到Linux伺服器來管理維護系統。

【目標檢測資料集】

目標檢測資料集　　網址詳細說明示例 VisDrone-Dataset https://github.com/VisDrone/VisDrone-Dataset

目標檢測中的資料增強技術

目標檢測中的資料增強方式

資料載入

資料封裝

載入標準的VOC格式資料集的程式碼實現

旋轉

翻轉

複製小目標

高斯模糊

新增雲霧

縮小大目標

馬賽克

程式入口

儲存

隨機檢測

相關推薦