從視訊中提取光流 UCF-101

阿新 • • 發佈：2019-02-13

美其名曰：站在巨人的肩膀上

稍微修改，輸出變成我想要的樣子

# main.py

import numpy as np
import optical_flow_prep as ofp
import sys,os
import pickle
import scandir
import gc

def writeOF():

    root = "F:\Dataset/UCF-101"
    w=224
    h=224
    c=0
    data={}

    for path, subdsirs, files in scandir.walk(root):
        for filename in files:
            count=ofp.writeOpticalFlow(path,filename,w,h,c)
            if count:
                data[filename]=count
            print(filename)
            c+=1
            with open("done.txt", "a") as myfile:
                myfile.write(filename+'-'+str(c)+'\n')

    with open('D:\MyDrivers\software/anaconda\wokspace\Video-Classification-2-Stream-CNN-master\dataset/frame_count.pickle','wb') as f:
        pickle.dump(data,f)


def data_prep():
    print('Starting with data prep')
    with open('D:\MyDrivers\software/anaconda\wokspace\Video-Classification-2-Stream-CNN-master/dataset/frame_count.pickle','rb') as f1:
        frame_count=pickle.load(f1)
    with open('D:\MyDrivers\software/anaconda\wokspace\Video-Classification-2-Stream-CNN-master/dataset/merged_data.pickle','rb') as f2:
        merged_data=pickle.load(f2)
    print('Loaded dictionary')
    root = 'F:\Dataset\Optical-Flow'
    path = os.path.join(root, '')
    data={}
    misplaced_data=[]
    count=0
    for path, subdirs, files in scandir.walk(root):
        for filename in files:
            print(filename + '  ' + str(count))
            count+=1
            try:
                vidname=filename.split('_',1)[1].split('.')[0]
                fc=frame_count[vidname]


                for i,j in enumerate(merged_data[vidname]):
                    if j:
                        index=i
                        break
                for i in range(1,(fc/50)+1):
                    data[vidname+'@'+str(i)]=index+1
            except:
                misplaced_data.append(filename)

    print('Writing final training dictionary')
    with open('D:\MyDrivers\software/anaconda\wokspace\Video-Classification-2-Stream-CNN-master/dataset/temporal_train_data.pickle','wb') as f3:
        pickle.dump(data,f3)

    print('Writing misplaced videos')
    with open('D:\MyDrivers\software/anaconda\wokspace\Video-Classification-2-Stream-CNN-master/dataset/misplaced_data.pickle','wb') as f4:
        pickle.dump(misplaced_data,f4   )

if __name__ == "__main__":
    writeOF()
    gc.collect()
    data_prep()

# optical_flow_prep.py

import cv2
import numpy as np
import pickle
from PIL import Image
import os
import gc

def stackOpticalFlow(blocks,temporal_train_data,img_rows,img_cols):
   firstTime=1

   try:
      firstTimeOuter=1
      for block in blocks:
         fx = []
         fy = []
         filename,blockNo=block.split('@')
         path = 'F:\Dataset\Optical-Flow/'#+filename.split('.')[0] + '/'
         blockNo=int(blockNo)

         for i in range((blockNo*10)-9,(blockNo*10)+1):
            # print path+'/'+'h'+str(i)+'_'+str(filename)+'.jpg'
            imgH=Image.open(path+'/'+'h'+str(i*5)+'_'+str(filename)+'.jpg')
            imgV=Image.open(path+'/'+'v'+str(i*5)+'_'+str(filename)+'.jpg')
            imgH=imgH.resize((img_rows,img_cols))
            imgV=imgV.resize((img_rows,img_cols))
            fx.append(imgH)
            fy.append(imgV)
         flowX = np.dstack((fx[0],fx[1],fx[2],fx[3],fx[4],fx[5],fx[6],fx[7],fx[8],fx[9]))
         flowY = np.dstack((fy[0],fy[1],fy[2],fy[3],fy[4],fy[5],fy[6],fy[7],fy[8],fy[9]))
         inp = np.dstack((flowX,flowY))
         inp = np.expand_dims(inp, axis=0)
         if not firstTime:
            inputVec = np.concatenate((inputVec,inp))
            labels=np.append(labels,temporal_train_data[block]-1)
         else:
            inputVec = inp
            labels=np.array(temporal_train_data[block]-1)
            firstTime = 0

      inputVec=np.rollaxis(inputVec,3,1)
      inputVec=inputVec.astype('float16',copy=False)
      labels=labels.astype('int',copy=False)
      gc.collect()

      return (inputVec,labels)
   except:
      return (None,None)


def writeOpticalFlow(path,filename,w,h,c):
   count=0
   try:
      cap = cv2.VideoCapture(path+'/'+filename)
      ret, frame1 = cap.read()

      if frame1 is None:
         return count

      frame1 = cv2.resize(frame1, (w,h))
      prvs = cv2.cvtColor(frame1,cv2.COLOR_BGR2GRAY)

      folder = 'F:/Dataset/Optical-Flow/'+(filename.split('.')[0]).split('_')[1] + '/'
      if not os.path.exists(folder):
         dir = os.path.dirname(folder)
         os.mkdir(dir)
      folder1 = folder + filename.split('.')[0] + '/'
      if not os.path.exists(folder1):
         dir = os.path.dirname(folder1)
         os.mkdir(dir)
      while(1):
         ret, frame2 = cap.read()

         if frame2 is None:
            break
         count+=1
         if count%5==0:
            print (filename+':' +str(c)+'-'+str(count))

            frame2 = cv2.resize(frame2, (w,h))
            next = cv2.cvtColor(frame2,cv2.COLOR_BGR2GRAY)

            flow = cv2.calcOpticalFlowFarneback(prvs,next, None, 0.5, 3, 15, 3, 5, 1.2, 0)

            horz = cv2.normalize(flow[...,0], None, 0, 255, cv2.NORM_MINMAX)
            vert = cv2.normalize(flow[...,1], None, 0, 255, cv2.NORM_MINMAX)
            horz = horz.astype('uint8')
            vert = vert.astype('uint8')

            cv2.imwrite(folder1+'frame_'+str(int(count/5))+'_'+'x'+'.jpg',horz,[int(cv2.IMWRITE_JPEG_QUALITY), 90])
            cv2.imwrite(folder1+'frame_'+str(int(count/5))+'_'+'y'+'.jpg',vert,[int(cv2.IMWRITE_JPEG_QUALITY), 90])
            
            prvs = next

      cap.release()
      cv2.destroyAllWindows()
      return count
   except Exception as e:
      print(e)
      return count

從視訊中提取光流 UCF-101

美其名曰：站在巨人的肩膀上稍微修改，輸出變成我想要的樣子 # main.py import numpy as np import optical_flow_prep as ofp import sys,os import pickle import scandir

ffmpeg 從視訊中提取WAV格式的音訊

步驟 1.下載ffmpeg 2.把下載回來的ffmpeg解壓後的bin目錄路徑新增到環境變數裡面的path裡面 3. ffmpeg -i .[迅雷下載xunbo.cc]愛情公寓第二季EP20.rmvb -f wav -ar 16000 2-20.wav 引數說明 -i

從視訊中提取音訊

首先，需要在網上下載一個方法ffmpeg.exe工具來處理視訊、音訊的轉換。 1、Flash格式像其他格式進行轉換（1）、轉換成wmv/asf格式 ffmpeg -i (要轉換的flv檔案完整路徑) -f asf -vcodec (wmv1或wmv2) [-b

Android中從視訊中提取音訊

最近在做一款產品，需要從視訊中提取音訊。查了查資料發現了有FFMPEG，MP4Parser,Android自帶的解碼器。首先FFMPEG比較複雜據說也慢（來源於網際網路，我也不知道）然後就是Android自帶的Media Extractor類，不過該類用於4.3以

多媒體開發（10）：從視訊中提取圖片

小白：提取視訊中的圖片嗎？那很簡單，播放視訊再截圖就行啦。播放視訊再截圖的做法，當然也可以。但是，手動地截圖會太累而且無法保證準確度，特別是需要反覆提取圖片時，或者需要提取“105秒那一瞬間的美女圖片”時，或者我需要每秒出一張圖片時，那有別的辦法嗎？本文介紹，如何使用FFmpeg實現從視訊中提取圖片的

denseflow視訊截幀提取光流工具

本篇部落格介紹如何安裝denseflow工具，由https://github.com/yjxiong/dense_flow提供。這個工具可以對視訊進行截幀，並計算光流儲存到本地，使用了GPU編譯的OpenCV，所以提取速度很快，後續可以用於行為動作識別中，例如two-stream網

Wireshark從抓到的rtsp包中提取264流並播放

坑：一定要有紮實的計算機網路知識的基礎，否則。。TnT 過程：通過過濾器捕獲指定的IP（我這裡是內網rtsp伺服器IP：172.16.0.19）。選擇一個RDT協議的package，然後右鍵Decode as… 可以發現，該包的預設及當前解

用PDFMiner從PDF中提取文本文字

dfp port 下載 span setup 技術分享 code with converter 1、下載並安裝PDFMiner 　　從https://pypi.python.org/pypi/pdfminer/下載PDFMineer wget https://pypi.p

H.264從SPS中提取視頻寬高

ufs ase tel .html eva depth spl evel rip H.264有兩種封裝模式：（1）annexb模式：傳統模式，使用start code來分隔NAL， SPS和PPS是在ES流的頭部；（2）mp4模式：沒有start code，使用NALU

How to extract pcd from a rosbag？如何從rosbag中提取pcd

disk div files org class ont int osb rac 4.1 bag_to_pcd Reads a bag file, saving all ROS point cloud messages on a specified topic as PCD

從minio中讀取檔案流進行下載檔案

一、獲取Minio連線 public static String minioUrl; public static String minioUsername;

【hive】從url中提取需要的部分字串

本人菜鳥一隻，如果有什麼說錯的地方還請大家批評指出！！事情是這樣的，hive的A表中，有url這樣的一個欄位，我想要提取這個欄位中的某一部分（這不就是擷取字串嘛）。但是substring肯定是滿足不了我的需求的，自己寫hive的udf也不太現實（用最簡單的方式完成任務，才會讓後來的維護變得更加

利用python_opencv和dlib實現從視訊中抓取人臉照片並儲存(親測有效)

系統：win10 編譯環境：pycharm python庫：cv2、dlib(自己安裝) 程式碼： import dlib import cv2 # 載入並初始化檢測器 detector = dlib.get_frontal_face_detector() camera = cv2.

C#從資料庫中讀取二進位制流並生成檔案

下面以圖片檔案為例加以說明。從資料庫表 “圖片儲存”中讀取ID為1的圖片資料並生成圖片檔案。 MySqlConnection conn = new MySqlConnection("Server=localhost;Database=test;charset=utf8;U

Excel怎樣從字串中提取位置和長度不固定的數字

最近上課的時候，常常有學員諮詢怎樣從Excel字元中提取位置和長度都不固定的數字，今天我們分兩種情況來聊一聊對應的解決方案。情況1：數字前後有特定的分隔符如果數字前後有特定的分隔符，比如（）、##等分隔符，那麼我們可以通過查詢這些分隔符的位置，來定位到數字的位置。比如下圖所示的這個

按空格和按換行從檔案中提取資料

1，讀取檔案的類為ifstream，其中“i”代表“in”，針對變數而言，ifstream所在的標頭檔案為fstream； 2，ifstream中有open方法，可以開啟檔案； 3，ifstream中有>>方法，可以以空格為分割符，以換行為結束符讀取資料； 4，iostrea

java從視訊中獲截幀生成靜態圖與GIF，圖片旋轉

pom:  <dependency> <groupId>org.bytedeco</groupId> <artifactId>javacv-platform</art

實踐案例：使用開源工具從視訊中構建人臉檢測模型（Python實現）

介紹近年來，計算機視覺這個奇妙的領域已經發展到獨樹一幟的地步。在世界各地已經有大量的應用程式在廣泛使用。我在這個領域最喜歡的事情之一是我們的社群擁抱開源概念的想法。即使是大型科技巨頭也願意與每個人分享新的突破和創新，這樣技術就不會成為“富人的專利”。其中一種技術是人臉檢測，它在實際

如何從字串中提取非零數字並求和

執行到console.readline時出現錯誤。求高手幫忙解答。如下圖所示datagridview如何根據訂單表自動更新非手工錄入訂單明細表的插入更改刪除執行到console.readline時出現錯誤。求高手幫忙解答。如下圖所示datagridview如何根據訂單表自動更

kalibr 如何從bag中提取影象/由影象生成bag

１. 從bag中提取影象使用kalibr自帶的bagextractor工具 ./kalibr_bagextractor --image-topics /cam0/image_raw --bag ./static/output.bag 使用python指令碼２. 由影象生

從視訊中提取光流 UCF-101

相關推薦