1. 程式人生 > 其它 >torchvision功能簡介

torchvision功能簡介

介紹

Torchvision是torch的一部分,主要提供一些torch的輔助功能,主要分為六部分內容:

  1. torchvision.datasets
  2. torchvision.io
  3. torchvision.models
  4. torchvision.ops
  5. torchvision.transforms
  6. torchvision.utils

torchvision.datasets

包含比較常用的一些資料集的下載和載入功能,例如 MINST、COCO、VOC 等資料集。

完整列表可檢視 https://pytorch.org/vision/stable/datasets.html

torchvision.io

視訊的讀寫功能、影象的讀寫和編碼解碼功能、支援jpeg格式和png格式。

torchvision.models

封裝了目前比較常見的經典的網路模型,可直接將預訓練好的模型載入過來使用。

包含的網路有 AlexNet、VGG、ResNet、SqueezeNet、DenseNet、Inception v3、GoogLeNet、ShuffleNet v2、MobileNetV2、MobileNetV3、ResNeXt、Wide ResNet、MNASNet。

torchvision.ops

ops是operators的縮寫,顧名思義就是一些通用操作,主要包括 非極大值抑制、Box面積過濾、影象裁剪、Box定義格式的轉換、面積計算、區域合併等。

torchvision.transforms

封裝了常用的影象變換操作。包含影象裁剪、影象仿射變換、影象旋轉、顏色調整、灰度變換等等,同時還支援各中操作一定概率的隨機發生。

torchvision.utils

影象一些輔助函式,函式不多,主要是製作影象網格、影象儲存以及影象外框繪製等。