torchvision功能簡介
阿新 • • 發佈:2022-03-06
介紹
Torchvision是torch的一部分,主要提供一些torch的輔助功能,主要分為六部分內容:
- torchvision.datasets
- torchvision.io
- torchvision.models
- torchvision.ops
- torchvision.transforms
- torchvision.utils
torchvision.datasets
包含比較常用的一些資料集的下載和載入功能,例如 MINST、COCO、VOC 等資料集。
完整列表可檢視 https://pytorch.org/vision/stable/datasets.html
torchvision.io
視訊的讀寫功能、影象的讀寫和編碼解碼功能、支援jpeg格式和png格式。
torchvision.models
封裝了目前比較常見的經典的網路模型,可直接將預訓練好的模型載入過來使用。
包含的網路有 AlexNet、VGG、ResNet、SqueezeNet、DenseNet、Inception v3、GoogLeNet、ShuffleNet v2、MobileNetV2、MobileNetV3、ResNeXt、Wide ResNet、MNASNet。
torchvision.ops
ops是operators的縮寫,顧名思義就是一些通用操作,主要包括 非極大值抑制、Box面積過濾、影象裁剪、Box定義格式的轉換、面積計算、區域合併等。
torchvision.transforms
封裝了常用的影象變換操作。包含影象裁剪、影象仿射變換、影象旋轉、顏色調整、灰度變換等等,同時還支援各中操作一定概率的隨機發生。
torchvision.utils
影象一些輔助函式,函式不多,主要是製作影象網格、影象儲存以及影象外框繪製等。