C# 10分鐘完成百度圖片提取文字（文字識別）——入門篇

阿新 • • 發佈：2019-08-01

　　現在圖片文字識別已經很成熟了，比如qq長按圖片，點選圖片識別就可以識別圖片的文字，將不認識的、文字數量大的、或者不能賦值的值進行二次可複製功能。

我們現在就基於百度Ai開放平臺進行個人文字識別，demo使用的是C#控制檯應用程式，後續有需要的可以嫁接到指定專案中使用，比如提供選擇圖片，點選識別，

獲取返回的值。廢話不多說，上乾貨：

總體為：

註冊百度賬號api，建立自己的應用；
建立vs控制檯應用程式，引入動態連結庫；
編寫程式碼除錯，效果圖檢視；
總結。

1、建立百度AI文字識別應用

在百度AI開放平臺中，登入自己的百度賬號，點選“文字識別”服務中的“通用場景文字識別”，選擇“建立應用”，填好應用名稱，選擇應用型別，填好應用描述，這樣就建立好了“通用場景文字識別”服務。

具體不廢話，不知道的小夥伴可以移步看這裡：C# 10分鐘完成百度人臉識別——入門篇。

建立完成後會生成APPID、APP Key、Secret Key，這些是關鍵內容，後面要用。

2、建立VS控制檯應用程式，引入動態連結庫

首先我們建立一個VS控制檯應用程式，這裡就不詳細說明。

然後引入百度Baidu.AI動態連結庫，步驟如下，小編使用2017，所以直接在NuGet中搜索Baidu.AI安裝即可。

安裝文字識別 C# SDK

C# SDK 現已開源! https://github.com/Baidu-AIP/dotnet-sdk

** 支援平臺：.Net Framework 3.5 4.0 4.5， .Net Core 2.0 **

方法一：使用Nuget管理依賴（推薦）

在NuGet中搜索 Baidu.AI，安裝最新版即可。

packet地址 https://www.nuget.org/packages/Baidu.AI/

方法二：下載安裝

文字識別 C# SDK目錄結構

Baidu.Aip
    ├── net35
    │   ├── AipSdk.dll             // 百度AI服務 windows 動態庫
    │   ├── AipSdk.xml             // 註釋檔案
    │   └── Newtonsoft.Json.dll    // 第三方依賴
    ├── net40
    ├── net45
    └── netstandard2.0
        ├── AipSdk.deps.json
        └── AipSdk.dll

如果需要在 Unity 平臺使用，可引用工程原始碼自行編譯。

安裝

1.在官方網站下載C# SDK壓縮工具包。

2.解壓後，將 AipSdk.dll 和 Newtonsoft.Json.dll 中新增為引用。

3、編寫程式碼除錯，效果圖檢視

　　建立一個空資料夾，命名為Image，存一個張有文字的圖片，做除錯。

在Program.cs中編寫程式碼，程式碼編寫如下，可以直接拷貝進行除錯。

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;

namespace Recognition
{
   public class Program
    {
       static void Main(string[] args)
        {
            //AK/SK
            var API_KEY = "FGPi0QpCbZxZxBaN6dvqt87X";
            var SECRET_KEY = "HunNq6XsLjF3a7aCAuirVaVQO7CKBuwW";

            var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);
            client.Timeout = 60000;  // 修改超時時間


            var image = File.ReadAllBytes("E:\\Work Demo\\圖片提取文字\\Recognition\\Recognition\\Image\\img.jpg");
            var url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1564654456007&di=7832dd6f515e654bdf5074e47b6803b1&imgtype=0&src=http%3A%2F%2Fpic.962.net%2Fup%2F2018-5%2F2018527102938219310.jpg";
            
            // 呼叫通用文字識別, 圖片引數為本地圖片，可能會丟擲網路等異常，請使用try/catch捕獲
            //使用者向服務請求識別某張圖中的所有文字
            var result = client.GeneralBasic(image);        //本地圖圖片
            //var result = client.GeneralBasicUrl(url);     //網路圖片
            //var result = client.Accurate(image);          //本地圖片：相對於通用文字識別該產品精度更高，但是識別耗時會稍長。

            //var result = client.General(image);           //本地圖片：通用文字識別（含位置資訊版）
            //var result = client.GeneralUrl(url);          //網路圖片：通用文字識別（含位置資訊版）

            //var result = client.GeneralEnhanced(image);   //本地圖片：呼叫通用文字識別（含生僻字版）
            //var result = client.GeneralEnhancedUrl(url);  //網路圖片：呼叫通用文字識別（含生僻字版）

            //var result = client.WebImage(image);          //本地圖片:使用者向服務請求識別一些背景複雜，特殊字型的文字。
            //var result = client.WebImageUrl(url);         //網路圖片:使用者向服務請求識別一些背景複雜，特殊字型的文字。

            Console.WriteLine(result);
        }
    }
}

下面註釋了的每一行都是一種識別，更多識別請看官網：https://ai.baidu.com/docs#/OCR-Csharp-SDK/top

呼叫兩個，一個精準，一個不精準，先看精準的：

呼叫的是：var result = client.GeneralBasic(image);，最後一個字沒識別出來

我的圖片文字是“做個快樂讀書人”，最後的“人”沒識別出來，我們換一個能後識別複雜背景的，

呼叫的是：var result = client.GeneralEnhanced(image);

4、總結

　　具體業務使用看場景使用不同的介面即可。

這只是一個簡單的識別，針對不能賦值、文字繁多、不認識的字都可以做一個簡單的文字識別，更多內容需要大家去摸索入坑

拜拜，下次再見咯！

C# 10分鐘完成百度圖片提取文字（文字識別）——入門篇

　　現在圖片文字識別已經很成熟了，比如qq長按圖片，點選圖片識別就可以識別圖片的文字，將不認識的、文字數量大的、或者不能賦值的值進行二次可複製功能。我們現在就基於百度Ai開放平臺進行個人文字識別，demo使用的是C#控制檯應用程式，後續有需要的可以嫁接到指定專案中使用，比如提供選擇圖片，點選識別，獲取

C# 10分鐘完成百度語音技術（語音識別與合成）——入門篇

我們已經講了人臉識別（入門+進階）、圖片識別（入門）。下面是連結： C# 10分鐘完成百度人臉識別——入門篇 C# 30分鐘完成百度人臉識別——進階篇（文末附原始碼） C# 10分鐘完成百度圖片提取文字（文字識別）——入門篇今天我們來盤一盤語音識別與合成。 PS：僅供瞭解參考，如需進一步瞭解請繼續研究。我

【偽技術宅拯救世界】使用aria2gui完成百度雲不限速下載

可以說GitHub的力量是很強大的，哈哈哈原理實際上百度雲連結也是最後轉換成普通的http下載連結來進行下載的，所以我們只要先把百度雲連結轉換成http以後就可以使用多執行緒工具aria2下載來。第一步，安裝瀏覽器外掛以及指令碼這一步呢，我們需要用到

C# 10分鐘入門基於WebOffice實現線上編輯文件，實時儲存到伺服器（所有office，相容WPS）

今天，他來了（weboffice線上編輯文件）。上次寫了一個線上預覽的博，當然，效果並不是太理想，但是緊急解決了當時的問題。後來，小編重新查詢資料，求助大牛，終於使用新的方式替換了之前的low方法。有兩種比較好的方法，一種是webOffice,一種是pageoffice，前者免費，後者付費。果斷使

10分鐘搭建Vue環境及安裝腳手架（Vue入門篇）

Vue理念（題外話） 1、Node安裝 2、基於node.js,安裝淘寶映象國內直接使用 npm 的官方映象是非常慢的，這裡推薦使用淘寶 NPM 映象。新建一個資料夾，開啟資料夾，在資料夾中按住鍵盤的 shift鍵 + 滑鼠

10分鐘看懂： zookeeper 分散式ID （一）

瘋狂創客圈 Java 分散式聊天室【億級流量】實戰系列之 -25【部落格園總入口】文章目錄寫在前面 1.1. **ZK 的分散式命名服務** 1.1.1. 分散式 ID 生成器的型別 UUID方案 1.1

C#中將字符串轉成 Base64 編碼（加密--解密）

odin .html ctype cte bytes webp ase nba bsp 1 <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Base64.aspx.cs" Inherits="Base

C++學習（三）入門篇——函數

image clu square src 函數接口值類型使用 mes 技術分享 C++函數分兩種：有返回值的和沒返回值的 1.有返回值的函數調用函數流程如圖，sqrt(6.25)為函數調用，

C++學習（九）入門篇——String類

允許 res fort ngs 結果初始化 ant content app 可以用string類而不是字符數組來存儲字符串，string更加簡單要是用string類，則要在程序中包含頭文件string，且位於std名稱空間中，string類隱藏了字符串的數組性質，可以像

寧哥自編自導自演的《C語言，好爽》第7版（2017年）教程內容

C#設計模式之十七中介者模式（Mediator Pattern）【行為型】

[] 過多深入理解申請代碼實現控制 name 缺點原文:C#設計模式之十七中介者模式（Mediator Pattern）【行為型】一、引言今天我們開始講“行為型”設計模式的第五個模式，該模式是【中介者模式】，英文名稱是：Mediator Pattern。還

C#設計模式之十六觀察者模式（Observer Pattern）【行為型】

ngx 現實生活松耦合 mon html 機制 account current 很好原文:C#設計模式之十六觀察者模式（Observer Pattern）【行為型】一、引言今天是2017年11月份的最後一天，也就是2017年11月30日，利用今天再寫一個模式，爭取

C#設計模式之十一享元模式（Flyweight Pattern）【結構型】

eal 客戶來看滿足對象狀態英文輔助 3.3 fig 原文:C#設計模式之十一享元模式（Flyweight Pattern）【結構型】一、引言今天我們要講【結構型】設計模式的第六個模式，該模式是【享元模式】，英文名稱是：Flyweight Pattern。還

C#設計模式之二十三解釋器模式（Interpreter Pattern）【行為型】

要求 ict string 技術 get protect dict site 關鍵字原文:C#設計模式之二十三解釋器模式（Interpreter Pattern）【行為型】一、引言今天我們開始講“行為型”設計模式的第十一個模式，也是面向對象設計模式的最後一個模式，先

C#設計模式之二十一訪問者模式（Visitor Pattern）【行為型】

href 集中動態元素 lis 聲明風格 on() 封裝原文:C#設計模式之二十一訪問者模式（Visitor Pattern）【行為型】一、引言今天我們開始講“行為型”設計模式的第九個模式，該模式是【訪問者模式】，英文名稱是：Visitor Pattern。如

C#設計模式之二十二備忘錄模式（Memento Pattern）【行為型】

his 備忘錄很好 car 人的成功率構圖設計模式的就會原文:C#設計模式之二十二備忘錄模式（Memento Pattern）【行為型】一、引言今天我們開始講“行為型”設計模式的第十個模式，該模式是【備忘錄模式】，英文名稱是：Memento Pattern

python筆記10-多線程之線程同步（鎖lock）

pre 創建函數必須 col threading code png sta 前言關於吃火鍋的場景，小夥伴並不陌生，吃火鍋的時候a同學往鍋裏下魚丸，b同學同時去吃掉魚丸，有可能會導致吃到生的魚丸。為了避免這種情況，在下魚丸的過程中，先鎖定操作，讓吃火鍋的小夥伴停一會，等

C#中對sqlserver進行增刪改查操作（簡單易懂）

uid 數據連接 net cti ade 密碼 logs where Go 1、添加引用using System.Data;using System.Data.SqlData;2、建立於數據庫的連接，建議將它做成一個方法，方便多次利用。string sqlconnectio

C#基礎_值類型引用類型（十一）

基本形式參數 alt ID per 畫圖 hang write 數據值類型和引用類型：　　值類型包括：byte,short,int,long,char,float,double,bool,struct結構　　引用類型包括：類類型，接口類型和數組等。值類型

JDK1.10+scala環境的搭建之linux環境（centos6.9）

ava header 執行 2.6 準備 img error: .com html ---恢復內容開始--- 第一步：安裝jdk1.10版本進入網頁 http://oracle.com/technetwork/java/javase/downloads/index.h

C# 10分鐘完成百度圖片提取文字（文字識別）——入門篇

1、建立百度AI文字識別應用

2、建立VS控制檯應用程式，引入動態連結庫

安裝文字識別 C# SDK

方法一：使用Nuget管理依賴 （推薦）

方法二：下載安裝

3、編寫程式碼除錯，效果圖檢視

4、總結

相關推薦

方法一：使用Nuget管理依賴（推薦）