.NET Core 调用百度 PaddleOCR 识别图文

简介

百度 PaddleOCR 是一个开源的OCR模型库，可以用于识别图片中的文字。在本篇博客中，我们将介绍如何使用.NET Core来调用百度 PaddleOCR，以实现图文识别的功能。

准备工作

在开始之前，我们需要先完成以下准备工作：

安装.NET Core SDK，确保拥有.NET Core开发环境。
注册百度智能云账号，创建一个 PaddleOCR 的应用并获取 API Key 和 Secret Key。

创建.NET Core 项目

首先，我们需要创建一个.NET Core项目来调用百度 PaddleOCR。可以通过以下命令来创建一个空的.NET Core控制台项目：

dotnet new console -n PaddleOCRDemo

然后，进到项目目录并使用以下命令来添加必要的依赖：

cd PaddleOCRDemo
dotnet add package Microsoft.Extensions.Configuration
dotnet add package Microsoft.Extensions.Configuration.Json
dotnet add package RestSharp

配置应用程序

接下来，我们需要在应用程序中添加配置文件，用于保存百度 PaddleOCR 的 API Key 和 Secret Key。在项目的根目录下创建一个名为 appsettings.json 的文件，并加入以下内容：

{
  "BaiduAPI": {
    "ApiKey": "your-api-key",
    "SecretKey": "your-secret-key"
  }
}

记得将 your-api-key 和 your-secret-key 替换成你在百度智能云上获取的实际 API Key 和 Secret Key。

然后，我们需要创建一个 Config 类来读取配置文件。在项目中创建一个名为 Config.cs 的文件，并添加以下内容：

using Microsoft.Extensions.Configuration;

namespace PaddleOCRDemo
{
    public static class Config
    {
        private static readonly IConfiguration _configuration;

        static Config()
        {
            _configuration = new ConfigurationBuilder()
                .AddJsonFile("appsettings.json")
                .Build();
        }

        public static string ApiKey => _configuration["BaiduAPI:ApiKey"];
        public static string SecretKey => _configuration["BaiduAPI:SecretKey"];
    }
}

这样，我们就可以通过 Config.ApiKey 和 Config.SecretKey 来获取配置文件中的对应值。

调用百度 PaddleOCR

现在，让我们编写代码来调用百度 PaddleOCR，并实现图文识别的功能。

首先，我们需要安装一个 RESTful 客户端库来发送 HTTP 请求。在项目中创建一个名为 PaddleOCRClient.cs 的文件，并添加以下内容：

using System.Collections.Generic;
using RestSharp;

namespace PaddleOCRDemo
{
    public class PaddleOCRClient
    {
        private readonly RestClient _client;
        
        public PaddleOCRClient()
        {
            _client = new RestClient("https://aip.baidubce.com/rest/2.0/ocr/v1");
        }
        
        public string RecognizeText(byte[] imageBytes)
        {
            var request = new RestRequest("general_basic", Method.POST);
            request.AddQueryParameter("access_token", GetAccessToken());
            request.AddFile("image", imageBytes, "image.jpg", "image/jpeg");
            
            var response = _client.Execute<Dictionary<string, object>>(request);
            
            if (response.IsSuccessful)
            {
                var result = response.Data;
                if (result.ContainsKey("words_result"))
                {
                    var wordsResult = result["words_result"] as List<object>;
                    
                    if (wordsResult.Count > 0)
                    {
                        var text = "";
                        foreach (var ocrResult in wordsResult)
                        {
                            var dict = ocrResult as Dictionary<string, object>;
                            text += dict["words"] as string + "\n";
                        }
                        
                        return text;
                    }
                }
            }
            
            return null;
        }
        
        private string GetAccessToken()
        {
            // 发送 POST 请求，获取access_token
        }
    }
}

在 RecognizeText 方法中，我们首先创建了一个 RestRequest 对象，并设置了请求的 URL 和方法。然后，我们将图像作为文件添加到请求中，并发送请求。最后，我们解析响应数据，提取识别到的文字，并返回结果。

注意到在 GetAccessToken 方法中，我们需要发送一个 POST 请求，获取 access_token，然后添加到 URL 参数中。由于这部分涉及到百度智能云的认证机制，请查阅百度 PaddleOCR 的开发文档来获取更多信息。

创建完 PaddleOCRClient 类之后，我们可以在 Program.cs 的 Main 方法中调用它，并打印出识别到的文字。

using System;
using System.IO;

namespace PaddleOCRDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var client = new PaddleOCRClient();
            
            var imageBytes = File.ReadAllBytes("image.jpg");
            var text = client.RecognizeText(imageBytes);
            
            if (!string.IsNullOrEmpty(text))
            {
                Console.WriteLine(text);
            }
            else
            {
                Console.WriteLine("Failed to recognize text in the image.");
            }
        }
    }
}

确保将 image.jpg 替换为你要进行识别的实际图像文件。

现在，运行程序，你将看到识别到的文字显示在控制台输出中。

总结

在本文中，我们介绍了如何使用.NET Core调用百度 PaddleOCR，实现了图文识别的功能，并在控制台中打印出识别结果。你可以根据自己的需求进一步扩展应用程序，比如将识别结果保存到数据库、展示在网页上等。希望这篇博客能对你有所帮助！

参考资料

本文来自极简博客，作者：心灵的迷宫，转载请注明原文链接：.NET Core 调用百度 PaddleOCR 识别图文