python使用百度文字识别功能方法详解

2023-12-18Python编程
10

Python使用百度文字识别功能方法详解

在这篇文章中,我将详细讲解如何使用百度AI提供的文字识别功能,来实现将图片中的文字信息提取出来并转化成可用的文本数据。

准备工作

在开始使用百度文字识别功能之前,你需要先申请一个百度开发者账号,并创建一个文字识别应用(即创建一个应用,并获取该应用的 APP_ID、API_KEY 和 SECRET_KEY 参数)。

安装百度AI Python SDK

百度AI提供了 Python SDK,我们可以通过pip安装它。

pip install baidu-aip

使用示例

文字识别

在下面的代码中,我将展示如何使用百度文字识别功能,将远程图片的文字信息提取出来。

from aip import AipOcr

# 以下参数均为你申请的文字识别应用的参数
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1594078087196&di=9c99c9123a1bf8f85f7f6584a5b832e3&imgtype=0&src=http%3A%2F%2Fi1.sinaimg.cn%2FIT%2Fcr%2F2009%2F0531%2Fc155391t10313.jpg"

result = client.basicGeneralUrl(url)

print(result)

输出结果为:

{
    'log_id': 793295759404042759,
    'words_result_num': 3,
    'words_result': [
        {
            'words': 'KFC烤翅'
        },
        {
            'words': '2 19元\n'
        },
        {
            'words': '图片\n'
        }
    ]
}

表格文字识别

百度文字识别功能也支持表格文字的识别,我们可以使用以下示例代码,将图片中的表格文字信息提取出来。

from aip import AipOcr

# 以下参数均为你申请的文字识别应用的参数
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

image_path = "table.png"

# 读取图片
with open(image_path, 'rb') as fp:
    image = fp.read()

# 表格文字识别
result = client.formRecognition(image)

print(result)

输出结果为:

{
    'request_id': '1602149787,550d48af-517e-4c0e-af58-7b055b8c2d4e',
    'result': {
        'templateSign': 'card_1',
        'retData': {
            'name': {
                'itemStr': 'xxxxx医院'
            },
            'labor': {
                'itemStr': '非住院( 3日),其他'
            },
            'age': {
                'itemStr': '34 岁'
            },
            'sex': {
                'itemStr': '女'
            },
            'diag': {
                'itemStr': '急慢性混合性胃炎'
            },
            'cardID': {
                'itemStr': '3101121982xxxx001X'
            }
        }
    }
}

总结

通过上面的示例代码,我们可以看到,百度文字识别功能非常强大,能够很好地满足我们的实际应用需求。在接下来的开发过程中,你可以根据具体场景需求,进行个性化的开发和调试,来满足你的具体需求。

The End

相关推荐

解析Python中的eval()、exec()及其相关函数
Python中有三个内置函数eval()、exec()和compile()来执行动态代码。这些函数能够从字符串参数中读取Python代码并在运行时执行该代码。但是,使用这些函数时必须小心,因为它们的不当使用可能会导致安全漏洞。...
2023-12-18 Python编程
117

Python下载网络文本数据到本地内存的四种实现方法示例
在Python中,下载网络文本数据到本地内存是常见的操作之一。本文将介绍四种常见的下载网络文本数据到本地内存的实现方法,并提供示例说明。...
2023-12-18 Python编程
101

Python 二进制字节流数据的读取操作(bytes与bitstring)
来给你详细讲解下Python 二进制字节流数据的读取操作(bytes与bitstring)。...
2023-12-18 Python编程
120

Python3.0与2.X版本的区别实例分析
Python 3.x 是 Python 2.x 的下一个重大版本,其中有一些值得注意的区别。 Python 3.0中包含了许多不兼容的变化,这意味着在迁移到3.0之前,必须进行代码更改和测试。本文将介绍主要的差异,并给出一些实例来说明不同点。...
2023-12-18 Python编程
34

python如何在终端里面显示一张图片
要在终端里显示图片,需要使用一些Python库。其中一种流行的库是Pillow,它有一个子库PIL.Image可以加载和处理图像文件。要在终端中显示图像,可以使用如下的步骤:...
2023-12-18 Python编程
91

Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
在Python中,我们可以使用Pillow库来进行图像处理。具体实现两幅图像合成一幅图像的方法如下:...
2023-12-18 Python编程
103