Hogyan lehet programozottan címkéket kivonni a képekből a Python és a Vision API segítségével?

by EITCA Akadémia / Szerda, 27 december 2023 / Megjelent a Mesterséges Intelligencia, EITC/AI/GVAPI Google Vision API, Képek címkézése, Címkék észlelése, Vizsga felülvizsgálat

Ha programozottan szeretne címkéket kinyerni a képekből a Python és a Vision API használatával, akkor kihasználhatja a Google Cloud Vision API hatékony képességeit. A Vision API a képelemzési funkciók átfogó készletét kínálja, beleértve a címkeérzékelést is, amely lehetővé teszi a címkék automatikus azonosítását és a képekből való kinyerését.

A kezdéshez be kell állítania egy Google Cloud projektet, és engedélyeznie kell a Vision API-t. Miután ezt megtette, telepítheti a szükséges Python-könyvtárakat a következő parancs futtatásával:

python
pip install google-cloud-vision

Ezután hitelesítenie kell az alkalmazást a Vision API eléréséhez. Ezt úgy teheti meg, hogy létrehoz egy szolgáltatásfiók-kulcsot, és beállítja a „GOOGLE_APPLICATION_CREDENTIALS” környezeti változót úgy, hogy a kulcsfájl elérési útjára mutasson. Ezt a következő kóddal lehet megtenni:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

Mostantól a Vision API segítségével programozottan kinyerheti a címkéket a képekből. A következő kódrészlet bemutatja, hogyan kell ezt megtenni:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

Ebben a kódban először létrehozzuk az "ImageAnnotatorClient" osztály egy példányát a "google.cloud.vision" könyvtárból. Ezután beolvassuk a képfájlt, létrehozunk egy „Image” objektumot a fájl tartalmából, és elküldjük a Vision API-nak címkeészlelés céljából. Az API-válasz tartalmazza a címke megjegyzések listáját, amelyből kivonjuk a címkék leírását.

Most már meghívhatja az "extract_labels" függvényt az elemezni kívánt képfájl elérési útjának átadásával. Visszaadja a képből kivont címkék listáját.

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

Ez kiírja a képből kivont címkéket.

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

A Vision API fejlett gépi tanulási modelleket használ a képek elemzésére, valamint az objektumok, jelenetek és egyéb vizuális funkciók azonosítására. Pontosan képes felismerni a címkék széles skáláját, így értékes eszköz a különféle alkalmazásokhoz, mint például a képosztályozás, a tartalom moderálása és a vizuális keresés.

Ha programozottan szeretne címkéket kivonni a képekből a Python és a Vision API használatával, be kell állítania egy Google Cloud projektet, engedélyeznie kell a Vision API-t, telepítenie kell a szükséges Python-könyvtárakat, hitelesítenie kell az alkalmazást, majd a Vision API segítségével címkeészlelést kell végeznie a képeket. A kinyert címkék további elemzésre vagy a képtartalom megértésének javítására használhatók.

További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GVAPI Google Vision API:

További kérdések és válaszok az EITC/AI/GVAPI Google Vision API-ban

További kérdések és válaszok:

Mező: Mesterséges Intelligencia
program: EITC/AI/GVAPI Google Vision API (lépjen a tanúsítási programba)
Lecke: Képek címkézése (menj a kapcsolódó leckére)
Téma: Címkék észlelése (lépjen a kapcsolódó témára)
Vizsga felülvizsgálat

Címkék: Mesterséges Intelligencia, A Google Cloud, Képelemzés, Címkefelismerés, Piton, Vision API

EITCA Akadémia

Hogyan lehet programozottan címkéket kivonni a képekből a Python és a Vision API segítségével?

További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GVAPI Google Vision API:

További kérdések és válaszok:

Az EITCA Akadémia az európai IT tanúsítási keretrendszer része

Jogosultság az EITCA Academy 80% -os EITCI DSJC támogatási támogatására

EITCA Akadémia

BEJELENTKEZNI A SZÁMÁRA A FELHASZNÁLÓNAK VAGY E-mail CÍMEN

FELHASZNÁLÁSA AZ RÉSZLETEI?

HOZZON LÉTRE EGY FIÓKOT

Hogyan lehet programozottan címkéket kivonni a képekből a Python és a Vision API segítségével?

További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GVAPI Google Vision API:

További kérdések és válaszok:

Jogosultság az EITCA Academy 80% -os EITCI DSJC támogatási támogatására