Ha programozottan szeretne címkéket kinyerni a képekből a Python és a Vision API használatával, akkor kihasználhatja a Google Cloud Vision API hatékony képességeit. A Vision API a képelemzési funkciók átfogó készletét kínálja, beleértve a címkeérzékelést is, amely lehetővé teszi a címkék automatikus azonosítását és a képekből való kinyerését.
A kezdéshez be kell állítania egy Google Cloud projektet, és engedélyeznie kell a Vision API-t. Miután ezt megtette, telepítheti a szükséges Python-könyvtárakat a következő parancs futtatásával:
python pip install google-cloud-vision
Ezután hitelesítenie kell az alkalmazást a Vision API eléréséhez. Ezt úgy teheti meg, hogy létrehoz egy szolgáltatásfiók-kulcsot, és beállítja a „GOOGLE_APPLICATION_CREDENTIALS” környezeti változót úgy, hogy a kulcsfájl elérési útjára mutasson. Ezt a következő kóddal lehet megtenni:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Mostantól a Vision API segítségével programozottan kinyerheti a címkéket a képekből. A következő kódrészlet bemutatja, hogyan kell ezt megtenni:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
Ebben a kódban először létrehozzuk az "ImageAnnotatorClient" osztály egy példányát a "google.cloud.vision" könyvtárból. Ezután beolvassuk a képfájlt, létrehozunk egy „Image” objektumot a fájl tartalmából, és elküldjük a Vision API-nak címkeészlelés céljából. Az API-válasz tartalmazza a címke megjegyzések listáját, amelyből kivonjuk a címkék leírását.
Most már meghívhatja az "extract_labels" függvényt az elemezni kívánt képfájl elérési útjának átadásával. Visszaadja a képből kivont címkék listáját.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Ez kiírja a képből kivont címkéket.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
A Vision API fejlett gépi tanulási modelleket használ a képek elemzésére, valamint az objektumok, jelenetek és egyéb vizuális funkciók azonosítására. Pontosan képes felismerni a címkék széles skáláját, így értékes eszköz a különféle alkalmazásokhoz, mint például a képosztályozás, a tartalom moderálása és a vizuális keresés.
Ha programozottan szeretne címkéket kivonni a képekből a Python és a Vision API használatával, be kell állítania egy Google Cloud projektet, engedélyeznie kell a Vision API-t, telepítenie kell a szükséges Python-könyvtárakat, hitelesítenie kell az alkalmazást, majd a Vision API segítségével címkeészlelést kell végeznie a képeket. A kinyert címkék további elemzésre vagy a képtartalom megértésének javítására használhatók.
További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GVAPI Google Vision API:
- Milyen előre meghatározott kategóriák vannak az objektumfelismeréshez a Google Vision API-ban?
- A Google Vision API lehetővé teszi az arcfelismerést?
- Hogyan lehet a megjelenített szöveget hozzáadni a képhez, amikor objektumszegélyeket rajzolunk a "draw_vertices" függvény segítségével?
- Mik a "draw.line" metódus paraméterei a megadott kódban, és hogyan használják őket a csúcsértékek közötti vonalak meghúzására?
- Hogyan használható a párnakönyvtár objektumszegélyek rajzolására Pythonban?
- Mi a célja a "draw_vertices" függvénynek a megadott kódban?
- Hogyan segíthet a Google Vision API a képen lévő alakzatok és objektumok megértésében?
- Hogyan fedezhetik fel a felhasználók az API által javasolt, vizuálisan hasonló képeket?
- Melyek a különböző elemek a Google Vision API webészlelési funkciójának válaszobjektumában?
- Hogyan segít a webes észlelés funkció a feltöltött képek címkéinek létrehozásában?
További kérdések és válaszok az EITC/AI/GVAPI Google Vision API-ban