Skip to content

Este projeto usa Azure Vision para analisar, rotular e identificar imagens gerando a saída dos dados em JSON. O script Python processa imagens com base em prefixos nos nomes dos arquivos, ativando funcionalidades como geração de legendas e detecção de objetos.

License

Notifications You must be signed in to change notification settings

megarj/Microsoft-Azure-Vision-Image-Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Trabalhando com Visão Computacional


Azure Vision Image Analysis

Este script Python exemplifica a utilização do serviço Azure Vision para analisar, rotular e identificar elementos visuais nas imagens em uma pasta de entrada e salvar os resultados em uma pasta de saída.

⚠️ Atenção: Ao final dos seus testes não se esqueça de apagar os recursos ⚠️

🧹Não sabe como apagar? 👉 Veja aqui

🔗 Links de Referência

📝Documentação Azure AI Vision

🌐 API 4.0

😺 Repositorio GIT azure-sdk-for-python com exemplos

Índice

  1. Requisitos
  2. Instalação e Configuração
  3. Como Usar
  4. Funcionalidades
  5. Exemplos de Imagens
  6. Licença

Requisitos

Instalação e Configuração

  1. Configure as variáveis de ambiente com o endpoint e a chave da API do Azure Vision:

    Para usuários do Linux:

    export VISION_ENDPOINT=<seu_endpoint>
    export VISION_KEY=<sua_chave>

    Para usuários do Windows:

    • Abra o menu Iniciar e pesquise por "Variáveis de ambiente".
    • Clique em "Editar variáveis de ambiente do sistema".
    • Na janela de Propriedades do sistema, clique no botão "Variáveis de ambiente".
    • Na seção "Variáveis do sistema", clique em "Novo..." para adicionar uma nova variável.
    • Em "Nome da variável", insira VISION_ENDPOINT.
    • Em "Valor da variável", insira o endpoint do Azure Vision.
    • Repita as etapas anteriores para adicionar a chave da API, utilizando VISION_KEY como nome da variável e sua chave como valor.
    • Clique em "OK" para fechar todas as janelas de configuração.

⚠️ Atenção: Nunca exponha sua key ou endpoint diretamente no código ⚠️

⚠️ Atenção: Se estiver com o terminal aberto terá de reiniciá-lo para que entenda as novas variáveis de ambiente ⚠️

  1. Clone este repositório para o seu ambiente local:

    git clone https://github.com/megarj/Microsoft-Azure-Vision-Image-Analysis.git
  2. Navegue até o diretório do projeto:

    cd Microsoft-Azure-Vision-Image-Analysis
  3. Crie e ative um ambiente virtual Python:

    Windows:

    python -m venv escolha-nome-ambiente
    escolha-nome-ambiente\Scripts\activate

    Linux:

    python -m venv escolha-nome-ambiente
    source escolha-nome-ambiente/bin/activate

Essas instruções criam e ativam um ambiente virtual Python no respectivo sistema operacional. Certifique-se de substituir escolha-nome-ambiente pelo nome desejado para o seu ambiente virtual.

  1. Instale as dependências necessárias:

    pip install -r requirements.txt

Como Usar

Para usar o script, basta colocar as imagens que deseja analisar na pasta inputs. O script irá processar automaticamente as imagens e salvar os resultados em formato JSON na pasta output. Certifique-se de que as imagens tenham nomes que correspondam aos prefixos necessários para ativar as diferentes funcionalidades de análise.

Execute o script com o seguinte comando:

python azure_vision_image_analysis.py

Funcionalidades

O script analisa as imagens com base nos prefixos dos nomes dos arquivos. Os prefixos e suas funcionalidades correspondentes são:

 features_map = {
    "analysis": [VisualFeatures.DENSE_CAPTIONS],
    "ocr": [VisualFeatures.READ],
    "people": [VisualFeatures.PEOPLE]
 }

Segue a lista completa abaixo para auxiliar no uso das demais funcionalidades

Recurso Visual Descrição
Caption Gera uma frase de legenda legível por humanos que descreva o conteúdo da imagem.
DenseCaptions Gera frases de legenda legíveis por humanos para até 10 regiões diferentes na imagem, incluindo uma para a imagem inteira.
None Nenhum recurso visual é selecionado.
Objects Detecção de objetos. Isso é semelhante às tags, mas focado em detectar objetos físicos na imagem e retornar sua localização.
People Detecte as pessoas na imagem e retorne sua localização.
Read Extraia texto impresso ou manuscrito da imagem. Também conhecido como Reconhecimento Óptico de Caracteres (OCR).
SmartCrops Encontre sub-regiões representativas da imagem para geração de miniaturas, nas proporções desejadas, com prioridade para as faces detectadas.
Tags Extraia tags de conteúdo para milhares de objetos reconhecíveis, seres vivos, cenários e ações que aparecem na imagem.

Dados tirados da documentação da API de Análise de Imagens 4.0

Exemplos de Imagens

Certifique-se de que as imagens na pasta inputs tenham nomes que correspondam aos prefixos mencionados acima para ativar as funcionalidades desejadas de análise.

analysis_store-camera-1.jpg ocr_advert.jpg people_store-camera-2.jpg
analysis_store-camera-1 ocr_advert people_store-camera-2
analysis_store-camera-1 ocr_advert people_store-camera-2

Licença

Este projeto está licenciado sob a Licença MIT.


Gostou, achou útil? Considere dar uma estrela 😉

Estrelas

About

Este projeto usa Azure Vision para analisar, rotular e identificar imagens gerando a saída dos dados em JSON. O script Python processa imagens com base em prefixos nos nomes dos arquivos, ativando funcionalidades como geração de legendas e detecção de objetos.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages