Este script Python exemplifica a utilização do serviço Azure AI Text Analytics para analisar o sentimento de avaliações do Google para uma lista de empresas fornecida pelo usuário.
🧹Não sabe como apagar? 👉 Veja aqui
📝Documentação Azure AI Text Analytics
😺 Repositorio GIT azure-sdk-for-python com exemplos
- Requisitos
- Instalação e Configuração
- Como Usar
- Exemplo de Uso
- Recursos do Azure Text Analytics
- Licença
- Python 3.x
- Conta no Azure com o serviço Text Analytics habilitado Não tem? 👉 Crie aqui sua conta Gratuita
- Chave e Endpoint da API Não tem? 👉 Veja aqui
-
Configure as variáveis de ambiente com o endpoint e a chave da API do Azure Text Analytics:
Para usuários do Linux:
export TEXT_ANALYTICS_ENDPOINT=<seu_endpoint> export TEXT_ANALYTICS_KEY=<sua_chave>
Para usuários do Windows:
- Abra o menu Iniciar e pesquise por "Variáveis de ambiente".
- Clique em "Editar variáveis de ambiente do sistema".
- Na janela de Propriedades do sistema, clique no botão "Variáveis de ambiente".
- Na seção "Variáveis do sistema", clique em "Novo..." para adicionar uma nova variável.
- Em "Nome da variável", insira
TEXT_ANALYTICS_ENDPOINT. - Em "Valor da variável", insira o endpoint do Azure Vision.
- Repita as etapas anteriores para adicionar a chave da API, utilizando
TEXT_ANALYTICS_KEYcomo nome da variável e sua chave como valor. - Clique em "OK" para fechar todas as janelas de configuração.
-
Clone este repositório para o seu ambiente local:
git clone https://github.com/megarj/Microsoft-Azure-AI-Text-Analysis.git
-
Navegue até o diretório do projeto:
cd Microsoft-Azure-AI-Text-Analysis -
Crie e ative um ambiente virtual Python:
python -m venv escolha-nome-ambiente escolha-nome-ambiente\Scripts\activate
python -m venv escolha-nome-ambiente source escolha-nome-ambiente/bin/activate
Essas instruções criam e ativam um ambiente virtual Python no respectivo sistema operacional. Certifique-se de substituir escolha-nome-ambiente pelo nome desejado para o seu ambiente virtual.
-
Instale as dependências necessárias:
pip install -r requirements.txt
-
Navegador Web: Este projeto usa o Selenium para automatizar um navegador web. Por padrão, usamos o Google Chrome, mas você pode alterar para qualquer navegador suportado pelo Selenium. Os navegadores suportados pelo Selenium incluem Google Chrome, Firefox, Safari, Edge, entre outros. Certifique-se de ter o navegador de sua escolha instalado em seu computador. Você pode baixar o Google Chrome do site oficial do Google Chrome. Se você optar por usar um navegador diferente, certifique-se de atualizar o código e o driver do navegador conforme necessário.
Este projeto pode ser usado de duas maneiras:
-
Se você quer coletar avaliações do Google e analisá-las: Execute o seguinte comando:
python main.py
Digite a opção 1
Quando solicitado, digite uma lista de empresas para pesquisar, separadas por vírgulas. O script irá coletar as avaliações do Google Meu Negócio para cada empresa, salvar as avaliações apenas da primeira página aberta para fins de testes em arquivos de texto na pastainputs, analisar as avaliações e salvar os resultados da análise em novos arquivos com o prefixoanalise_. -
Se você já tem o texto a ser analisado: Coloque o arquivo de texto (ou arquivos, se tiver mais de um) na pasta
inputse execute o seguinte comando:python main.py
Digite a opção 2
Isso irá analisar o texto e salvar um novo arquivo eminputscom o prefixoanalise_seguido pelo nome do arquivo de texto original. Por exemplo, se o arquivo de texto original se chamameu_texto.txt, o arquivo de análise seráanalise_meu_texto.txt.
Aqui está um exemplo de como um texto é analisado usando este projeto.
Vinicius Viana
Local Guide·130 comentários·544 fotos
5 dias atrás
NOVA
É uma parada obrigatória quando se fala em turismo no centro histórico de São Paulo. Achei o ambiente bem legal, muita coisa interessante. Os estúdios de tatuagem e body piercing transmitem segurança, qualidade e preço justo. Super recomendo a visita.
Vinicius Viana
Local Guide·130 comentários·544 fotos
5 dias atrás
NOVA
É uma parada obrigatória quando se fala em turismo no centro histórico de São Paulo. Achei o ambiente bem legal, muita coisa interessante. Os estúdios de tatuagem e body piercing transmitem segurança, qualidade e preço justo. Super recomendo a visita.
Sentimento do Documento: positivo
Pontuações gerais: positivo=0.84; neutro=0.16; negativo=0.01
Principais frases: centro histórico, São Paulo, preço, Vinicius Viana, Local Guide, comentários, estúdios, body piercing, segurança, 544 fotos, NOVA, parada, turismo, ambiente, coisa, tatuagem, qualidade, visita
| Recurso | Descrição |
|---|---|
| Análise de Sentimento | Analisa o sentimento do texto. |
| Reconher Entidades | Reconhece e categoriza entidades no texto. |
| Reconhecer Entidades Vinculadas | Reconhece e desambigua a identidade de cada entidade(por exemplo, determinar se a ocorrência Marte se refere ao planeta ou ao Deus romano da guerra) |
| Reconhecer entidades PII | Reconhece e categoriza entidades de PII (Informações de Identificação Pessoal) em seu texto de entrada, como Números da Previdência Social, informações de conta bancária, números de cartão de crédito e muito mais |
| Extrair frases-chave | Determina os pontos de discussão main em seu texto de entrada. Por exemplo, para o texto de entrada "A comida estava deliciosa e havia uma equipe maravilhosa", a API retorna: "comida" e "equipe maravilhosa". |
| Detectar o idioma | Determina o idioma de seu texto de entrada, incluindo a pontuação de confiança do idioma previsto. |
| Análise de entidades de saúde | Extrai entidades reconhecidas dentro do domínio de saúde e identifica relações entre entidades dentro do documento de entrada e links para fontes de informações conhecidas em vários bancos de dados conhecidos, como UMLS, CHV, MSH etc. |
| Análise múltipla | Executa várias análises em um conjunto de documentos em uma única solicitação. |
| Reconhecimento de Entidade Personalizada | Reconhece entidades personalizadas no texto. |
| Classificação personalizada de rótulo único | Classifica o texto em uma única categoria personalizada. |
| Classificação de vários rótulos personalizados | Classifica o texto em várias categorias personalizadas. Por exemplo, resumos de filmes podem ser categorizados em vários gêneros de filmes como "Ação", "Comédia" ou "Drama", etc. |
| Resumo extrativo | Extrai as frases mais relevantes do texto. |
| Resumo abstrativo | Gera um resumo abstrato do texto. |
Para mais exemplos de como utilizar esses recursos, consulte a documentação oficial da API Azure Text Analytics.
Este projeto está licenciado sob a Licença MIT.
Gostou, achou útil? Considere dar uma estrela 😉
