Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Binary file added squads/assets/ciencia-de-dados/modeloTeorico.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added squads/assets/ciencia-de-dados/reforco.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
3 changes: 3 additions & 0 deletions squads/ciencia-de-dados/Aprendizado-De-Máquina/index.yml
Original file line number Diff line number Diff line change
@@ -0,0 +1,3 @@
icon: book
label: Machine Learning
date: 2024-05-06
Original file line number Diff line number Diff line change
@@ -0,0 +1,21 @@
---
icon: dependabot
label: O que é Machine Learning?
order: 3
date: 2024-04-07
category: Machine Learning
author:
name: Rodrigo
avatar: ../../assets/logo_struct.png
---

### Introdução
Machine learning é uma área da inteligência artificial (IA) e da ciência da computação que se concentra no uso de dados e algoritmos para imitar a maneira como os humanos aprendem, melhorando gradualmente sua precisão.

Machine learning é um componente importante do crescente campo da ciência de dados. Por meio do uso de métodos estatísticos, os algoritmos são treinados para fazer classificações ou previsões, revelando os principais insights em projetos de mineração de dados. Esses insights subsequentemente conduzem a tomada de decisões em aplicativos e negócios, impactando de forma ideal as principais métricas de crescimento. À medida que o big data continua a expandir e crescer, a demanda de mercado por cientistas de dados aumentará cada vez mais. Será necessário que eles identifiquem as perguntas de negócios mais relevantes e os dados que podem ser usados para respondê-las.

Os algoritmos de Machine Learning são os “cérebros” por trás de todo o processo, que permite a redação com IA, a criação de imagens e todas as novas aplicações que vêm se desenvolvendo. Eles são responsáveis por aprender a partir dos dados de treinamento e criar modelos matemáticos ou estatísticos que podem fazer previsões ou tomar decisões com base em novos dados.

### Como funciona

O ML funciona mediante uma relação matemática baseada em dados. Mesmo que não saiba uma determinada relação, se ele receber um conjunto de dados suficientes, ele aprende e entrega uma ação compatível com os dados. Por exemplo, se uma pessoa digita a palavra "bravo" no Google, o resultado poderia apresentar dois possíveis significados: enfurecido ou corajoso. Dependendo dos dados de busca anteriores, o ML reconhecerá um padrão e trará o resultado mais compatível com os dados.
Original file line number Diff line number Diff line change
@@ -0,0 +1,23 @@
---
icon: dependabot
label: Principais Modelos
order: 1
date: 2024-04-07
category: Machine Learning
author:
name: Rodrigo
avatar: ../../assets/logo_struct.png
---

## Algoritimos Comuns

Alguns modelos de machine learning são mais famosos que outros e nesse squad iremos falar sobre os três principais: Regressão linear, Regressão Logistica e o mais queridinho de todos deep learning(mais especificamente iremos abordar redes neurais).

### Redes neurais:
As redes neurais simulam a forma como o cérebro humano funciona, com um grande número de nós de processamento interligados. As redes neurais têm a capacidade de reconhecer padrões e desempenham um papel importante nos aplicativos, incluindo tradução de linguagem natural, reconhecimento de imagem, reconhecimento de voz e criação de imagem.

### Regressão linear:
Este algoritmo é usado para prever valores numéricos com base em um relacionamento linear entre diferentes valores. Por exemplo, a regressão linear poderia ser usada para prever preços de imóveis residenciais com base nos históricos de dados da região.

### Regressão logística:
Este algoritmo de aprendizado supervisionado faz previsões para variáveis de resposta categórica, como perguntas de respostas "sim/não". A regressão logística ser usada para aplicações como classificação de spam e controle de qualidade em uma linha de produção.
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
---
icon: dependabot
label: Tipos de Aprendizado
order: 2
date: 2024-04-07
category: Machine Learning
author:
name: Rodrigo
avatar: ../../assets/logo_struct.png
---

## Classificação
Cada tipo de aprendizado é adequado para diferentes tipos de problemas e cenários, e entender as diferenças entre eles é fundamental para escolher a abordagem correta em um projeto de machine learning. Neste artigo, vamos explorar cada tipo de aprendizado, discutindo seus princípios básicos, aplicações comuns e desafios associados.

Existem 3 categorias principais em que os algoritmos de machine learning pode ser classificados:

### Aprendizado Supervisionado
O aprendizado supervisionado, também conhecido como machine learning supervisionado, é definido pelo uso de conjuntos de dados rotulados para treinar algoritmos que classificam dados ou predizem resultados com precisão. Conforme os dados de entrada são alimentados no modelo, ele ajusta suas pontuações até que esteja ajustado de maneira adequada. Isso ocorre como parte do processo de validação cruzada para garantir que o modelo evita super ajuste ou subajuste. O aprendizado supervisionado ajuda as organizações a resolver uma variedade de problemas do mundo real em grande escala, como a classificação de spam em uma pasta separada da sua caixa de entrada. Alguns métodos usados na aprendizagem supervisionada incluem redes neurais, naïve bayes, regressão linear, regressão logística, floresta aleatória e máquina de vetores de suporte (SVM).

![modelo de aprendizado supervisionado](../../assets/ciencia-de-dados/modeloTeorico.png "Modelo machine Learning")

### Aprendizado Não-Supervisionado
O aprendizado não supervisionado, também conhecido como machine learning não supervisionado, usa algoritmos de machine learning para analisar e agrupar conjuntos de dados não rotulados. Esses algoritmos descobrem padrões ocultos ou agrupamentos de dados sem a necessidade de intervenção humana. A capacidade deste método de descobrir semelhanças e diferenças nas informações o torna ideal para análise exploratória de dados, estratégias de vendas cruzadas, segmentação de clientes, imagem e reconhecimento de padrões.

![modelo de aprendizado não supervisionado](../../assets/ciencia-de-dados/naosupervisionado.png "Modelo machine Learning")

### Aprendizado por Reforço
O aprendizado por reforço é um paradigma em que um agente interage com um ambiente e aprende a tomar decisões sequenciais para maximizar uma recompensa cumulativa ao longo do tempo.
O objetivo é aprender uma política (estratégia) que permita ao agente tomar ações que otimizem sua recompensa ao longo de múltiplas etapas de decisão. Por exemplo, Jogos (como xadrez ou Go), robótica autônoma, navegação de veículos autônomos, controle de sistemas dinâmicos etc.
37 changes: 35 additions & 2 deletions squads/ciencia-de-dados/apresentacao.md
Original file line number Diff line number Diff line change
@@ -1,7 +1,40 @@
---
icon: star
icon: rocket
label: Apresentação
order: a
order: 1
date: 2024-04-07
category: Introdução
author:
name: Rodrigo
avatar: ../assets/logo_struct.png
---

Bem vindos ao melhor squad! Antes de começar a falar sobre ciência de dados vamos falar um pouco sobre o nosso squad e sua funções 😉.

### Objetivos:
- **Objetivo Principal:** Ampliar os Conhecimentos da Empresa em geral.
- **Objetivos Secundarios:**
Utilizar dados para conhecimentos estratégicos;
Desenvolver modelos preditivos para otimização de processos(Venda de imoveis, emprestimo com base no salario);
Impulsionar a inovação por meio de análises avançadas.

### O que é Ciência de Dados?
- **Definição:** ciência de dados combina matemática e estatística, programação especializada, análises de dados avançadas, inteligência artificial (IA) e aprendizado de máquina com conhecimento específico do assunto para descobrir insights acionáveis ocultos nos dados de uma organização. Esses insights podem ser usados para orientar a tomada de decisões e o planejamento estratégico.
Atualmente o volume de dados gerado por ações online, como uma simples curtida no Facebook ou até o upload de vídeos ou fotos no Instagram, é enorme. Junto com esse aumento na geração de dados também aumentou a nossa capacidade de processamento. Desde os anos 1970 a cada dois anos a nossa capacidade de processamento praticamente dobrou. E com esse grande aumento na quantidade de dados e na capacidade de processamento, um novo conceito surgiu, o Big Data. E com a necessidade de analisar e tentar extrair desse grande volume de dados informações úteis, surge a Ciência de dados.

- **Cientista de Dados**: O cientista de dados resolve problemas, ajuda a tomada de decisão a partir de dados brutos que nem sempre são úteis e que muitas vezes são muito volumosos e complexos. Portanto, o principal trabalho desse profissional é organizar e analisar essas informações de uma forma que as torne aproveitáveis para uma finalidade.
Ele consegue fazer isso em um espaço de tempo relativamente curto, através do uso de algoritmos, que são as regras nas quais os programas de computador vão se basear durante a mineração de dados.
O cientista de dados também vai usar o conceito do aprendizado de máquina, ou machine learning, para trabalhar com essas informações de forma mais rápida e assertiva.

- **Importância:** Permite tomar decisões baseadas em evidências, identificar tendências ocultas e prever resultados futuros.


### Atividades do Squad
O squad tem como objetivo estudar ferramentas que possam nos auxiliar na aquisição de novas habilidades e também atrair novos clientes.
Além disso documentar todo conteúdo estudado ao longo do semestre, estudando meios de integrar esse conhecimento na empresa e aplicar para o nosso contexto de desenvolvivemento web.
#### Nossa funções:
- **Desenvolvimento de Modelos Preditivos:**
- Previsão de demanda, comportamento do consumidor, etc.
- **Otimização de Processos:**
- Automatização e eficiência operacional

11 changes: 11 additions & 0 deletions squads/ciencia-de-dados/retype.yml
Original file line number Diff line number Diff line change
@@ -0,0 +1,11 @@
input: .
output: .retype
url: # Add your website address here
branding:
title: Project Name
label: Docs
links:
- text: Getting Started
link: https://retype.com/guides/getting-started/
footer:
copyright: "© Copyright {{ year }}. All rights reserved."