Um estudo feito em R para o processo de Extração, Limpeza e Carregamento de dados com o objetivo de realizar uma análise exploratória dos dados de deficientes de Vitamina D, observando os padrões de vida daquelas pessoas como: atividades físicas, IMC, Peso etc.
Durante a limpeza do dataset, foi necessário renomear a coluna e seus valores por conta da base ter seus dados em espanhol, quando renomeamos o dataset podemos dividir algumas colunas com o final em _cod para facilitar a quantificação de alguns dados como no caso da coluna de Fator_UV_protetor_solar e Fator_UV_protetor_solar_cod onde dividimos o fator UV dos protetores solares que os entrevistados usam em uma escala de 1 à 4.
Além disso, fora utilizado o nível socioeconômico como um fator de relevância quanto a exposição à luz solar e seu efeito no nível de vitamina D no entrevistado. O nível socioeconômico vai de 1 à 5.