Glossário da área de dados: 15 termos que não podem faltar no seu vocabulário

Glossário da área de dados: 15 termos que não podem faltar no seu vocabulário

Inscreva-se

Abordamos dados e análises dentro das empresas.

Receba novos artigos por e-mail


Compartilhe

Para quem está iniciando uma carreira no universo de dados, navegar nos conceitos mais usados na área pode ser intimidante. Por isso, reunimos aqui alguns termos que não podem faltar no seu vocabulário:

Algoritmo

Um algoritmo é uma série de instruções que se dá a um computador para que ele solucione algum problema proposto de forma mecânica. Essas instruções podem ser simples, como retirar todos os caracteres especiais de um número de telefone, ou mais complexas, como prever o número de vendas que um representante irá fazer em determinado período no futuro.

Big Data

Big Data é um termo usado para descrever um grande conjunto de dados, e a capacidade para armazená-los, tratá-los e extrair informação dos mesmos. Os problemas que precisam ser resolvidos em Big Data são classificados através dos 5 V’s: Volume, Velocidade, Variedade, Veracidade e Valor.

Business Intelligence

O BI é uma área que reune tecnologias e melhores práticas para a coleta, armazenamento, análise e apresentação de dados, com o propósito de suportar a tomada de decisão dos negócios.

Cloud Computing

Computação em nuvem, em português, é a disponibilidade de serviços de computação (tais como servidores, bases de dados, softwares, etc) através da internet, ou na “nuvem”.

Data Analytics

Data Analytics é o processo de transformação, modelagem e análise de dados com o objetivo de transformá-los em informação que façam sentido e auxiliem o negócio. O analista de dados tem como objetivo principal transformar dados crus em insights e tendências.

Data Engineering

O engenheiro de dados é responsável por implementar mecanismos que façam a coleta, armazenamento e transformação de dados, para que estes, ao serem disponibilizados ao usuário final, sejam usáveis.

Data Lake

Um data lake (“lago de dados” em português) é um repositório para armazenamento de dados, que na maioria das vezes não são estruturados ou estão em seu estado natural (não tratados).

Data Science

A ciência de dados é a área que usa modelagem e estatística avançada, matemática e ciências da computação para fazer previsões e resolver problemas complexos. O objetivo do cientista de dados dentro de uma organização é trazer respostas para perguntas difíceis que ajudem a companhia a tomar decisões mais objetivas.

Data Transformation

Transformação de dados é o processo de conversão de formato, estrutura ou valores de dados. Esse processo pode ser realizado antes ou depois da chegada dos dados em um base de dados (ver ELT ou ETL).

Data Visualization

Visualização de dados é a representação gráfica de informações e dados. Ao usar gráficos, tabelas, mapas ou outras formas de visualização, tem-se como objetivo tornar fácil a identificação de padrões, tendências, resultados e outliers.

Data Warehouse

O data warehouse é um local usado para armazenar grandes quantidades de dados do negócio e suportar atividades de análise e business intelligence. Ele se diferencia do data lake nos seguintes aspectos:

ELT

A sigla ELT significa “Extract, Load, Transform”, ou em português “Extrair, Carregar, Transformar”, e refere-se ao processo usado para replicar dados de uma fonte em uma base de dados. No ELT, os dados são extraídos da fonte, carregados no seu destino e só então transformados.

Estatística

A estatística é a ciência que engloba as várias ferramentas e métodos usados para coletar, organizar e analisar dados a partir de uma amostra.

ETL

A sigla ETL significa “Extract, Transform, Load”, ou em português “Extrair, Transformar, Carregar”, e refere-se também ao processo usado para replicar dados de uma fonte em um destino. Em contrapartida ao ELT, os dados são extraídos e carregados no destino somente após realizada a transformação neles. As diferenças entre os dois processos podem ser resumidas nos seguintes pontos:

Machine Learning

Machine Learning, ou aprendizagem de máquina, é um processo em que um computador usa um algoritmo para entender um conjunto de dados, e com base nesse entendimento fazer previsões ou tomar decisões.

Publicado em 2021-03-29