No site da Microsoft tem os learning paths, e o primeiro deles fala do básico do Power BI, é um overview da estrutuda do power bi e como ele funciona.
Vou resumir aqui os pontos tratados nesse primeiro learning path, que vc pode encontrar aqui.
Nota: tem muita coisa aqui que foi traduzida, pq reescrever com minhas palavras não se fez necessário.
Análise de dados
O learning path começa primeiro explicando o que é análise de dados e fala do papel do data analyst, que é o foco desse curso, inclusive o título do exame DA-100 se chama “Microsoft Certified: Data Analyst Associate”.
Então vamos lá… Data analysis, ou análise de dados (alguns termos vou usar em inglês pq é o que vc vai ver na prova e é o que se usa na internet no geral), é o processo de identificar, limpar, transformar e modelar dados para dessa forma tirar informação útil desses dados.
Beleza, então em resumo é isso que é data analysis, mas não se deixem enganar, esse processo todo é muito importante, principalmente para o negócio, ou para o cliente, porque sem uma análise correta vc vai acabar gerando informações e resultados errados para seu usuário.
Os principais tipos de análises são:
Análise Descritiva (Descriptive analytics)
Esse tipo de análise ajuda a responder perguntas sobre o que aconteceu com base em dados históricos. Esse aqui é um exemplo do que eu trabalho, que é basicamente esse tipo de análise. Eu pego uma base de dados do passado, mesmo do dia anterior é passado, ok!? E fico olhando o que deu de certo e de errado pra tomar decisão com base nisso.
Análise de Diagnóstico (Diagnostic analytics)
Esse tipo de análise ajuda a responder perguntas sobre o motivo de algumas coisas terem acontecido, ou seja, esse tipo de análise pega a análise descritiva e usando algumas técnicas e modelos estatísticos é capas de identificar tendências e anomalias nos dados. Esse processo geralmente acontece assim: 1) identifica as anomalias nos dados, pode ser uma quantidade de vendas diferente do esperado, tipo muito alta ou muito baixa, 2) pega todos dados históricos referentes a essa anomalia, 3) aplica modelos estatísticos para descobrir os relacionamentos e as tendências nos dados que expliquem esse problema.
Análise Preditiva (Predictive analytics)
A análise preditiva ajuda a responder a perguntas sobre o que acontecerá no futuro. As técnicas de análise preditiva usam dados históricos para identificar tendências e determinar se é provável que elas se repitam. Para conseguir aplicar uma análise preditiva é preciso aplicar uma variedade de técnicas estatísticas e de aprendizado de máquina (machine learning), como redes neurais, árvores de decisão e regressão.
Análise Prescritiva (Prescriptive analytics)
A análise prescritiva ajuda a responder a perguntas sobre quais ações devem ser tomadas para atingir uma meta ou alvo e, pra conseguir fazer isso ela usa dos resultados gerados pela análise preditiva. As técnicas de análise prescritiva dependem de estratégias de aprendizado de máquina para encontrar padrões em grandes conjuntos de dados. Ao analisar decisões e eventos passados, as organizações podem estimar a probabilidade de resultados diferentes.
Análise Cognitiva (Cognitive analytics)
A análise cognitiva tenta extrair inferências (deduções) de dados e padrões existentes, tirar conclusões com base nas bases de conhecimento existentes e, em seguida, adicionar essas descobertas à base de conhecimento para inferências futuras, um ciclo de feedback de autoaprendizagem.
Inferências não são consultas estruturadas baseadas em um banco de dados de regras; pelo contrário, são hipóteses não estruturadas, reunidas de várias fontes e expressas com diferentes graus de confiança. A análise cognitiva eficaz depende dos algoritmos de aprendizado de máquina e usará vários conceitos de processamento de linguagem natural para entender as fontes de dados ainda não exploradas, como registros de conversas em centrais de atendimento e análises de produtos.
Papel do Data Analyst
Um analista de dados permite que as empresas maximizem o valor de seus ativos de dados por meio de ferramentas de visualização e relatório, como o Microsoft Power BI. Os analistas de dados são responsáveis por criar perfil, limpar e transformar dados. Suas responsabilidades também incluem projetar e criar modelos de dados escaláveis e eficazes, além de habilitar e implementar os recursos avançados de análise nos relatórios para análise. Um analista de dados trabalha com as partes interessadas pertinentes para identificar os dados apropriados e necessários e os requisitos de relatório e, em seguida, eles têm a tarefa de transformar dados brutos em insights relevantes e significativos.
Um analista de dados também é responsável pelo gerenciamento de ativos do Power BI, incluindo relatórios, painéis, workspaces e os datasets usados nos relatórios. Eles têm a tarefa de implementar e configurar procedimentos de segurança adequados, em conjunto com os requisitos das partes interessadas, para garantir a proteção de todos os ativos do Power BI e seus dados.
Os analistas de dados trabalham com os engenheiros de dados para determinar e localizar fontes de dados apropriadas que atendam aos requisitos das partes interessadas. Além disso, os analistas de dados trabalham com o engenheiro de dados e o administrador de banco de dados para garantir que o analista tenha acesso adequado às fontes de dados necessárias. O analista de dados também trabalha com o engenheiro de dados para identificar novos processos ou melhorar os processos existentes para coletar dados para análise.
Tarefas do data analyst
Um analista de dados é uma das várias funções críticas em uma organização, que ajuda a descobrir e entender as informações para manter a empresa equilibrada e operando com eficiência. Portanto, é vital que um analista de dados compreenda claramente suas responsabilidades e as tarefas que são realizadas quase que diariamente. Os analistas de dados são essenciais para ajudar as organizações a obter informações valiosas sobre a extensão de dados que possuem e trabalham em estreita colaboração com outras pessoas na organização para ajudar a revelar informações valiosas.
As principais tarefas de um data analyst são:
Preparar os dados
Como analista de dados, você provavelmente dividirá a maior parte do tempo entre as tarefas de preparação e modelagem. Dados deficientes ou incorretos podem ter um grande impacto que resulta em relatórios inválidos, perda de confiança e um efeito negativo nas decisões de negócios, o que pode levar à perda de receita, um impacto negativo nos negócios e muito mais.
A preparação de dados é o processo de criação de perfil, limpeza e transformação de dados para prepará-lo para modelar e visualizar. A preparação de dados é o processo de pegar dados brutos e transformá-los em informações confiáveis e compreensíveis. Envolve, entre outras coisas, garantir a integridade dos dados, corrigir dados incorretos ou imprecisos, identificar dados ausentes, converter dados de uma estrutura para outra ou de um tipo para outro, ou mesmo uma tarefa tão simples quanto tornar os dados mais legíveis.
Garantias de privacidade e segurança também são importantes. Essas garantias podem incluir dados anônimos, para evitar o compartilhamento excessivo ou impedir que as pessoas vejam informações de identificação pessoal quando não forem necessárias.
Modelagem dos dados
A modelagem de dados é o processo de determinar como suas tabelas estão relacionadas entre si. Esse processo é realizado definindo e criando relacionamentos entre as tabelas. A partir desse ponto, você pode aprimorar o modelo definindo métricas e adicionando cálculos personalizados para enriquecer seus dados.
Um modelo de dados eficaz torna os relatórios mais precisos, permite que os dados sejam explorados com mais rapidez e eficiência, diminui o tempo para o processo de elaboração de relatórios e simplifica a manutenção futura de relatórios.
O modelo é outro componente crítico que afeta diretamente o desempenho do seu relatório e a análise geral dos dados. Um modelo mal projetado pode ter um impacto drasticamente negativo na precisão geral e no desempenho do seu relatório.
Do ponto de vista do Power BI, se o seu relatório estiver executando lentamente ou se as atualizações estiverem demorando muito, você provavelmente precisará revisar as tarefas de preparação e modelagem de dados para otimizar seu relatório.
Visualização dos dados
A tarefa de visualização é onde você dá vida aos seus dados. O objetivo final da tarefa de visualização é resolver problemas de negócios. Um relatório bem elaborado deve contar uma história convincente sobre esses dados, que permitirá aos tomadores de decisão de negócios obter rapidamente as informações necessárias.
Como analista de dados, você deve dedicar algum tempo para entender completamente o problema que a empresa está tentando resolver. Determine se todos os seus pontos de dados são necessários, porque muitos dados podem dificultar a detecção de pontos-chave. Ter uma história de dados pequena e concisa pode ajudar a encontrar insights rapidamente.
Muitos componentes do seu relatório ajudarão na narrativa. Desde um esquema de cores gratuito e acessível, até fontes e tamanhos, escolhendo os visuais certos para o que está sendo exibido, todos se reúnem para contar essa história.
Análise dos dados
A tarefa de análise é a etapa importante para entender e interpretar as informações exibidas no relatório. Em sua função de analista de dados, você deve entender os recursos analíticos do Power BI e usá-los para encontrar insights, identificar padrões e tendências, prever resultados e depois comunicar esses insights de uma maneira que todos possam entender.
Anteriormente, a análise de dados era um processo difícil e intrincado, normalmente realizado por engenheiros ou cientistas de dados. Hoje, o Power BI torna a análise de dados acessível, o que simplifica o processo de análise de dados. Os usuários podem obter rapidamente insights sobre seus dados usando recursos visuais e métricas diretamente da área de trabalho e depois publicá-los em painéis, para que outros possam encontrar as informações necessárias.
Gerenciamento
O Power BI consiste em muitos componentes, incluindo relatórios, painéis, áreas de trabalho, conjuntos de dados e muito mais. Como analista de dados, você é responsável pelo gerenciamento desses ativos do Power BI, supervisionando o compartilhamento e a distribuição de itens, como relatórios e painéis, e garantindo a segurança dos ativos do Power BI.
O gerenciamento adequado também pode ajudar a reduzir os silos de dados em sua organização. A duplicação de dados pode dificultar o gerenciamento e a introdução da latência de dados quando os recursos são usados em excesso. O Power BI ajuda a reduzir os silos de dados com o uso de conjuntos de dados compartilhados e permite reutilizar os dados que você preparou e modelou. Para os principais dados corporativos, o endosso de um conjunto de dados certificado pode ajudar a garantir a confiança nesses dados.
Power BI Básico
As partes do Power BI
O Power BI consiste em um aplicativo de desktop do Microsoft Windows chamado Power BI Desktop, um serviço SaaS (Software as a Service) on-line chamado serviço de Power BI e aplicativos móveis do Power BI disponíveis em qualquer dispositivo, com aplicativos nativos de BI móvel para Windows, iOS e Android.

O fluxo de trabalho padrão do Power BI
Um fluxo comum de trabalho no Power BI começa no Power BI Desktop, onde um relatório é criado. Esse relatório é publicado no serviço do Power BI e finalmente compartilhado, para que os usuários dos aplicativos do Power BI Mobile possam consumir as informações.
Nem sempre acontece assim, e tudo bem. Mas usaremos esse fluxo para ajudá-lo a aprender as diferentes partes do Power BI e como elas se complementam.
As atividades e análises que você aprenderá com o Power BI geralmente seguem um fluxo comum. O fluxo comum de atividade é assim:
- Carregue dados no Power BI Desktop e crie um relatório.
- Publique no serviço Power BI, onde você pode criar novas visualizações ou criar dashboards.
- Compartilhe dashboards com outras pessoas.
- Visualize e interaja com dashboards e relatórios compartilhados nos aplicativos Power BI Mobile.

Aqui estão os blocos de construção básicos no Power BI:
Visualizations (visuais)
- Datasets (conjunto de dados)
- Reports
- Dashboards
- Tiles (blocos)
Visualizations Uma visualização (às vezes também chamada de visual) é uma representação visual de dados, como um gráfico, um mapa com código de cores ou outras coisas interessantes que você pode criar para representar visualmente seus dados. Exemplo:

Datasets
Um conjunto de dados é uma coleção de dados que o Power BI usa para criar suas visualizações.
Você pode ter um conjunto de dados simples baseado em uma única tabela de uma pasta de trabalho do Microsoft Excel. Os conjuntos de dados também podem ser uma combinação de várias fontes diferentes, que você pode filtrar e combinar para fornecer uma coleção exclusiva de dados (um conjunto de dados) para uso no Power BI. Por exemplo, você pode criar um conjunto de dados a partir de três campos do banco de dados, uma tabela de site, uma tabela do Excel e resultados online de uma campanha de marketing por email. Essa combinação exclusiva ainda é considerada um único conjunto de dados, embora tenha sido reunido de várias fontes diferentes.
Uma parte importante e ativadora do Power BI é a multiplicidade de conectores de dados incluídos. Se os dados que você deseja estão no Excel ou em um banco de dados Microsoft SQL Server, no Azure ou Oracle ou em um serviço como Facebook, Salesforce ou MailChimp, o Power BI possui conectores de dados internos que permitem conectar-se facilmente a esses dados. se necessário, e leve-o ao seu conjunto de dados.
Reports No Power BI, um relatório é uma coleção de visualizações que aparecem juntas em uma ou mais páginas. Um relatório no Power BI é uma coleção de itens relacionados entre si. A imagem a seguir mostra um relatório no Power BI Desktop – nesse caso, é a segunda página de um relatório de cinco páginas. Você também pode criar relatórios no serviço Power BI.

Dashboards
Quando você estiver pronto para compartilhar uma única página de um relatório ou uma coleção de visualizações, crie um painel. O painel do Power BI é uma coleção de recursos visuais de uma única página que você pode compartilhar com outras pessoas. Frequentemente, é um grupo selecionado de recursos visuais que fornece informações rápidas sobre os dados ou a história que você está tentando apresentar.
Você pode compartilhar painéis com outros usuários ou grupos, que poderão interagir com seus painéis quando estiverem no serviço do Power BI ou no dispositivo móvel.
Tiles (blocos)
No Power BI, um bloco é uma visualização única em um relatório ou painel. É a caixa retangular que contém um visual individual. Na imagem a seguir, você vê um bloco, que também é cercado por outros blocos.
Ao criar um relatório ou um painel no Power BI, você pode mover ou organizar os blocos da maneira que desejar. Você pode aumentá-los, alterar sua altura ou largura e aconchegá-los a outros ladrilhos.
Ao visualizar ou consumir um painel ou relatório – o que significa que você não é o criador ou o proprietário, mas o relatório ou o painel foi compartilhado com você – você pode interagir com ele, mas não pode alterar o tamanho dos ladrilhos ou sua disposição.

Overview do Power BI service
Como aprendemos na unidade anterior, o fluxo de trabalho comum no Microsoft Power BI é criar um relatório no Power BI Desktop, publicá-lo no serviço do Power BI e compartilhá-lo com outras pessoas, para que eles possam visualizá-lo no serviço ou aplicativo móvel.
Mas como algumas pessoas começam direto no serviço do Power BI, vamos dar uma rápida olhada nele e aprender sobre uma maneira fácil para criar rapidamente recursos visuais nos aplicativos do Power BI: usando APPS.
Um APP (aplicativo) é uma coleção de recursos visuais e relatórios predefinidos e prontos, compartilhados com toda a organização. O uso de um aplicativo é simples: basta pressionar alguns botões ou fazer alguns comentários, e você rapidamente recebe uma coleção de entradas projetadas para ir juntas, todas apresentadas em um pacote arrumado e pronto para consumir.
Criar Dashboards com serviços da cloud
Com o Power BI, é fácil conectar-se aos dados. No serviço Power BI, você pode simplesmente selecionar o botão Obter dados no canto inferior esquerdo da página inicial.

A tela (a área no centro do serviço do Power BI) mostra as fontes de dados disponíveis no serviço do Power BI. Além de fontes de dados comuns, como arquivos do Microsoft Excel, bancos de dados ou dados do Microsoft Azure, o Power BI pode facilmente conectar-se a toda uma variedade de serviços de software (também chamados de provedores SaaS ou serviços em nuvem): Salesforce, Facebook, Google Analytics e Mais.

Para esses serviços de software, o serviço do Power BI fornece uma coleção de recursos visuais prontos pré-organizados em painéis e relatórios para sua organização. Essa coleção de recursos visuais é chamada de aplicativo. Os aplicativos colocam você em funcionamento rapidamente, com dados e painéis que sua organização criou para você.
Além do painel do aplicativo, o relatório que foi gerado e usado para criar o painel está disponível, assim como o conjunto de dados criado durante a importação de dados e usado para criar o relatório do aplicativo selecionado.
Atualizar seus dados no Power BI Service
Você também pode optar por atualizar o conjunto de dados de um aplicativo ou outros dados usados no Power BI. Para definir configurações de atualização, selecione o ícone de atualização agendada para o conjunto de dados a ser atualizado e use o menu que aparece. Você também pode selecionar o ícone de atualização (o círculo com uma seta) ao lado do ícone de atualização de agendamento para atualizar o conjunto de dados imediatamente.

A guia Conjuntos de dados (datasets) está selecionada na página Configurações que aparece. No painel direito, selecione a seta ao lado de Atualização agendada para expandir essa seção. A caixa de diálogo Configurações é exibida na tela, permitindo definir as configurações de atualização que atendem às suas necessidades.
