{"id":1340,"date":"2020-09-22T18:04:18","date_gmt":"2020-09-22T21:04:18","guid":{"rendered":"https:\/\/kondado.com.br\/blog\/?p=1340"},"modified":"2022-01-14T21:02:36","modified_gmt":"2022-01-15T00:02:36","slug":"data-lake-x-data-warehouse-entenda-as-diferencas","status":"publish","type":"post","link":"https:\/\/kondado.com.br\/blog\/blog\/2020\/09\/22\/data-lake-x-data-warehouse-entenda-as-diferencas\/","title":{"rendered":"Data Lake x Data Warehouse: Entenda as diferen\u00e7as"},"content":{"rendered":"\n<p>Quando se fala em Big Data, muito se fala sobre Data Lake ou Data Warehouse, por\u00e9m apesar de ambos serem usados para guardar dados, suas fun\u00e7\u00f5es e aplica\u00e7\u00f5es s\u00e3o bem distintas entre si. <\/p>\n\n\n\n<h3>O que \u00e9 Data Lake?<\/h3>\n\n\n\n<p>Data Lake \u00e9 um reposit\u00f3rio para guardar dados estruturados ou n\u00e3o estruturados, ou seja, ele abriga qualquer tipo de dado, incluindo dados brutos. Ele foi desenvolvido para abrigar grandes volumes de dados geralmente n\u00e3o transformados, n\u00e3o sendo necess\u00e1rio que estes obede\u00e7am a uma estrutura em particular, por isso pode encolher ou aumentar conforme  os dados s\u00e3o escritos nele. O Data Lake \u00e9 comumente usado por cientistas de dados para aplica\u00e7\u00e3o de an\u00e1lises profundas, como data minning, an\u00e1lises preditivas e estat\u00edsticas, por conter dados brutos e muito granulares. O tratamento destes dados geralmente costuma consumir muito tempo do cientista de dados.<\/p>\n\n\n\n<div data-slot=\"dwc\" data-param-slot-name=\"ma-dwc-2\"><\/div>\n\n\n\n<h3>O que \u00e9 Data Warehouse?<\/h3>\n\n\n\n<p>Data Warehouse \u00e9 um reposit\u00f3rio desenvolvido para armazenamento de dados de m\u00e9dia ou larga escala, geralmente j\u00e1 estruturados. Ao contr\u00e1rio do Data Lake, os dados inseridos no Data Warehouse obedecem a um esquema definido previamente.  Ele \u00e9 comumente usado para reunir informa\u00e7\u00f5es de diversas fontes estruturadas, para fins de an\u00e1lise de neg\u00f3cio.<\/p>\n\n\n\n<h3>Ent\u00e3o, qual a diferen\u00e7a entre os dois? <\/h3>\n\n\n\n<p>Na tabela abaixo resumimos as principais diferen\u00e7as:<\/p>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>T\u00f3pico<\/td><td>Data Lake<\/td><td>Data Warehouse<\/td><\/tr><tr><td>Estrutura dos Dados<\/td><td>N\u00e3o transformados \/ n\u00e3o estruturados<\/td><td>Estruturados<\/td><\/tr><tr><td>Quem mais usa<\/td><td>Cientistas de dados<\/td><td>Analistas de neg\u00f3cio e gestores<\/td><\/tr><tr><td>Uso<\/td><td>An\u00e1lises profundas de dados n\u00e3o estruturados<\/td><td>An\u00e1lises de neg\u00f3cio, montagem de dashboards e reports peri\u00f3dicos, entre outros<\/td><\/tr><tr><td>Esquema<\/td><td>Definido ap\u00f3s a inserc\u00e3o dos dados<\/td><td>Definido antes da inser\u00e7\u00e3o dos dados<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h3>Como definir qual dos dois usar?<\/h3>\n\n\n\n<p>A verdade \u00e9 que depender\u00e1 da aplica\u00e7\u00e3o, inclusive muitas empresas usam os dois. Caso voc\u00ea busque um reposit\u00f3rio para armazenar todos os seus dados independente de sua estrutura, e deseje fazer an\u00e1lises mais profundas e menos objetivas, como por exemplo encontrar padr\u00f5es e prever comportamentos, o data lake \u00e9 o mais indicado. Mas se voc\u00ea precisa de um reposit\u00f3rio para consultar dados para an\u00e1lises mais objetivas e rotineiras, como reports de resultado por exemplo, prefira o Data Warehouse.<\/p>\n\n\n\n<p>N\u00e3o esque\u00e7a que a Kondado pode te ajudar a mandar os seus dados estruturados para o seu data warehouse ou data lake! Fa\u00e7a nosso teste gr\u00e1tis clicando no bot\u00e3o abaixo e confira.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Quando se fala em Big Data, muito se fala sobre Data Lake ou Data Warehouse, por\u00e9m apesar de ambos serem usados para guardar dados, suas fun\u00e7\u00f5es e aplica\u00e7\u00f5es s\u00e3o bem distintas entre si. O que \u00e9 Data Lake? Data Lake \u00e9 um reposit\u00f3rio para guardar dados estruturados ou n\u00e3o estruturados, ou seja, ele abriga qualquer [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":1342,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[2,1],"tags":[295,294,285,240,241,43,27,213],"_links":{"self":[{"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/posts\/1340"}],"collection":[{"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/comments?post=1340"}],"version-history":[{"count":4,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/posts\/1340\/revisions"}],"predecessor-version":[{"id":1694,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/posts\/1340\/revisions\/1694"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/media\/1342"}],"wp:attachment":[{"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/media?parent=1340"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/categories?post=1340"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/kondado.com.br\/blog\/wp-json\/wp\/v2\/tags?post=1340"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}