“Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar. Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados.
Peso: | 0.56 kg |
Número de páginas: | 352 |
Ano de edição: | 2016 |
ISBN 10: | 8575225219 |
ISBN 13: | 9788575225219 |
Altura: | 24 |
Largura: | 17 |
Edição: | 1 |
Idioma : | Português |
Tipo de produto : | Livro |
Literatura Nacional : | Literatura Nacional |
Nós usamos cookies para melhorar a sua experiência no site e, ao continuar navegando, você concorda com essas condições. Acesse o nosso Portal de Privacidade para visualizar nossas Política de Privacidade, Política de Cookies e Termo de Compromisso e Uso do Site.
Avaliações