CCO - 129 - 12 - Tópicos em Sistemas Distribuídos e Redes - Computação Escalável

Quantidade de créditos: 8
Total de horas de aulas teóricas: 60
Total de horas de aulas de exercícios, seminários ou estudos dirigidos : 60

Objetivo

Explorar ferramentas e técnicas de computação escalável. Apresentar uma visão geral das principais arquiteturas disponíveis para computação escalável, sua evolução e tendências. Discutir os principais aspectos de hardware (nível de arquitetura) e software e aplicações para HPC (high performance computing) com especial foco em clusters, grids e clouds. Estudar modelos e ferramentas para o desenvolvimento de aplicações escaláveis. Projetar e implementar aplicações escaláveis.

Ementa

A disciplina está dividida em duas partes. Infraestrutura: Revisão de arquiteturas de alto desempenho: clusters, grids e computação em nuvem (cloud computing); Visão geral de arquitetura para datacenters: armazenamento, rede, consumo de energia, tolerância a falhas; Cloud controllers para implementação de nuvens privadas e públicas: Eucalyptus, OpenStack, OpenNebula e Nimbus. Estratégias e ferramentas para virtualização: Xen, VMWare e KVM, configuração e instanciação de máquinas virtuais. Aplicações: O modelo de programação MapReduce; Ferramentas: Hadoop, HDFS. Algoritmos: Indexação de páginas; Processamento de grafos. Projeto de aplicações MapReduce/Hadoop. Análise de desempenho.

Bibliografia Principal

  1. Luiz André Barroso, Urs Hölzle. The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines. Synthesis Series on Computer Architecture, Morgan & Claypool Publishers, May 2009. eBook disponível em: http://www.morganclaypool.com/doi/pdf/10.2200/S00193ED1V01Y200905CAC006
  2. Tony Hey, Stewart Tansley, Kristin Tolle (Editors). The Fourth Paradigm: Data-Intensive Scientific Discovery. Microsoft Research, 2009. Disponível em: http://research.microsoft.com/en-us/collaboration/fourthparadigm/
  3. Tom White. Hadoop: The Definitive Guide. O’Reilly, 2009
  4. Jimmy Lin, Chris Dyer. Data-Intensive Text Processing with MapReduce. University of Maryland, College Park, 2010. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.169.6896&rep=rep1&type=pdf Artigos técnicos e científicos diversos.