INTRODUCCIÓN A APACHE SPARK para empezar a programar el Big Data
Mario Macías, Mauro Gómez, Rubèn Tous y Jordi Torres
Editorial UOC, Noviembre 2015
ISBN: 978-84-9116-037-3

Hay mucha excitación en relación con el análisis del big data, pero también mucha confusión en decidir por dónde empezar para aquellos que quieren iniciarse en la programación en este apasionante mundo. Este libro proporciona al lector una oportunidad para empezar a programar y manejar datos a través del ecosistema Apache Spark. Spark es actualmente uno de los paquetes de código abierto más importantes en el espacio del big data y por el que importantes empresas, como IBM, SAP, Oracle o Amazon, han apostado, al tiempo que son también grandes contribuidoras. Este libro, que puede utilizarse como texto de autoestudio o de soporte a cursos que requieran una introducción a Apache Spark, contiene una excelente visión introductoria de Apache Spark, una descripción de su ecosistema y de sus características básicas e incluye ejemplos de código para que el lector los pueda probar en su propio PC si lo desea y así tener una comprensión de primera mano de algunas de sus posibilidades.

Enlace al índice+prólogo Matei Zaharia del #LibroSpark.

¿Donde comprar el #LibroSpark?


La edición en papel del libro ya está a la venta en las principales librerías. También se puede adquirir en los portales:

La Casa del Libro

Portal Amazon

Portal editorial UOC

El edición del libro en papel también se podrá adquirir a través de cualquier librería española, así como también a través en cualquier librería Hispanoamérica (México, Argentina, Colómbia, Chile, Perú, etc.) por medio de la red de distribuidores de la que dispone la editorial UOC en estos paises.

La distribución digital del libro, a nuestro pesar, se retrasará un tiempo de acuerdo con las políticas de distribución de la editorial UOC. Cuando esté disponible se podrá adquirir a través de las principals plataformes digitales: Amazon, Apple, Bluebottle, Casa del Libro – Tagus, Casalini, Dawsonera, Digitalia, Digital Books, e-Libro, El Corte Inglés, Google Play, Kobo, Liberdrac, Odilo, así como también en la web de la editorial UOC.

Acerca de los autores


Mario Macías

Doctor en Arquitectura de Computadores por la Universidad Politécnica de Cataluña, donde compagina su trabajo de profesor con el de investigador en el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS). Durante la última década ha trabajado en proyectos de investigación relacionados con cloud computing y eficiencia energética. Como actividad independiente, ha autopublicado dos libros de divulgación científica.

Mauro Gómez

Graduado en Ingeniería Informática por la Universidad de Vigo. Actualmente está finalizando el máster de Ingeniería informática en la UPC (Universidad Politécnica de Cataluña) y trabaja como investigador sobre Spark con el grupo de Autonomic Systems del Barcelona Supercomputing Center - Centro Nacional de Supercomputación. Como actividad independiente, ha colaborado en la creación de los Premios Galegos da Musica, nacidos en el año 2013 en Galicia.

Rubèn Tous

Doctor en Informática por la Universidad Pompeu Fabra. En la actualidad es profesor contratado doctor en el Departamento de Arquitectura de Computadores de la Universidad Politécnica de Cataluña e investigador colaborador en el Barcelona Supercomputing Center - Centro Nacional de Supercomputación. Es experto en indexación, búsqueda y clasificación de información multimedia. Ha publicado más de cincuenta artículos de investigación en revistas y conferencias internacionales. Es coeditor de múltiples estándares de los grupos MPEG y JPEG de ISO, y ha sido codirector del Metadata Subgroup de JPEG.

Jordi Torres

Catedrático de la UPC y lidera un grupo de investigación en el BSC. Actualmente su investigación se centra en la convergencia de la computación de altas prestaciones con el big data y su aplicación a los retos que plantea la analítica del big data o la computación cognitiva. Dada su extensa carrera profesional en diferentes roles, también realiza actividades de consultoría y estrategia relacionadas con las tecnologías de próxima generación y su impacto, y actúa como experto para varias organizaciones y empresas o mentorizando a emprendedores. Una de sus pasiones es la divulgación científica, que lo ha llevado a escribir libros, dar conferencias y colaborar con medios de comunicación.

Agradecimientos


Escribir un libro requiere motivación pero también mucho tiempo, por ello los autores de este libro queremos empezar agradeciendo a nuestro entorno personal más próximo el soporte y la comprensión por el tiempo que hemos dejado de compartir con ellos para poder escribir este libro durante fines de semana y parte de las vacaciones de verano. ¡Gracias!
A Matei Zaharia le queremos agradecer muy sinceramente su disponibilidad y entusiasmo por escribir el prólogo de este libro, que ha sido para nosotros el primer gran reconocimiento al esfuerzo realizado. Además de Matei, también queremos agradecer a Holden Karau, Andy Konwinski y Patrick Wendell que escribieran el libro Learning Spark a principios de este año porque, aunque nuestro libro tiene un enfoque y formato diferente, haber visto el planteamiento de su libro ha sido de gran ayuda.
Nos gustaría mostrar también nuestro agradecimiento a todos los miembros de Databricks con quienes hemos tenido la oportunidad de intercambiar personalmente nuestras impresiones, y que de una manera u otra han influido en esta obra y nos permiten sentir un poco más autorizados a escribir sobre Apache Spark desde Barcelona: Reynold Xin, Xiangrui Meng, Pat Donough, Reza Yazdi, Aaron Davidson y Anthony Joseph. Una especial mención se merece nuestro amigo Paco Nathan, un gran divulgador de Apache Spark de quien aprendimos cómo se puede explicar Apache Spark de manera sencilla.
Expresamos nuestro agradecimiento a los muchos cursos de estudiantes de la Universidad Politécnica de Cataluña-UPC Barcelona Tech, cuyas contribuciones en los seminarios y disertaciones nos han ayudado a aprender más sobre este apasionante mundo del big data y en particular de Apache Spark.
Han sido muchos los compañeros y compañeras que nos han ayudado en este proyecto, contrastando ideas, revisando textos de este libro o compartiendo códigos. Entre ellos recordamos a Gonzalo Pericacho, Ferran Gali, Jordi Nin, Jordi Aranda, Joan Capdevila, Carlos Tripiana, Cesare Cugnasco, Anastasios Gounaris, Albert Calvo, Alessio Conese, Jorge Quimi, Omar Sulca, Dani Mora, Sana Imtiaz, Marc-Oriol Crespí, David Vicente, Diana Moise, Aleix Ruiz de Villa y Ian Bird entre otros. Nuestro gran agradecimiento al Barcelona Supercomputing Center, que ha sido el entorno de trabajo que nos ha permitido realizar investigación sobre Spark y acumular los conocimientos que aquí queremos compartir. Especial mención a nuestros colegas investigadores de la UPC y BSC con quien hemos escrito el primer artículo de investigación con las experiencias de Spark con nuestro supercomputador Marenostrum en Barcelona: Anastasios Gounaris, Carlos Tripiana, Sergi Girona, Eduard Ayguade, Jesús Labarta, Yolanda Becerra, David Carrera y Mateo Valero.
Nos gustaría mostrar también nuestro agradecimiento a todos y cada uno de los más de mil sparkers miembros del Spark Barcelona Meetup por dar vida a esta fantástica iniciativa que en cierta medida es el embrión de esta obra, y en especial a todos los conferenciantes que hasta el momento han participado en uno de los meetups por habernos regalado nuevos y actuales conocimientos sobre esta apasionante tecnología. Y muchas gracias a las entidades que nos apoyan, como son la Facultad de Informática de Barcelona (FIB), el Barcelona Supercomputing Center (BSC), la UPC Barcelona Tech, la aceleradora de proyectos tecnológicos ITNIG, el Col·legi Oficial d’Enginyers Informàtics (COEINF), la Associació d’Antics Alumnes de la FIB (FIBAlumni), el portal de tecnología TECNONEWS, portal iDigital y el Centre d’Excel·lencia en Big Data a Barcelona (Big Data CoE de Barcelona).
Una vez finalizado el libro debemos incluir en los agradecimientos al mejor equipo de editoras que le pueda tocar a unos autores, concretamente el cuarteto de la editorial UOC formado por Roser Leal, Cecília Lacueva, Meritxell Monton y Marta Bernabeu, que entendieron desde el primer momento la importancia de poder publicar este libro lo antes posibles y nos ha permitido que este proyecto vea la luz en un tiempo record y siempre con una sonrisa al otro lado del email.
Y finalmente nuestro agradecimiento a todos los que nos dejamos, que seguro que son muchos, y que han aportado algo valioso al proyecto.

Partners principales del proyecto

Partners de conocimiento en el proyecto

Partners de divulgación

Meetups afínes que han apoyado la divulgación

Contactar con los autores





Fotografías del libro


Presentación del #LibroSpark (Noviembre 2015)

Screen Shot 2015-11-06 at 22.32.02

Screen Shot 2015-11-06 at 23.21.55

IMG_5353

IMG_5382

DSC_1117

A Matei Zaharia prologista del #LibroSpark le encanta el libro

Screen Shot 2015-11-06 at 23.12.33

Presentación del #LibroSpark en el European Spark Summit de Amsterdam


El #LibroSpark en las estanterías de las librerías

IMG_5072


¡El #LibroSpark con el Barça!

IMG_5051

El #LibroSpark con sus lectores (¡envianos tu foto!)





Página diseñada y desarrollada por DesignedInBarcelona.com (basada en el template TemplateGarden) con la ayuda del gran IT developer Bernatixer