Present and importance of the implementation of Big Data using the Hadoop and Spark tools

Authors

DOI:

https://doi.org/10.21501/21454086.2403

Keywords:

Big Data, Open Data, Volume, Variety, Speed, Hadoop, Spark, Map Reduce, HDFS, Data Mining

Abstract

In the present article, a review was made on the relevance and importance of Big Data through the Hadoop and Spark tools. First the Big Data concept is contextualized from different authors and making reference to its importance in the different organizations, having as a premise, the three V  that must be present when implementing Big Data (Volume, Variety and Speed).

Then, the Hadoop and Spark tools are analyzed, identifying their capacity to make more efficient the processing of large volumes of data, of different types of data and at a high speed, solving the problems that arose before when many data were going to be worked on.

Finally, a reflection is made on the importance of Big Data in the decision-making of an organization, taking into account that decision-making allows an organization to be competitive and to last over time.

Downloads

Download data is not yet available.

Author Biography

Lina María Montoya-Suárez, Universidad Católica Luis Amigó

Ingeniera de Sistemas, MSc (C) Ingeniería

References

V. M. Schönberger and K. Cukier, Big data: la revolución de los datos masivos. Turner, 2013.

J. Serrano-Cobos, “Big data y analítica web. Estudiar las corrientes y pescar en un océano de datos,” El Prof. la Inf., vol. 23, no. 6, pp. 561–565, 2014.

L. J. Aguilar, Big Data, Análisis de grandes volúmenes de datos en organizaciones. Alfaomega Grupo Editor, 2016.

J. G. Cantero, “Nuevas estrategias de gestión de la información,” Big Data, vol. 95, p. 51, 2013.

A. Ferrer-Sapena and E. Sánchez-Pérez, “Open data, big data:?` hacia dónde nos dirigimos?,” Anu. ThinkEPI 2013, vol. 7, pp. 150–156, 2013.

A. López Borrull and A. Canals, “La colaboración científica en el marco de nuevas propuestas científicas: Open Science, e-Science y Big Data,” La Colab. científica una aproximación Multidiscip. Val. Nau Llibres, pp. 91–100, 2013.

M. A. Murazzo, N. R. Rodriguez, M. J. Guevara, and F. G. Tinetti, “Identificación de algoritmos de cómputo Intensivo para big data y su implementación en clouds,” in XVIII Workshop de Investigadores en Ciencias de la Computación (WICC 2016, Entre Ríos, Argentina), 2016.

M. Coto-Jiménez, “Minería de datos: concepto y aplicaciones,” Una ojeada a Clasif. del suelo Globos Cantolla II vuelo Vert. Arduino uno para prototipado rápido Gener. números aleatorios El bosón Higgs, la partícula divina, p. 60, 2014.

A. C. C. Herráez, “Big data con Hadoop-I,” 2015.

B. Sarmiento, M. Hernández, and X. Gómez, “Herramientas y antecedentes Big Data,” Rev. Investig. y Desarro. en TIC, vol. 5, no. 2, 2017.

A. Hernández Dominguez and A. Hernández Yeja, “Acerca de la aplicación de MapReduce+ Hadoop en el tratamiento de Big Data,” Rev. Cuba. Ciencias Informáticas, vol. 9, no. 3, pp. 49–62, 2015.

L. F. Vásquez Rugel, L. A. Caviedes Ruiz, and others, “Sistema de archivos por capas en Hadoop HDFS,” Espol, 2017.

J. L. Larroque, “Indexado de Wikipedia a través de una arquitectura Map Reduce,” Facultad de Informática, 2017.

A. Fenna Víchez, “Captura y gestión de open data en entornos de smart city,” 2017.

M. Niño and A. Illarramendi, “ENTENDIENDO EL BIG DATA: ANTECEDENTES, ORIGEN Y DESARROLLO POSTERIOR,” DYNA New Technol., vol. 2, no. 1, pp. 1–8, 2015.

S. A. Valenzuela, C. L. Vidal, J. D. Morales, and L. P. López, “Ejemplos de Aplicabilidad de Giraph y Hadoop para el Procesamiento de Grandes Grafos,” Inf. tecnológica, vol. 27, no. 5, pp. 171–180, 2016.

K. Esser, W. Hillebrand, D. Messner, J. Meyer-Stamer, and others, “Competitividad sistémica: nuevo desafío para las empresas y la política,” Rev. la CEPAL, vol. 59, no. 8, pp. 39–52, 1996.

D. Cohen Karen, E. Asin Lares, D. G. Lankenau Caballero, and D. Alanis Davila, “Sistemas de informacion para los negocios: Un enfoque para la toma de decisiones.,” 2005.

G. Ponjuán Dante, “Gestión de información en las organizaciones: principios, conceptos y aplicaciones,” 1998.

H. Orallo, J. RAMIREZ, C. R. QUINTANA, M. Josej. H. Orallo, M. J. R. Quintana, and C. F. Ramírez, Introducción a la Minería de Datos. Pearson Prentice Hall, 2004.

A. Blázquez Manzano, “La información y comunicación, claves para la gestión del conocimiento empresarial,” 2013.

Published

2018-12-30

How to Cite

Montoya-Suárez, L. M., & Gil-Restrepo, G. A. (2018). Present and importance of the implementation of Big Data using the Hadoop and Spark tools. Lámpsakos, 1(19), 67–72. https://doi.org/10.21501/21454086.2403

Issue

Section

Case report and/or divulgation articles not derivaded of a research