Programa de ordenador "RCDWeb-Remote Cluster Deployer"

Descripción

Investigadores del Área de Lenguajes y Sistemas Informáticos de la Universidad Pablo de Olavide han creado un software que desarrolla un sistema de información que, usando una interfaz amigable, permite desplegar y gestionar de forma personalizada, varios clusters bajo el fragmento Spark.

Además, RCDWeb permite el despliegue a su vez del sistema de archivos distribuidos HDFS (Hadoop Distributed File System) para el almacenamiento distribuido de datos así como lanzar algoritmos de un repositorio centralizado y propio desde un proyecto empaquetado (diseñados en lenguaje Java, Python, R o Scala). Estas ejecuciones son almacenadas en un historial de ejecuciones de forma remota y transparente al usuario. 

Necesidad o problema que resuelve

HDFS

Con el uso de las nuevas tecnologías por parte de usuarios y empresas, se genera al día una cantidad descomunal de datos de diferentes tipos que tienen que ser procesados y almacenados con el fin de obtener información útil. Esta tarea no es sencilla y cada vez se requieren máquinas más potentes que sean capaces de procesar y almacenar dichos datos. En vez de renovar toda la infraestructura necesaria, se comenzaron a desarrollar sistemas que permitieran realizar ejecuciones de forma paralela, dividiendo el trabajo entre los distintos nodos que forman el núcleo de trabajo, dando lugar a lo que se conoce como cluster de máquinas.

Con el avance de la tecnología, se han ido perfeccionando las técnicas de paralización y los frameworks usados para este fin, hasta la llegada de Apache Spark, el framework más popular relativo al Big Data. Lo que hace destacar a Apache Spark es su manejo con los datos directamente desde memoria, evitando así el proceso de leer y escribir en disco duro cada poco tiempo, haciéndolo mucho más rápido y eficiente.

Debido a que el despliegue de un cluster resulta una tarea pesada, el presente software desarrolla un sistema de información que usando una interfaz gráfica amigable, permite, de forma personalizada desplegar y gestionar varios cluster bajo el framework Spark. Además, permite el despliegue a su vez del sistema de archivos distribuidos HDFS (Hadoop Distributed File System) para el almacenamiento distribuido de datos así como lanzar algoritmos de un repositorio centralizado y propio desde un proyecto empaquetado (diseñados en lenguaje Java, Python, R o  Scala). 

 

Aspectos Innovadores/Ventajas competitivas

  • Las ejecuciones del software son almacenadas en un historial de ejecuciones, todo ello de forma remota y transparente. Para proteger los datos sensibles del usuario, se ha implantado el protocolo criptográfico TLS (usando certificados SSL) para securizar las comunicaciones en la red.
  • Para que el sistema funcione de forma correcta el servidor donde esté alojado puede ser cualquier distribución basada en Ubuntu, siempre que cuente con el servidor de aplicaciones Tomcat, el servidor de MongoDB y Ansible instalado. Y el único requisito por parte del usuario es contar con una distribución Linux basada en Ubuntu en sus máquinas y tener instalado el servidor openssh para permitir el intercambio y acceso de forma remota.

Tipos de empresas interesadas

El presente software es de interés para toda empresa, de cualquier sector, que usa Big Data como herramienta tecnológica para la mejora de la toma de decisiones y destacar en la competencia.

Nivel de desarrollo

Software protegido mediante Derecho de Propiedad Intelectual, disponible para su explotación bajo licencia. ©2018 Universidad Pablo de Olavide.

Área tecnológica

Tecnologías de la información y de la Comunicación (Tic)

Equipo de investigación

DATA SCIENCE & BIG DATA LAB (TIC 254)  > Más ofertas de este grupo

  • Autores: Alicia Troncoso Lora, Francisco Martínez Álvarez y José Francisco Torres Maldonado.
  • Titular: ©2018 Universidad Pablo de Olavide.

Contactar con la OTRI a través de nuestro formulario de contacto



Facebook   Twitter


 NUBE DE TAGS

Accede a la oferta tecnológica de interés para tu empresa desde esta nube de tags.

: Bioinformática Acuicultura aditivos Aeroespacial Agregación Agricultura Agua aguas residuales Alimentación alimentos funcionales almazaras análisis biomecánico anti-inflamatorios antienvejecimiento antiinflamatorio antioxidantes Apoptosis aprendizaje Aprendizaje-Servicio ApS Aromas Arqueología asesoramiento Bebidas Big Data BIO-MS bioadsorción Biocarbon biocidas biodiesel Biodiversidad Bioenergética Bioinformática biomasa algal Biomedicina Biopilas Bioquímica Biotecnología Biotecnología Bioinformática bombas de destoxificación bombas destoxificación C.elegans Cáncer cardiovascular Celdas biocombustibles Celiaquía Células madre celulosa ciudadanía CO2 Coeducación Coenzima Q colecciones biológicas comercio electrónico competencias plurilingües y pluriculturales Composición corporal Compostaje compromiso social compuestos bioactivos Comunicación internacional Comunidad Conservación Construcción Cooperación territorial Cosmética Cultura demográfia densiometría Deporte Derecho desastres naturales Diabetes Dietética Dispositivo de salto Drosophila Ecosistémica Edafología Educación Electricidad emergencias Emociones Emprendimiento Empresas de Base Tecnológica Energía Energías renovables enfermedad cardiovascular enfermedad gaucher enfermedad hígado graso no alcohólica (EHGNA) Enfermedades lisosomales Enfermedades mitocondriales Enfermedades neurodegenerativas Enfermedades raras EnGNet enseñanza activa entorno urbano Entrenamiento deportivo envejecimiento enzimas Escrutineo de Alto Rendimiento especímenes Herbario Estrés Estrés hídrico Estudios Sociales explotación FE-SEM Fenotipaje Fibromialgia Fibrosis hepática Fisiología Formación fotobiorreactores Ganaderia Gestión franquicias Gestión información hábitos de vida Hidrógeno Hidroponía hueso aceituna Idiomas igualdad de género Impacto Cruzado Impacto social Indicadores inflasomas Infraestructuras inmovilización de enzimas inmunotolerancia Inteligencia Artificial Internacionalización investigación social Itinerario jueces gimnasia acrobática Jurídicos lactosa Lenguas Local macroalgas Maldi-Tof Maquinaria uso industrial material didáctico Materiales Medicina de precisión medicina regenerativa medioambientales Metagenoteca métodos activos Métodos Alternativos microalgas microbiota intestinal microscopía Microscopio Minería de Datos Miniería de Datos Miopatías congénitas modelización modelo formativo MOFs NACH nanopartículas Nanotecnología naturales Neurociencia Neurociencias Neurogestión neuroimagen Neuromanagement Nuevas Tecnologías Nuevos Fármacos Nutrición obesidad infantil ocio Optimización Parkinson Participación Patentes patrimonio Pedagogía perfumes Personalidad Resistente pesticidas plaguicidas plataforma Proteómica Proteosoma Química Químicas Raman reactores enzimáticos Recursos Marinos Recursos naturales Rendimiento deportivo residuos resonancia magnética riesgo tóxico Robótica Root Simulators RSC RSE Running Ruralidad SACROAJIR® SACRODRAW® Salud Salud Pública SCT Seguridad Sensor FBRM Series temporales Sexado Aves Simulación Simulación Molecular Síndrome MELAS smart cities Social Media socialización socioeconómicos Sociología Soft Computing Software spin-off Suero lácteo Tecnologías Tercer sector terremotos Tic toxicología Traducción Transporte trata laboral turismo vertidos Videojuegos Zeolitas

Contacto


Si tienes cualquier duda o consulta ponte en contacto con nosotros


Contacto

Otri 2.o


Te invitamos a conocer y participar en las diferentes herramientas basadas en la web social donde se encuentra la OTRI

Leer más ...


Contacto