{"id":19725,"date":"2024-06-04T20:08:39","date_gmt":"2024-06-04T20:08:39","guid":{"rendered":"https:\/\/gdlfashion.com\/?p=19725"},"modified":"2024-06-04T20:08:39","modified_gmt":"2024-06-04T20:08:39","slug":"domina-el-big-data","status":"publish","type":"post","link":"https:\/\/gdlfashion.com\/?p=19725","title":{"rendered":"Domina el Big Data"},"content":{"rendered":"\n<h3 class=\"wp-block-heading\"><strong>Los 5 mejores libros para principiantes e intermedios<\/strong><\/h3>\n\n\n\n<p>El mundo de la <strong>creaci\u00f3n de datos <\/strong>es alucinante. En 2018, el mundo almacenaba, gestionaba y consum\u00eda 33 zettabytes de ellos (1 ZB equivale a <strong>10<sup>21<\/sup> bytes<\/strong>); y ahora se prev\u00e9 alcanzar un volumen anual de <strong>175 zettabytes para el 2025<\/strong>, lo que supone una generaci\u00f3n de aproximadamente <strong>491 petabytes diarios <\/strong>a nivel internacional (1 PB equivale a <strong>10<sup>15<\/sup> bytes)<\/strong>, de acuerdo con <a href=\"https:\/\/www2.deloitte.com\/cy\/en\/pages\/technology\/articles\/data-grown-big-value.html\">un an\u00e1lisis<\/a> de Deloitte. En el 2024, <a>se<\/a> <a href=\"https:\/\/explodingtopics.com\/blog\/data-generated-per-day\">estima<\/a> que <strong>cada d\u00eda se crean entre 380 y 390 petabytes <\/strong>de datos.<\/p>\n\n\n\n<p>Para entender mejor estos n\u00fameros, debemos partir de un ejemplo que comparte <strong>Daniel Restrepo Hincapi\u00e9, ingeniero s\u00e9nior de Big Data en <\/strong><a href=\"https:\/\/www.softserveinc.com\/en-us\"><strong>SoftServe<\/strong><\/a>, compa\u00f1\u00eda global de tecnolog\u00edas de la informaci\u00f3n (TI) l\u00edder en desarrollo de <em>software <\/em>y consultor\u00eda: \u00ab<em>Si ver una hora de video 4K consume hasta 14 gigabytes de datos, <strong>1 zettabyte ser\u00eda almacenar casi 1,100 millones de videos<\/strong>. Entonces, si alguien empieza a ver videos 4K de una hora sin parar, le llevar\u00e1 casi toda la vida \u00fatil del universo terminarlos<\/em>\u00ab. El espacio digital se expande a un ritmo sin precedentes, desde usos comunes hasta la <strong>generaci\u00f3n masiva de informaci\u00f3n <\/strong>que traer\u00e1 una utilizaci\u00f3n extendida de los <strong>modelos de lenguaje grande <\/strong>(LLM, por sus siglas en ingl\u00e9s) o de la <strong>inteligencia artificial <\/strong>(IA).<\/p>\n\n\n\n<p>Sin embargo, a pesar del volumen de datos creados, <strong>s\u00f3lo se analiza una quinta parte <\/strong>de ellos seg\u00fan <a href=\"https:\/\/www.seagate.com\/files\/www-content\/our-story\/trends\/files\/Seagate-WP-DataAge2025-March-2017.pdf\">un estudio<\/a> de Seagate; lo que significa que <strong>hay un enorme valor que se queda sin tocar<\/strong>. Tal brecha empieza a reducirse con los servicios que constantemente se desarrollan, actualizan y lanzan en la industria; abriendo <strong>enormes oportunidades en el mercado laboral \u00ab<em>techie<\/em>\u00ab<\/strong>. El mercado de Big Data ha <strong>crecido 5.3 veces <\/strong>en los \u00faltimos siete a\u00f1os, alcanzando un valor de <strong>829 mil millones de euros para 2025<\/strong> seg\u00fan la <a href=\"https:\/\/commission.europa.eu\/strategy-and-policy\/priorities-2019-2024\/europe-fit-digital-age\/european-data-strategy_en\">Comisi\u00f3n Europea<\/a>. \u00ab<em>A medida que aumente la demanda, habr\u00e1 una gran necesidad de <strong>especialistas cualificados en Big Data<\/strong>. Si est\u00e1s pensando en hacer carrera dentro de este campo tan din\u00e1mico, <strong>\u00a1la oportunidad es hoy!<\/strong><\/em>\u00ab; subraya el experto.<\/p>\n\n\n\n<p>Para quienes se sientan atra\u00eddos por esta <strong>oportunidad laboral<\/strong>, Daniel Restrepo comparte una lista de <strong>cinco libros que guiar\u00e1n a principiantes e intermedios <\/strong>por los principios fundamentales y las t\u00e9cnicas m\u00e1s vanguardistas de Big Data, con el fin de avanzar en sus conocimientos y <strong>prosperar profesionalmente<\/strong>:<\/p>\n\n\n\n<p><strong>1. Lectura obligada &#8211; <em>Fundamentos de ingenier\u00eda de datos: planificar y construir sistemas de datos robustos<\/em><\/strong><\/p>\n\n\n\n<p>\u00ab<em>Fundamentals of Data Engineering: Plan and Build Robust Data Systems<\/em>\u00bb es m\u00e1s que un libro: es todo <strong>un viaje al coraz\u00f3n de la ingenier\u00eda de datos<\/strong>,dirigido por los expertos Joe Reis y Matt Housley. En \u00e9l, se parte de que el camino hacia la comprensi\u00f3n de los datos siempre comienza con lo b\u00e1sico e implica lidiar con datos sin procesar ni refinar, lo que puede resultar abrumador para los principiantes. Sin embargo, los conocimientos y experiencia de los autores gu\u00edan a los lectores por la vasta informaci\u00f3n; ense\u00f1\u00e1ndoles c\u00f3mo <strong>planificar, dise\u00f1ar y construir sistemas de datos <\/strong>que almacenar\u00e1n ideas y conocimientos valiosos.<\/p>\n\n\n\n<p>A medida que se explora m\u00e1s a fondo el texto, se muestran los <strong>principios fundamentales de una arquitectura de datos eficaz <\/strong>y una visi\u00f3n completa del panorama de la ingenier\u00eda de datos, llegando hasta conceptos clave de nivel medio-alto. <a>No s\u00f3lo cubre aspectos centrales, sino que tambi\u00e9n profundiza en las <strong>tendencias emergentes <\/strong>que se vislumbran en el horizonte, destacando nuevas perspectivas y desaf\u00edos bajo la mirada de los fundamentos de <strong>Azure Data y los servicios en la nube<\/strong>.<\/a><\/p>\n\n\n\n<p><strong>2. Progresando paso a paso &#8211; <em>Ingenier\u00eda de datos con Python<\/em><\/strong><\/p>\n\n\n\n<p>\u00ab<em>Data Engineering with Python<\/em>\u00bb es una gu\u00eda bien elaborada para navegar por lascomplejidades del <strong>dise\u00f1o e implementaci\u00f3n de <em>pipelines <\/em><\/strong>(conjuntos de procesos automatizados que permiten la transferencia de datos de una fuente a un destino espec\u00edfico) y <strong>conectividad <\/strong>de las bases de datos; ense\u00f1ando al lector el arte y la ciencia de <strong>dise\u00f1ar, orquestar y gestionar <\/strong>sofisticados <em>pipelines <\/em>(canalizaciones, tuber\u00edas o cauces) de datos.<\/p>\n\n\n\n<p>Mientras uno avanza la lectura, se introduce en las <strong>t\u00e9cnicas ETL <\/strong>(<em>Extract, Transform, Load<\/em>), fundamentales para la ingenier\u00eda de datos; aportando una habilidad cr\u00edtica para <strong>convertir datos sin procesar <\/strong>en perspectivas significativas. <strong>Python<\/strong>, con su gran cantidad de bibliotecas y herramientas, emerge como el h\u00e9roe del libro que tambi\u00e9n <strong>ofrece implementos para agilizar el flujo<\/strong>. Por otro lado, va m\u00e1s all\u00e1 de la conexi\u00f3n de bases de datos, al explorar <strong>la personalizaci\u00f3n de las canalizaciones<\/strong> y poniendo de relieve la flexibilidad de Python, vali\u00e9ndose de <strong>ejemplos claros. <\/strong>Los cap\u00edtulos finales entregan una buena colecci\u00f3n de conocimientos t\u00e9cnicos y dejan una <strong>fuerte sensaci\u00f3n de empoderamiento<\/strong>.<\/p>\n\n\n\n<p><strong>3. \u00bfTienes dudas? Abre tu perspectiva con <em>The Datapreneurs<\/em><\/strong><\/p>\n\n\n\n<p>\u00ab<em>The Datapreneurs, the promise of AI and the Creators Building Our Future<\/em>\u00bb (Los Datapreneurs, la promesa de la inteligencia artificial y los creadores que construyen nuestro futuro) proyecta el futuro m\u00e1s all\u00e1 de los algoritmos y las m\u00e1quinas, <strong>d\u00e1ndole su lugar a las personas<\/strong> que les dan vida. En este libro, Bob Muglia desentra\u00f1a c\u00f3mo la simbiosis entre <strong>el ingenio humano y los datos digitales <\/strong>es la piedra angular que conduce a <strong>la nueva era de la tecnolog\u00eda <\/strong>que es la inteligencia artificial. Sus cap\u00edtulos ofrecen un viaje por <strong>la evoluci\u00f3n de la IA<\/strong>, obteniendo el lector una comprensi\u00f3n exhaustiva de su nacimiento y la hoja de ruta hacia el futuro.<\/p>\n\n\n\n<p>Este material no hay que leerlo como una perspectiva \u00fanica, sino m\u00e1s bien como <strong>una colecci\u00f3n de voces <\/strong>que incluyen a expertos del sector y l\u00edderes de opini\u00f3n. Mediante conversaciones, presenta una visi\u00f3n profunda de los <strong>beneficios y riesgos potenciales asociados a la inteligencia artificial<\/strong>; que son un reflejo del <strong>poder transformador <\/strong>de las tecnolog\u00edas basadas en datos, poniendo sobre la mesa <strong>cuestiones \u00e9ticas y sociales<\/strong>.<\/p>\n\n\n\n<p><strong>4. Aqu\u00ed est\u00e1 lo bueno &#8211; \u00ab<em>Aprender Spark<\/em>\u00bb (2\u00aa edici\u00f3n)<\/strong><\/p>\n\n\n\n<p>\u00ab<em>Learning Spark<\/em>\u00bb se adentra en el coraz\u00f3n de <strong>la manipulaci\u00f3n de datos <\/strong>y el descubrimiento de conocimientos, a trav\u00e9s de <strong>conceptos esenciales y aplicaciones pr\u00e1cticas<\/strong> que encarna Apache Spark (un <em>framework <\/em>de computaci\u00f3n en cl\u00faster <em>open-source <\/em>desarrollado por la Universidad de California y lanzado en 2014). El viaje comienza con una exploraci\u00f3n de sus cimientos, donde los autores revelan la red interconectada del marco Spark; exponiendo la esencia de los <strong>RDD (<em>Resilient Distributed Datasets<\/em>)<\/strong> y de la resiliencia del <em>framework <\/em>con su <strong>arquitectura distribuida<\/strong>.<\/p>\n\n\n\n<p>El texto despliega tambi\u00e9n <strong>los est\u00e1ndares <\/strong>API DataFrame, Dataset y Spark SQL, la transmisi\u00f3n estructurada y <strong>el \u00abarte alqu\u00edmico\u00bb del aprendizaje autom\u00e1tico <\/strong>con MLlib. Por otro lado, los autores comparten la tradici\u00f3n de <strong>desplegar aplicaciones Spark<\/strong>, una especie de \u00abrito de paso\u00bb para todo profesional del <em>framework<\/em>; aparte del conocimiento para garantizar que cada chispa de datos encienda las llamas de la informaci\u00f3n con la <strong>m\u00e1xima eficiencia<\/strong>. Al respecto, Daniel sugiere a\u00f1adir a la biblioteca el libro <strong>\u00ab<em>Spark Cookbook<\/em>\u00bb de O&#8217;Reilly<\/strong>, para descubrir <strong>atajos potentes, t\u00e9cnicas y pr\u00e1cticas<\/strong> que le har\u00e1n la vida m\u00e1s f\u00e1cil a los interesados.<\/p>\n\n\n\n<p><strong>5. Explorando la caja de Pandora &#8211; <em>Dise\u00f1o de aplicaciones intensivas en datos<\/em><\/strong><em><\/em><\/p>\n\n\n\n<p>\u00ab<em>Designing Data-Intensive Applications<\/em>\u00bb est\u00e1 hecho para navegar por los <strong>complejos sistemas <\/strong>de grandes vol\u00famenes de datos, mediante <strong>ejemplos del mundo real y estudios de casos<\/strong>. Sirve como una gu\u00eda para identificar y analizar los componentes b\u00e1sicos en la construcci\u00f3n de <strong>sistemas de datos a gran escala<\/strong>, concebidos para dar soporte a los mercados mundiales; y profundiza en tres principios clave que cimentan tales sistemas: <strong>fiabilidad, escalabilidad y mantenibilidad<\/strong>.<\/p>\n\n\n\n<p>El libro teje <strong>puentes entre la teor\u00eda y la pr\u00e1ctica<\/strong>. Mediante <strong>aplicaciones reales<\/strong>, los lectores son testigos de la acci\u00f3n de los <strong>principios del dise\u00f1o de datos<\/strong>. Adem\u00e1s, proporciona una <strong>comprensi\u00f3n profunda <\/strong>de los sistemas a un nivel t\u00e9cnico m\u00e1s alto. <a>Sus casos pr\u00e1cticos no s\u00f3lo muestran el camino para crear <strong>sistemas fiables, escalables y mantenibles<\/strong> de datos; sino que tambi\u00e9n ofrecen inspiraci\u00f3n y conocimientos para lograr obras maestras de ingenier\u00eda.<\/a> Es como embarcarse en un gran viaje por la <strong>comprensi\u00f3n del Big Data<\/strong>.<\/p>\n\n\n\n<p><strong>\u00bfPor qu\u00e9 consultar estos libros?<\/strong><\/p>\n\n\n\n<p>Daniel Restrepo comenta que estos cinco textos se volvieron <strong>gu\u00edas invaluables para su desarrollo como experto en Big Data<\/strong>, bajo la premisa de que \u00ab<strong>la pr\u00e1ctica hace al maestro<\/strong>\u00ab. \u00ab<em>Si te interesa dedicarte al campo del Big Data, estos libros que me ayudaron mucho en mi carrera inicial pueden servirte como <strong>punto de partida<\/strong>. No estoy diciendo que se convertir\u00e1n en la f\u00f3rmula m\u00e1gica para cualquiera que quiera seguir la misma ruta profesional, pero podr\u00edan darle <strong>un buen comienzo <\/strong>en el mundo de los datos. Recuerda que t\u00fa eres el due\u00f1o de tu propio ritmo y direcci\u00f3n<\/em>\u00ab; concluye el <strong>ingeniero s\u00e9nior de Big Data en SoftServe<\/strong>.<\/p>\n\n\n\n<p><strong>Acerca de SoftServe<\/strong><\/p>\n\n\n\n<p><a href=\"https:\/\/www.softserveinc.com\/en-us\">SoftServe<\/a> es una autoridad digital que asesora y proporciona servicios tecnol\u00f3gicos de vanguardia. Como la mayor empresa global de TI con ra\u00edces ucranianas, ofrece soluciones de desarrollo de software y consultor\u00eda. Con m\u00e1s de 11,000 empleados en 50 centros, oficinas y ubicaciones de clientes en todo el mundo, SoftServe es una de las mayores compa\u00f1\u00edas de desarrollo de software de Europa Central y Oriental. Sus sedes centrales se encuentran en Lviv (Ucrania) y Austin (Texas, EE.UU.). Cuenta con centros de desarrollo en Ucrania, Polonia y Bulgaria, y en 2022 comenz\u00f3 a operar en Ruman\u00eda, M\u00e9xico, Chile y Colombia.<\/p>\n\n\n\n<p>Para mayor informaci\u00f3n, visita <a href=\"https:\/\/www.softserveinc.com\/\">www.softserveinc.com<\/a>.<\/p>\n\n\n\n<p>O s\u00edguenos en:<\/p>\n\n\n\n<p>Facebook: <a href=\"https:\/\/www.facebook.com\/SoftServeInc\">@SoftServeInc<\/a><\/p>\n\n\n\n<p>Twitter: <a href=\"https:\/\/twitter.com\/SoftServeInc\">@SoftServeInc<\/a><\/p>\n\n\n\n<p>LinkedIn: <a href=\"https:\/\/www.linkedin.com\/company\/softserve\/\">@softserve<\/a><br>Blog: <a href=\"https:\/\/www.softserveinc.com\/en-us\/blog\">www.softserveinc.com\/en-us\/blog<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los 5 mejores libros para principiantes e intermedios El mundo de la creaci\u00f3n de datos es alucinante. En 2018, el&hellip;<\/p>\n","protected":false},"author":2,"featured_media":19726,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[419,3],"tags":[],"_links":{"self":[{"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/posts\/19725"}],"collection":[{"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=19725"}],"version-history":[{"count":1,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/posts\/19725\/revisions"}],"predecessor-version":[{"id":19727,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/posts\/19725\/revisions\/19727"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=\/wp\/v2\/media\/19726"}],"wp:attachment":[{"href":"https:\/\/gdlfashion.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=19725"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=19725"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gdlfashion.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=19725"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}