{"id":1299,"date":"2017-01-09T17:14:03","date_gmt":"2017-01-09T23:14:03","guid":{"rendered":"http:\/\/websinergia.com.mx\/blog\/?p=1299"},"modified":"2017-01-09T17:18:49","modified_gmt":"2017-01-09T23:18:49","slug":"cuatro-tendencias-de-big-data-y-ai-a-las-que-echarles-un-ojo","status":"publish","type":"post","link":"https:\/\/websinergia.com.mx\/blog\/2017\/01\/09\/cuatro-tendencias-de-big-data-y-ai-a-las-que-echarles-un-ojo\/","title":{"rendered":"Cuatro tendencias de big data y AI a las que echarles un ojo"},"content":{"rendered":"<p style=\"text-align: justify;\"><img loading=\"lazy\" class=\"size-medium wp-image-216 alignleft\" src=\"http:\/\/websinergia.com.mx\/blog\/wp-content\/uploads\/2016\/05\/big-data-300x190.png\" alt=\"big-data\" width=\"300\" height=\"190\" srcset=\"https:\/\/websinergia.com.mx\/blog\/wp-content\/uploads\/2016\/05\/big-data-300x190.png 300w, https:\/\/websinergia.com.mx\/blog\/wp-content\/uploads\/2016\/05\/big-data.png 600w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/>Existen algunas tendencias emergentes de big data y de AI que podr\u00edan afectarle a usted y a su centro de datos\u00a0m\u00e1s pronto que tarde:<\/p>\n<div class=\"clear\" style=\"text-align: justify;\"><b>Donde hay una chispa (Spark)&#8230;<\/b>\u00a0Apache Spark est\u00e1 reemplazando al b\u00e1sico Hadoop MapReduce en los trabajos de big data sensibles a la latencia, con sus consultas en memoria, en tiempo real y el r\u00e1pido aprendizaje autom\u00e1tico a escala. Y con construcciones de datos y lenguajes conocidos y amigables con los analistas, Spark lo pone todo al alcance de todos nosotros, los tipos de hackers regulares.\u00a0En cuanto a la producci\u00f3n a prueba de balas, no est\u00e1 completamente horneada.\u00a0Pero la versi\u00f3n dos de Spark acaba de salir a mediados de 2016, y se est\u00e1 solidificando r\u00e1pidamente. Aun as\u00ed, este ecosistema en r\u00e1pido movimiento y las potenciales &#8220;siguiente gran cosa&#8221;, como Apache Flink, ya est\u00e1n volteando las cabezas.<\/div>\n<p style=\"text-align: justify;\"><!--more--><\/p>\n<p style=\"text-align: justify;\">Hace unos a\u00f1os, todas estas cosas de big data e AI requer\u00edan cient\u00edficos de datos con nivel de doctorado. En respuesta, algunas empresas creativas intentaron hacer cortocircuito a esos raros y caros geeks de matem\u00e1ticas, fuera del bucle anal\u00edtico corporativo est\u00e1ndar, y proporcionar al analista de inteligencia de negocios orientado a hojas de c\u00e1lculo un acceso directo a big data.<\/p>\n<p style=\"text-align: justify;\">Hoy en d\u00eda, como con Spark, el an\u00e1lisis de big data est\u00e1 finalmente al alcance del ingeniero promedio\u00a0o del t\u00e9cnico de programaci\u00f3n. El geek de TI promedio todav\u00eda puede tener que aplicarse con alg\u00fan estudio serio, pero puede lograr un gran \u00e9xito creando valor organizacional masivo. En otras palabras, ahora hay un gran y creciente punto medio en el que los cient\u00edficos inteligentes que no son de datos pueden ser muy productivos con el aprendizaje autom\u00e1tico, incluso en flujos de big data y datos en tiempo real.\u00a0Plataformas como Spark est\u00e1n proporcionando acceso a datos m\u00e1s accesible\u00a0a trav\u00e9s de lenguajes de programaci\u00f3n de nivel superior, como Python y R.<\/p>\n<p style=\"text-align: justify;\">Podemos ver enfoques a\u00fan m\u00e1s f\u00e1ciles emergentes con nuevos productos anal\u00edticos de apuntar y hacer clic, de arrastrar y soltar, de empresas como Dataiku o Cask. Para lograr los objetivos de big data y de AI, todav\u00eda necesita entender los conceptos de extracci\u00f3n, transformaci\u00f3n y carga (ETL), y qu\u00e9 es y qu\u00e9 puede hacer el aprendizaje autom\u00e1tico, pero ciertamente ya no necesita programar \u00e1lgebra lineal paralela de bajo nivel en MapReduce.<\/p>\n<p style=\"text-align: justify;\"><b>La gesti\u00f3n del flujo de datos ahora encabeza la pila de gesti\u00f3n de sistemas de TI.<\/b>\u00a0En un nivel inferior, todos estamos familiarizados con la gesti\u00f3n de almacenamiento de datos en silos, que est\u00e1 abajo en la capa de infraestructura. Pero los nuevos paradigmas est\u00e1n permitiendo que TI administre los datos por s\u00ed misma y datos fluyen como recursos de gesti\u00f3n de sistemas de primera clase, al igual que la red, el almacenamiento, el servidor, la virtualizaci\u00f3n y las aplicaciones.<\/p>\n<p style=\"text-align: justify;\">Por ejemplo,\u00a0los lagos de datos empresariales y los flujos de big data de producci\u00f3n, de extremo a extremo, necesitan un monitoreo de datos profesional, administraci\u00f3n, soluci\u00f3n de problemas, planificaci\u00f3n y arquitectura. Al igual que otras \u00e1reas de gesti\u00f3n de sistemas, los flujos de datos pueden tener sus propios acuerdos de nivel de servicio, objetivos de disponibilidad, objetivos de rendimiento, insuficiencias de capacidad y problemas de seguridad. Y los datos que fluyen tienen procedencia, linaje, veracidad y un mont\u00f3n de metadatos relacionados para seguir de forma din\u00e1mica.<\/p>\n<p style=\"text-align: justify;\">Mucho de esto puede parecer familiar a los expertos de TI de larga data. Pero este es un mundo nuevo, y proporcionar big data y flujos de big data con su propio enfoque de gesti\u00f3n de sistemas tiene un verdadero m\u00e9rito, a medida que los datos crecen m\u00e1s, y m\u00e1s r\u00e1pido.<\/p>\n<p style=\"text-align: justify;\">Recientemente escrib\u00ed acerca de c\u00f3mo el cl\u00e1sico profesional de TI con silos podr\u00eda pensar en crecer su carrera;\u00a0la gesti\u00f3n de big data ser\u00eda una direcci\u00f3n de carrera interesante. Nuevos proveedores, como StreamSets, est\u00e1n abordando esta \u00e1rea de frente, mientras que otros que comenzaron con m\u00e1s ETL y productos de cat\u00e1logo de lago de datos y seguridad est\u00e1n evolucionando en esta direcci\u00f3n.<\/p>\n<p style=\"text-align: justify;\"><b>Ya viene la super escala vertical.<\/b>\u00a0Aquellos de nosotros que tenemos mucho en el mundo de TI sabemos que hay dos megatendencias que circulan de ida y vuelta: centralizar vs. distribuir, y la escala vertical vs. la escala horizontal. Claro, cada nuevo ciclo utiliza tecnolog\u00eda m\u00e1s reciente y aporta un sabor distintivo, pero si retrocede lo suficiente, puede ver una frecuencia c\u00edclica.<\/p>\n<p style=\"text-align: justify;\">Big data ha estado apuntando hacia la escala horizontal sobre hardware comercial por una d\u00e9cada. Ahora, est\u00e1 rebotando un poco hacia la escala vertical. Para ser justos, es realmente una escala vertical dentro de las redes de escala, pero una nueva cosecha de unidades de procesamiento gr\u00e1fico (GPU) est\u00e1 poniendo el foco en nodos m\u00e1s grandes, y no necesariamente b\u00e1sicos. Por ejemplo, Kinetica trabaj\u00f3 con IBM en un sistema personalizado de cuatro Nvidia GPU\/1 TB de RAM para alimentar su base de datos de big data, de consulta r\u00e1pida y \u00e1gil; no se necesita pre-indexaci\u00f3n est\u00e1tica. Y Nvidia recientemente lanz\u00f3 un poderoso dispositivo de 8 GPU DGX-1, dise\u00f1ado especialmente para el aprendizaje profundo.<\/p>\n<p style=\"text-align: justify;\">No tengo ninguna duda de que esta tendencia a\u00fan no ha terminado\u00a0de girar hacia adelante y hacia atr\u00e1s, aunque podr\u00eda dar lugar a una mayor conexi\u00f3n entre big data y AI. Las aplicaciones de la internet de las cosas van a empujar un poco las oportunidades de big data hacia el borde, lo que significa una super escala horizontal por definici\u00f3n. Como siempre, un enfoque pr\u00e1ctico probablemente utilizar\u00e1 tanto escala vertical, como escale horizontal en nuevas combinaciones (\u00bfcu\u00e1ntas personas manten\u00edan mainframes que ahora pueden ejecutar miles de m\u00e1quinas virtuales, cada una capaz de soportar un n\u00famero desconocido de contenedores?).<\/p>\n<p style=\"text-align: justify;\">Eventualmente, todos los datos ser\u00e1n grandes datos, y el aprendizaje autom\u00e1tico \u2013y las capacidades m\u00e1s amplias de AI\u2013 se aplicar\u00e1 en todas partes para optimizar din\u00e1micamente casi todo. Teniendo en cuenta el poder f\u00e1cilmente disponible para cualquier persona a trav\u00e9s de la computaci\u00f3n en nube, la inminente explosi\u00f3n de las fuentes de datos de internet de las cosas y los algoritmos cada vez m\u00e1s accesibles, las posibilidades de big data y la AI se est\u00e1n volviendo reales en nuestras vidas.<\/p>\n<p style=\"text-align: justify;\">El centro de datos de un futuro cercano\u00a0puede ser pronto un anfitri\u00f3n convergente de todos los datos que una organizaci\u00f3n puede reunir, alimentado continuamente por flujos de datos en tiempo real, soportando tanto sistemas transaccionales de registro y sistemas oportunistas de compromiso, y todos impulsados por tanta inteligencia automatizada como sea posible. El n\u00famero de\u00a0<i>startups<\/i>\u00a0de gesti\u00f3n de TI empresarial promocionando el aprendizaje autom\u00e1tico como parte de su propuesta de valor aumenta diariamente.<\/p>\n<hr \/>\n<h6 style=\"text-align: justify;\"><a href=\"http:\/\/searchdatacenter.techtarget.com\/es\/cronica\/Cuatro-tendencias-de-big-data-y-AI-a-las-que-echarles-un-ojo\">Fuente: Sears Data Center En Espa\u00f1ol<\/a><\/h6>\n","protected":false},"excerpt":{"rendered":"<p>Existen algunas tendencias emergentes de big data y de AI que podr\u00edan afectarle a usted y a su centro de datos\u00a0m\u00e1s pronto que tarde: Donde hay una chispa (Spark)&#8230;\u00a0Apache Spark est\u00e1 reemplazando al b\u00e1sico Hadoop MapReduce en los trabajos de big data sensibles a la latencia, con sus consultas en memoria, en tiempo real y [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[16],"tags":[],"_links":{"self":[{"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/posts\/1299"}],"collection":[{"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/comments?post=1299"}],"version-history":[{"count":3,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/posts\/1299\/revisions"}],"predecessor-version":[{"id":1302,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/posts\/1299\/revisions\/1302"}],"wp:attachment":[{"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/media?parent=1299"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/categories?post=1299"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/websinergia.com.mx\/blog\/wp-json\/wp\/v2\/tags?post=1299"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}