El análisis de la información es una necesidad que tienen todas las organizaciones actualmente. Microsoft Fabric cambia las reglas del juego y presenta una única solución simplificada para toda la analítica de datos de una organización. Además, esta se presenta como nuevas experiencias dentro del tan adoptado portal del servicio Power BI.
¿Por qué presento Fabric como una solución que cambia las reglas del juego?
Hay varias características que a mi entender hacen que Fabric pueda marcar un antes y un después en el diseño de plataformas de datos avanzadas. La primera de ellas es su integración en el portal de Power BI. Power BI es hoy en día la herramienta líder para la Analítica e Inteligencia de negocio del mercado, y eso hace que la inclusión de Microsoft Fabric con capacidades adicionales dentro del ecosistema de Power BI facilite la adopción de este en las organizaciones que ya trabajan con Power BI. Además, todas estas capacidades siguen la sencillez del uso de Power BI con opciones de poco código o incluso, con generación de código a través de Copilot.
En segundo lugar, la evolución hacia una solución única. El servicio de Power BI, tal como lo conocemos hoy en día, presenta Power Query y los Data Flows como elementos relevantes para la integración y el tratamiento de datos, además, de la capacidad de creación de conjuntos de datos, que prestan solución para definir la capa semántica de análisis en muchas organizaciones.
Aunque Power BI es una solución muy útil y completa, la realidad es que las organizaciones se encuentran con proyectos de análisis que generalmente se componen de muchos subsistemas diferentes, e incluso de múltiples proveedores. A medida que definimos una plataforma de datos que comienza a integrar varios servicios diferentes, de diferentes proveedores, hace que la complejidad y el coste de la plataforma aumente de forma considerable. Es difícil garantizar puntos comunes entre diferentes formatos de datos, de diferentes proveedores y aplicar un modelo de seguridad común para toda la organización.
De esta complejidad son conscientes las organizaciones y continuamente demandan alguna solución unificada que simplifique las arquitecturas modernas de datos. En diciembre de 2020, Microsoft anuncia en disponibilidad general Azure Synapse Analytics, un nuevo recurso de Azure que integra, en una única área de trabajo, los motores y recursos necesarios para cubrir las necesidades de los proyectos analíticos avanzados. Dispone desde motores de SQL Serverless hasta motores de Apache Spark pasando por Azure Data Warehouse.
Microsoft avanzó con un primer paso hacia la unificación y simplificación de las soluciones para cubrir escenarios de analítica avanzada en Azure. Aunque la experiencia del área de trabajo de Synapse está orientada a diferentes perfiles, como analistas, ingenieros de datos y científicos de datos, no se ha logrado una adopción por parte de los usuarios más analíticos y en muchos proyectos alcanza una buena aceptación por parte de los equipos de ingeniería, pero no así por los analistas y científicos de datos.
Sin embargo, con Fabric se unifica toda la experiencia de analítica de una organización como parte del servicio de Power BI. Incluyendo artefactos y características que permiten de forma unificada realizar proyectos de analítica avanzada con todas las tecnologías comentadas anteriormente: T-SQL, Data Factory, Apache Spark, Lakehouse y Warehouse. Se conocen en Fabric como experiencias.
En tercer lugar, el modelo de licenciamiento también sufre un cambio importante. En las plataformas analíticas como Azure Synapse Analytics, Databricks o Data Factory el coste del recurso está basado en el tiempo de ejecución y nivel de rendimiento. Básicamente desplegamos los recursos y depende del tiempo que tomen las cargas de trabajo en ejecutarse pagaremos más o menos.
Microsoft Fabric presenta un licenciamiento basado en la contratación de una única capacidad que permita la ejecución de todos los motores. Esa capacidad se balancea y hace posible ejecutar cualquier tipo de carga de trabajo pagando un único coste.
Curso de Microsoft Fabric
Características más importantes de Microsoft Fabric
Fabric no solo presenta las ventajas que hemos comentado anteriormente, sino que además mejora las capacidades de las tecnologías de las que parte. Empecemos por el almacenamiento. Microsoft Fabric propone One Lake como la base sobre la que se crean todos los servicios de Fabric. Proporciona una ubicación unificada para almacenar todos los datos de la organización en los que funcionan las experiencias.
Todo el almacenamiento de datos dentro de Microsoft Fabric ocurre en One Lake. Éste elimina los silos de datos actuales al proporcionar un lago de datos como servicio sin necesidad de crearlo. Está suministrado automáticamente a cada inquilino de Fabric sin infraestructura que administrar. Podemos pensar en One Lake como una evolución del Azure Data Lake Gen 2, enfocada en un espacio común para toda la organización.
La experiencia de integración de datos e ingeniería de datos de Fabric incluye Data Factory y Data Flow Gen 2 como herramientas de poco código para facilitar la experiencia de integración y transformación de datos en el One Lake. Además, permite la ejecución y orquestación de procesos de Apache Spark mediante cuadernos totalmente integrados con One Lake. En este apartado cabe destacar que Fabric usa Delta Lake, un formato abierto de almacenamiento en One Lake, por lo que estos datos estarán disponibles para cualquier uso.
Como cualquier otra carga de trabajo dentro de Microsoft Fabric, la experiencia del nuevo Data Warehouse es una oferta SaaS basada en One Lake. Los datos se comparten y son accesibles en todas las cargas de trabajo dentro de Microsoft Fabric. Los usuarios con diferentes habilidades o preferencias pueden operar con la misma copia de datos sin duplicación.
La experiencia de Ciencia de Datos permite crear, implementar y poner en marcha modelos de aprendizaje automático sin problemas en Fabric. Se integra con Azure Machine Learning para proporcionar un registro de modelos y seguimiento de experimentos integrado. Los científicos de datos están capacitados para enriquecer los datos de la organización con predicciones y permiten a los analistas de negocios integrar esas predicciones en sus informes de BI.
En cuanto a la integración con los usuarios de Power BI:
- Podremos democratizar el acceso al One Lake mediante puntos de conexión SQL. De esta forma, se simplifica el análisis de los datos alojados en el One Lake posibilitando a los analistas la exploración y explotación de los datos mediante T-SQL.
- Compartir los datos alojados en One Lake entre diferentes proyectos sin necesidad de duplicar los datos mediante los accesos directos de One Lake. Además, que podremos crear accesos directos con otros orígenes como Azure Data Lake existentes, o Data Lake de AWS.
Para terminar, mencionar Direct Lake, el nuevo modo de conexión para conectar Power BI a conjuntos de datos con origen en One Lake. Se baja en la carga de archivos parquet (en formato Delta Lake) directamente desde One Lake sin necesidad de importar o duplicar estos datos en el conjunto de datos de Power BI. De manera que los cambios en One Lake se reflejan directamente en informes de Power BI. Sólo tenemos que preocuparnos de tener los datos actualizados en One Lake y Direct Lake hará que los informes de Power BI se muestren actualizados.
Conclusión
Espero que esta publicación ayude a conocer un poco las bases de Microsoft Fabric y el porqué de su aparición en el mercado. La sencillez e integración se valoran actualmente de forma positiva en cualquier solución, en busca de reducir los costes no sólo de los recursos sino, en muchos casos, de su gobierno y democratización. Microsoft Fabric es una solución sencilla y completa que permite reducir las plataformas de datos analíticas basadas en múltiples recursos de diferentes proveedores.
Muchas características están por llegar y si quieres estar atento a ellas, síguenos en las redes. 😊