Diccionario de datos: cómo y mejores prácticas

Un diccionario de datos es una lista de términos y métricas clave con definiciones, un glosario empresarial. Si bien parece simple, casi trivial, su capacidad para alinear el negocio y eliminar la confusión puede ser profunda. De hecho, un diccionario de datos es posiblemente uno de los artefactos más valiosos que un equipo de datos puede entregar a la empresa.

La mayoría de las empresas tienen al menos un concepto, término o métrica que se usa o interpreta de manera diferente entre los equipos. Cuando esto sucede, reina la confusión. Los tomadores de decisiones pueden estar en desacuerdo sobre lo que muestran los datos y qué acciones tomar. Los informes entre los equipos pueden mostrar diferentes números para la misma métrica del mismo origen de datos debido a una lógica empresarial inconsistente. Los equipos pueden incluso discutir sobre la definición correcta y defender su territorio, tal vez porque su definición hace que sus números se vean mejor. Esto no es bueno para los negocios.

Una vez que tenga un diccionario de datos, es un documento al que todo el personal puede hacer referencia y estar en la misma página, facilita la incorporación de personal nuevo y el equipo de inteligencia empresarial (BI) tiene requisitos claros para la implementación de esas métricas.

Para ser claros, aquí, no estamos considerando la documentación de la tabla de la base de datos en bruto, aunque eso también es importante, sino una lista de nivel superior de términos y métricas comerciales. ¿Cómo piensa la empresa en su conjunto de "usuario", "ingresos" o "costo de adquisición"? ¿Todos tienen el mismo entendimiento o "territorio de ventas", "tiempo promedio de envío" o "sesión"? El objetivo debe ser que un miembro del personal junior y no técnico, como un agente de servicio al cliente, pueda leer la sección correspondiente a su parte del negocio y comprender los términos relevantes, pero lo suficientemente detallados y precisos para capturar la lógica comercial. de esas métricas.

En esta publicación, detallaré algunas de las mejores prácticas relacionadas con los diccionarios de datos y un proceso de cómo crear uno. Este no es el único proceso que funcionará, pero al menos me ha funcionado. Aquí, supongo que el equipo de BI está impulsando este proceso. En mi opinión, deberían poseer el diccionario de datos y la implementación de métricas en las herramientas de BI.

1. Recoger términos

El primer paso es compilar una lista de términos. Es decir, el equipo de BI debe crear una hoja de cálculo con una lista de los nombres de los conceptos comerciales y las métricas (medidas) y cómo se cortan y cortan los datos (las dimensiones). Si bien esto suena desalentador, un enfoque es ir equipo por equipo de negocios y examinar una muestra de todos sus informes y paneles estándar. Enumere todas las etiquetas de eje de los gráficos, los encabezados de columna de las tablas de informes y las dimensiones de cómo se pivotan los datos. Por lo tanto, un informe que muestra los ingresos por territorio (durante un período de tiempo) arroja dos términos clave: "ingresos" y "territorio". En esta etapa, solo está compilando una lista de nombres de términos, no sus definiciones.

El resultado es una lista del nombre del equipo, el nombre del término, el tipo de datos, un valor de ejemplo o dos, y quizás un enlace a un informe de ejemplo usando ese término. Las columnas adicionales que pueden ser útiles para agregar son una columna que indica si se trata de una dimensión o una medida (generalmente hay más acuerdo sobre las dimensiones que las medidas), y una columna que especifica la fuente de la verdad.

Paso 1: una lista de términos sin definiciones

Organice y agrupe la lista por función comercial, como métricas financieras, métricas de marketing, métricas de servicio al cliente, etc. También puede desglosar dimensiones realmente genéricas ("año", "id_producto", "país", etc.) que abarcan muchos equipos a su propia sección también.

La lista probablemente no sea tan larga como cabría esperar. Esto se debe a que los equipos tienden a tener un conjunto relativamente pequeño de métricas que intentan rastrear y optimizar con un conjunto relativamente pequeño de palancas a su disposición; por ejemplo, el marketing en línea podría centrarse en algunas facetas clave, como la campaña, el canal, gastar y segmentar.

Pídale al equipo de negocios que revise la lista, especialmente su sección y agregue los términos que faltan. Si tienen un conjunto robusto de paneles e informes, probablemente tenga una lista completa. Si no lo hacen, esto proporciona conceptos adicionales que son valiosos para recopilar.

2. Definir términos

El equipo de BI ahora debe hacer un primer paso al tratar de cotejar o crear definiciones.

Primero, extraiga las definiciones de cualquier documentación existente. Esto podría ser de un wiki, informes anuales o de código real, como consultas SQL o macros de Excel. Las definiciones deben ser claras y sin ambigüedades. Si es más claro mostrar una fórmula simple (como ARPU = total_revenue / number_subscribers) en lugar de escribir una definición, muéstrela. La mayoría del personal debería ser capaz de comprender la definición, incluso si necesitan hacer una referencia cruzada de algunos de los términos.

En segundo lugar, siéntese con los equipos, uno por uno, y solicite su ayuda para establecer las definiciones que faltan o para refinar las definiciones. (Avanzará mejor comenzando con una definición, incluso si es incorrecta, que con una celda en blanco). Esto puede requerir un poco de ida y vuelta hasta llegar a un acuerdo dentro de ese equipo. También puede requerir alguna investigación sobre cómo se calcula actualmente una métrica.

Es importante destacar que no pregunte "¿cuál es la definición actual?", Sino "¿cómo debería definirse esto?" Si la implementación actual no es su definición ideal, esta es la oportunidad perfecta para que el equipo de negocios establezca su estado ideal. Por ejemplo, esta es una oportunidad para simplificar si ha heredado una definición demasiado compleja. Una vez que se capta esa definición ideal, existe una presión adicional sobre el equipo de datos, el equipo técnico u otras partes del negocio para que cumplan con esa métrica como se define.

3. Identificar conflictos

Este es un paso clave: eliminar los términos donde su definición difiere entre los equipos.

4. Obtener alineación

Para aquellos términos que difieren entre los equipos, traiga a los equipos relevantes a la misma sala (y cierre la puerta). Haga que discutan cómo y por qué difieren.

Para esta reunión, debe haber acuerdo con solo 2 resultados:

* un equipo acuerda adoptar la definición del otro equipo.

* tienen razones legítimas por las que difieren. En este caso, acuerde un nuevo nombre para uno o ambos términos.

(Una tercera opción donde ambos equipos acuerdan modificar su definición a una definición común es posible pero menos probable).

Los nombres deben ser tan largos como sea necesario para evitar ambigüedad o confusión. Si "community_adjusted_editba" es un término más apropiado y apropiado que lo distingue del "ebitda" regular, entonces use ese término más largo y más descriptivo. El objetivo es eliminar la confusión para no ser conciso.

5. Consigue cerrar sesión

Haga que los jefes de equipo firmen. Esto es crucial No desea que el equipo de BI defina un término y que el equipo comercial discrepe en secreto. En ese caso, la empresa simplemente implementará su propia lógica en Excel y volverá al punto de partida. Como expertos en dominios y como personas que tomarán decisiones comerciales basadas en esas métricas, los propietarios de negocios deben estar totalmente de acuerdo.

En Warby Parker, aprovechamos la ayuda de los codirectores ejecutivos para exigir que los jefes de equipo firmen y lo hagan en una fecha determinada. Los jefes de equipo están ocupados y un diccionario de datos puede no parecer de máxima prioridad, incluso si pueden ver el valor. Por lo tanto, este apoyo de arriba hacia abajo resultó ser muy valioso.

6. Publicar

Publique el diccionario de datos como un documento de una sola página donde sea accesible para toda la empresa, por lo tanto, no solo en una herramienta de BI. Estas definiciones deben ser ampliamente entendidas y adoptadas, no solo por ejecutivos, analistas y tomadores de decisiones, sino por todo el personal. Por lo tanto, la visibilidad es crucial. Si la compañía usa mucho un wiki, publica allí. Debería ser donde la gente espera.

Conceptualmente, estos términos son independientes de cualquier sistema único o fuente de datos y, por lo tanto, no están vinculados a una herramienta de BI. Sin embargo, las definiciones individuales también deben integrarse en las herramientas de BI siempre que sea posible. Si la herramienta admite esto, cuando pasa el mouse sobre una dimensión o medida, la definición y el ejemplo deberían aparecer.

Dado que estas definiciones pueden aparecer en varios lugares, el equipo de datos debe esforzarse por generar automáticamente el diccionario de datos a partir de una sola fuente, como una tabla de base de datos o un repositorio de código, en lugar de mantener manualmente una tabla estática. Por ejemplo, en Warby Parker, nuestro diccionario de datos se generó a partir de un trabajo de Jenkins. Si se modificó el repositorio, se volvió a generar nuestra documentación (un sitio web interno dedicado o "libro de datos" para toda la documentación de datos).

7. Mantener

Si bien las métricas clave deberían ser relativamente estables, puede haber razones comerciales legítimas por las que la definición de una métrica podría cambiar. Ese cambio y una nueva definición deberían provenir del equipo de negocios. Sin embargo, requerirá la ayuda del equipo de datos para implementar el cambio y comunicarlo.

El equipo de BI debe evaluar el impacto del cambio antes de que se implemente. Por ejemplo, prepare un gráfico que muestre la métrica con la definición antigua y la nueva de la métrica para establecer expectativas de cómo podrían cambiar los números.

Trate ese cambio de definición como un lanzamiento de producto: comunique el cambio de definición por adelantado, informe a las personas qué esperar y documente el cambio en el diccionario de datos, como con un registro de cambios en la parte inferior del documento.

No permita que diferentes sistemas se desincronicen; por lo tanto, por qué la generación automática de documentación es valiosa.

Crear un diccionario de datos siguiendo el proceso anterior no es un esfuerzo pequeño. Probablemente tomará algunos meses, ya que requiere conversaciones y coordinación entre muchos miembros del personal. Es un gran esfuerzo de equipo, impulsado y coordinado por el equipo de BI, pero que requiere una amplia aceptación, cooperación y esfuerzo, y una pizca de refuerzo de arriba hacia abajo.

No sugiero tomar el proceso por partes. Por ejemplo, no cree un diccionario de datos de marketing completamente horneado con la expectativa de llegar a financiar el diccionario de datos en una fecha posterior. Esto hace que sea más difícil llegar a esas discusiones de alineación (paso 4) entre los equipos, y ahí es donde ocurre la verdadera recompensa. Además, la naturaleza secuencial hace que sea más fácil perder vapor. Necesita las discusiones concurrentes entre los equipos con una fecha de cierre común para lograr el objetivo.