En Fleetondemand, nuestro compromiso con un servicio al cliente de primera clase se basa en una infraestructura tecnológica sólida como una roca. Entre bastidores, nuestro equipo de DevOps se asegura de que nuestra plataforma funcione sin problemas las 24 horas del día, los 7 días de la semana, lo que permite a nuestros equipos de atención al cliente ofrecer un servicio excepcional que nos ha valido una puntuación NPS de fidelidad de clientes de 75 (donde 70+ se considera de primera clase).
Nos reunimos con Stefan Oliwa, nuestro responsable de DevOps, para comprender cómo el trabajo de su equipo en infraestructura, seguridad y automatización repercute directamente en la fiabilidad y la calidad del servicio que nuestros clientes experimentan cada día.
Llevas casi un año desempeñando tu función de responsable de DevOps en FOD. Cuéntanos en qué consiste tu trabajo y en qué proyectos estás trabajando actualmente.
Como ingenieros de infraestructura, somos personas operativas, lo que significa que tenemos que cubrir todas las situaciones. Cuando surge un problema o algo se daña, el principio fundamental de nuestro trabajo (lo que yo siempre llamo el «escenario lluvioso») es: si hay que arreglar algo y volvemos al punto de partida, ¿cómo podemos recuperar automáticamente nuestra infraestructura sin perder tiempo? Las soluciones pragmáticas son fundamentales para la misión.
Necesitamos supervisar las políticas de copia de seguridad y la seguridad desde todos los ángulos. Cuando utilizamos la expresión «infraestructura», nos referimos a todos esos elementos lógicos que funcionan conjuntamente. Supervisamos cómo funciona un componente con los demás. También somos DevOps (operaciones de desarrollo), lo que significa que estamos en medio de todo.
Si haces un diagrama para DevOps, verás dos aspectos clave. En primer lugar, mejoramos continuamente lo que hemos creado: nunca terminamos realmente un trabajo. En segundo lugar, somos un puente entre equipos con objetivos diferentes. Por ejemplo, el equipo de desarrollo siempre quiere nuevas funciones, ese es su objetivo principal.
Para los ingenieros de infraestructura, la estabilidad es lo más importante. Siempre nos centramos en la seguridad y la estabilidad. Además, tenemos partes interesadas que desean planificar nuevas iniciativas, y nosotros nos encontramos en medio gestionando esta información, tratando de crear una solución que satisfaga todos esos requisitos.
Si hay que arreglar algo y volvemos al punto de partida, ¿cómo podemos recuperar automáticamente nuestra infraestructura sin perder tiempo? Las soluciones pragmáticas son fundamentales.
Recientemente fuiste nominado por nuestro valor «Be Disruptive» (Sé disruptivo) en HiBob por tu trabajo en AWS. ¿En qué consistió y cómo transformaste nuestra infraestructura?
Cuando me incorporé a FOD en noviembre del año pasado, vi oportunidades para modernizar nuestra infraestructura y adoptar las mejores prácticas nativas de la nube. Se debatió la posibilidad de migrar a una arquitectura más moderna y, cuando revisé el plan de AWS DevOps, trabajé en estrecha colaboración con Matt Heald y Dan Metcalfe para desarrollar una hoja de ruta clara con métricas específicas y mejores prácticas definidas.
Una de las primeras oportunidades que identifiqué fue implementar una observabilidad integral. Anteriormente, la resolución de problemas requería el acceso manual al servidor y la revisión de archivos, lo que llevaba mucho tiempo. Sabía que podíamos hacerlo mejor. El enfoque adecuado consiste en poder acceder a los paneles de control, navegar rápidamente por los sistemas y comprender lo que está sucediendo en tiempo real.
Construí el primer prototipo para la observabilidad, que ahora utilizamos a diario con nuestros sistemas de monitorización. Durante las Navidades, comencé a dar forma a nuestro plan de migración. En enero, llegamos a la conclusión de que debíamos avanzar con un enfoque específico en lugar de uno ad hoc.
Durante los siguientes dos o tres meses, elaboré un plan de migración exhaustivo, desarrollé nuestra estrategia de continuidad de la base de datos y trabajé en estrecha colaboración con nuestro director de Seguridad de la Información, Dan, para garantizar que todo quedara debidamente documentado y se hiciera correctamente.
Completamos la migración en un impresionante plazo de ocho semanas. Era un objetivo ambicioso, pero lo conseguimos. Para ello, actualizamos cuidadosamente los sistemas heredados y solucionamos las deficiencias de nuestra infraestructura.
A principios del año que viene pasaremos a nuestra arquitectura V2, y la producción de GT Suite se establecerá por completo en esa nueva arquitectura.
El enfoque adecuado consiste en poder acceder a los paneles de control, navegar rápidamente por los sistemas y comprender lo que está sucediendo en tiempo real.
¿Cuál es la ventaja de esta nueva infraestructura para nuestros equipos?
Solo tienes que iniciar sesión en el sistema, donde encontrarás paneles visuales, y podrás explorar tus registros, que se muestran en cuestión de segundos. Recibí comentarios anteriormente en los que alguien decía que esta mejora nos había cambiado mucho para mejor, ya que ahora pueden leer y previsualizar pruebas, realizar experimentos y comprobar errores fácilmente.
Cuando se lo mostré a Dave, del departamento de desarrollo back-end, me dijo que iba a suponer un gran cambio para él y su equipo. Por eso me considero disruptivo. Algo de lo que todo el mundo habla y con lo que solo sueña, yo llegué a la oficina y lo hice tal y como había que hacerlo.
¿Cómo se conecta la funcionalidad de nuestra tecnología desde la perspectiva del cliente? ¿Cómo se conecta el trabajo que usted realiza con el nivel de servicio que reciben nuestros clientes?
Desde la perspectiva del cliente, lo primero es lo primero: si encontramos un problema con la plataforma, podemos solucionarlo en menos de 30 minutos, no en días o semanas. En segundo lugar, si nuestros clientes tienen requisitos de almacenamiento de datos para sus regiones, somos flexibles. Podemos recrear la infraestructura actual en media hora, crear todos los componentes esenciales y tenerlo todo listo en una hora. Eso es muy importante para la flexibilidad de nuestros clientes.
Además, está la resiliencia. Hemos tenido algunas situaciones en las que se necesitaba atención urgente, pero se solucionaron por sí solas. Nuestros contenedores se encuentran en dos centros de datos diferentes que se comunican las 24 horas del día, los 7 días de la semana. Cuando el sistema detectó un problema, trasladamos automáticamente nuestros recursos al otro centro de datos en Londres. Esto ocurrió en segundo plano en todo momento y nuestros clientes no experimentaron ninguna interrupción.
Desde la perspectiva del cliente, lo primero es lo primero: si encontramos un problema con la plataforma, podemos solucionarlo en menos de 30 minutos, no en días o semanas.
¿Podría explicar qué significa la modularidad en relación con nuestra infraestructura? Sé que es un aspecto importante de cómo ha construido las cosas.
Es como construir con bloques de Lego. Cuando describimos la infraestructura ahora, en realidad escribimos comandos. Esto se denomina «infraestructura como código». Todo se basa en variables: la potencia que debe tener la instancia informática, la capacidad de almacenamiento, las direcciones IP que pueden comunicarse entre sí. Ese es el tipo de modularidad al que nos referimos.
También funciona como una plantilla, lo que te permite cambiar una parte de una plantilla o ampliarla por separado de otros componentes. Puedes cambiar algo en un área sin que afecte al resto. Esto hace que nuestra infraestructura sea increíblemente flexible y fácil de mantener.
Los datos de la flota son altamente confidenciales. ¿Cómo garantizamos la seguridad de los datos de nuestros clientes?
Aprendí lecciones importantes sobre seguridad en mi anterior puesto trabajando con un gerente del Servicio Nacional de Salud (NHS). Le pregunté sobre la seguridad de los datos entre los médicos de cabecera y él confirmó lo que siempre había creído: lo único realmente seguro es lo que permanece desconectado y no es accesible a través de Internet.
Eso me hizo reflexionar sobre nuestro enfoque de seguridad. Si necesitas acceder a algo que te permita realizar cambios, eso debería basarse en el principio del mínimo privilegio, con un tiempo limitado concedido a personas específicas.
Esos permisos requieren una autenticación sólida, similar a la autenticación de dos factores que se utiliza al iniciar sesión en el correo electrónico. Hemos dejado atrás la forma anticuada de conectarse a los servidores y, en su lugar, hemos implementado protocolos de autenticación adecuados.
En segundo lugar, confiamos en AWS en materia de seguridad, porque hace grandes cosas y cuenta con la confianza de gigantes tecnológicos, instituciones financieras y las fuerzas armadas, pero, al igual que con todas las soluciones de seguridad, hay que supervisar y evaluar continuamente su rendimiento.
Por lo tanto, ciframos todo lo que almacenamos en AWS. Todos los componentes deben estar cifrados. También creamos el mayor aislamiento posible entre los diferentes sistemas y datos.
Es como construir con bloques de Lego. Cuando describimos la infraestructura ahora, en realidad escribimos comandos. Esto se denomina «infraestructura como código»... Se puede cambiar algo en un área sin que ello afecte al resto. Esto hace que nuestra infraestructura sea increíblemente flexible y fácil de mantener.
¿Tienes algún plan para los próximos 12 meses y proyectos en perspectiva?
Mi principal objetivo en las operaciones de desarrollo (y lo apoyo también en otras empresas) es evitar situaciones en las que un cliente acuda a nosotros y nos diga que algo no funciona. Al garantizar que esto no suceda, estamos logrando uno de nuestros objetivos más importantes como empresa en términos de prestación de un servicio fiable y consistente.
Netflix es mi inspiración en este sentido. Recuerdo que una vez les llamé para informarles de un problema. Respondieron en menos de dos minutos y me dijeron: «Buenas tardes, Stefan, ¿en qué puedo ayudarle?». Quería explicarles mi problema con la televisión, pero ellos me dijeron: «Vemos que tiene un problema con el tiempo de carga». Sabían exactamente cuál era el problema y me recomendaron una solución de inmediato.
Lo que quiero decir es que me encantan las situaciones en las que un cliente llama y podemos decirle: «Sabemos que está experimentando este problema y nuestro ingeniero ya está trabajando en ello». Eso marca una gran diferencia. Mi objetivo es crear herramientas para el servicio de asistencia técnica que les permitan ver el ID del cliente y cualquier error en el punto final, de modo que estén totalmente preparados para saber con qué está luchando alguien y cómo resolverlo.
Incluso estoy explorando la posibilidad de combinar esto con la IA para que nuestro equipo de soporte técnico pueda generar automáticamente correos electrónicos que sean fáciles de entender para personas sin conocimientos técnicos, adaptados a cada persona involucrada.
Lo que quiero decir es que me encantan las situaciones en las que un cliente llama y podemos decirle: «Sabemos queestá experimentando este problema y nuestro ingeniero ya está trabajando en ello». Eso marca una gran diferencia.
¿Ha utilizado mucho la IA en su puesto actual o en puestos anteriores?
La IA está muy de moda ahora, pero yo llevo años trabajando con ella. De hecho, creé un gran modelo lingüístico que mejoraba la calidad de las imágenes. Soy un gran admirador de esta tecnología y, desde que NVIDIA comenzó a impulsar este campo, he comprado aceleradores y ampliado mis conocimientos sobre IA en mi tiempo libre.
Recuerdo que en el instituto, mi profesor de informática me preguntó por qué no asistía a sus clases. Le dije que estaba enseñando un idioma sin futuro. Al final del año, me pidió que llevara algo a clase para demostrar mis conocimientos. La gente pensaba que no iba a aprobar, pero obtuve la máxima puntuación posible. Mi profesor le dijo a la clase: «Si alguien cuestiona la nota de Stefan, yo cuestionaré las notas de todos ustedes», porque sabía que había creado el proyecto adecuado.
Le digo lo mismo a mi hija, que tiene seis años, sobre la informática y los idiomas tradicionales. Voy a enseñarle qué se puede hacer con los grandes modelos lingüísticos y sus aplicaciones. Quiero que aprenda tecnología punta, en lugar de lo que yo considero tecnología antigua que dentro de diez años ya no servirá para nada, si quiere ser especialista en informática.
Construyendo para el futuro
El trabajo de Stefan demuestra cómo la infraestructura moderna y las prácticas de DevOps permiten directamente el excepcional servicio al cliente que define a Fleetondemand. Al crear sistemas resilientes, seguros y automatizados, su equipo garantiza que nuestra plataforma ofrezca la fiabilidad en la que confían nuestros clientes, lo que contribuye directamente a la puntuación NPS de primer nivel que nos enorgullece haber logrado.
Cuando la infraestructura funciona sin problemas en segundo plano, nuestros equipos de atención al cliente pueden centrarse por completo en ofrecer un servicio excepcional. Ese es el poder de contar con la base técnica adecuada.





